我有一个带有工作表的工作簿,名为工作表#1。我想从工作表#1中复制一些列,并稍微更改列订单。首先,我创建了一个名为sheet #2的新工作表,我可以从工作表#1复制和粘贴到工作表#2,但是我发现openpyxl复制公式完全相同,所以我有一个问题。例如,工作表#1中的列O有如下公式:
O3=(M3*1)+(N3*1)
我将工作表#1中的M列移动到第2页中的H列,将工作表#1中的列N移动到第2页中的第一列。当我将工作表#1中的O列移动到第2页的M列时,我会遇到问题。首先,第二页公式中的M栏仍然是:
M3=(M3*1)+(N3*1)
我有一个循环参考问题,因为我试图用自己来计算自己。其次,如果我将工作表#1中的列O移到第2页中的J列,我没有这个循环引用问题,但我的公式仍然很混乱。
我使用以下方式复制和粘贴:
for i in range(0, 1000):
sheet_#2.cell(row=i,column=12).value = sheet_#1.cell(row=i,column=14).value当我调用data_only时,我已经尝试过使用true和false,如下所示。
my_workbook = openpyxl.load_workbook(args.input_file, data_only=False)对我来说都不管用。True在表#1和工作表#2中都给出了所有的零,False得到了上面描述的循环引用问题。
有没有办法使用openpyxl包来解决我的问题?我认为,只要在复制和粘贴时,如果可以添加工作表名称来指定公式中的单元格,我的问题就解决了,如下所示:
M3=("Sheet #1"M3*1)+("Sheet #1"N3*1)
如果openpyxl不做这个工作,是否有更好的包来解决这个问题?pandas
发布于 2019-10-12 19:49:57
我会先说我不是专家,但我会试一试。
从你的问题的声音看来,你可能不熟悉潘达斯。我会用熊猫来解决这个问题。也做一些额外的阅读潘达,它是如此强大!特别是对于excel自动化。
import pandas as pd
# Read the excel sheets to Pandas DataFrames
DataFrame1 = pd.read_excel("FileName.xlsx", sheetname='sheet_number_1')
DataFrame2 = pd.read_excel("FileName.xlsx", sheetname='sheet_number_2')您应该阅读您的工作表#2 DataFrame,并首先从您的sheet#1 DataFrame中带出不有公式的列。
#You can set columns equal to each other like this.
sheet2df['sheet_2_column_name'] = sheet1df['sheet_1_column_name']这将从您选择的任何工作表1列到您选择的任何工作表2列的所有数据。
现在对于列和公式..。您提到的公式(M3*1)+(N3*1)现在将成为您的sheet#2中的(H3*1)+(I3*1)。
#apply formula down each row in a column
DataFrame2['column_name_to_insert_formula_to'] = DataFrame2.apply(lambda row: '(H{}*1)+(I{}*1)'.format(row.name + 2), axis=1)在这种情况下,可以将{}保留为空白。这个公式将迭代{}括号中的行号。您实际上是将.format(row.name +2) (在本例中是作为参数的行号)传递到括号中。此外,我们使用axis=1,因为您希望将其应用于列中的每一行。axis=1会为我们这样做的。
更多关于Pandas .apply函数的信息来自Pandas文档https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html
更多关于Pandas https://towardsdatascience.com/apply-and-lambda-usage-in-pandas-b13a1ea037f7中应用和Lambda使用的信息
https://stackoverflow.com/questions/58355954
复制相似问题