我有一个SSIS包,它将导入一个excel文件。我希望使用python脚本来运行所有列标题,并将所有空白替换为'_‘。
以前,当我为一只熊猫做这件事时,我会使用:
df.columns = [w.replace(' ','_') for w in list(df.columns)]
但是,我不知道如何引用python的列标题。我理解我使用了'Execute Process Task‘,以及如何将它实现到SSIS中,但是如何引用Python SSIS包中包含的数据集呢?
对不起,我是SSIS的新手。使用Visual Studio 2017。在我的SSIS包中,在我的控制流屏幕中,我只有一个数据流任务矩形,我将其标记为约会。当您单击该选项卡时,您将转到数据流选项卡,这里实际上发生了所有事情。这里有两个不同的进程或路径。因此,对于路径1,我有一个OLE DB源。这将运行一条从SQL Server的某些表中提取数据的SQLSelect语句。然后是从这里到行数转换矩形的绿色连接器,然后是从那个到平面文件目标矩形的绿色连接器。将平面文件目标设置为从SQL语句中获取输出,在我的硬盘上创建一个文件,并将Select语句的结果放入该文件中。我称这个文件为“数据”文件。这就是这
我正在创建一个SSIS包,它将写入文本文件的头部。
STARTDATE|ENDDATE|ROWCOUNT
然后是存储过程的结果。ROWCOUNT是存储过程中数据集中的行数。数据集被写入平面文件的正文。
我的包裹成功了。它有三个数据流任务:
DetermineRowCount,WriteHeader和WriteData。
DetermineRowCount和WriteData都命中了同一个OLE DB源数据项的副本。
DetermineRowCount数据流是OLE DB Source - data ->行计数,其中设置了RowCount变量。
I想要删除OLE DB Source - D