我刚开始使用SSIS,希望能得到一些设计ETL过程的建议。
我提供了整个项目的图表。简而言之,我从单个Blobs获取Excel文件,将它们转换成通用模板格式,然后将它们加载到Server数据库中。我只是简单地请求帮助( ETL流程的控制流)应该是什么样的。在我过去的尝试中,我有一个将文件下载到本地驱动器的过程,但这并不理想。
理想情况下,我不想下载文件到我的本地驱动器,而是通过Azure完成整个过程。任何帮助都将不胜感激。谢谢!
项目范围:

发布于 2017-12-17 03:09:37
这个问题的答案将取决于接口--您使用什么接口来获取这些文件并使用SQL server处理它们?
这是一个重要的问题,因为如果您使用跨网络的web服务或文件共享来访问这些项,首先在server中(例如使用C# CLR )获取文件,然后处理/解析/任何您需要做的事情,然后将它们插入到您的SQL目的地的适当blob字段中,可能会更有意义。这是一个数据接口吗?两个端点是否都使用Microsoft驱动程序?
要传输文件,需要在SSIS包中设置一个源和目标;需要为每个端点配置源和目标,设置这些端点,只需右键单击连接管理器窗格并添加两个数据端点。
然后,您需要设置一个数据流任务。在flow任务中,您将添加一个引用在连接管理器中设置的连接之一的源。对于每个供应商blobs,您可能需要设置一个单独的数据流任务,这取决于数据是否全面一致,以及每个供应商是否使用相同的DB连接器(换句话说,这是否是每个供应商的相同接口)。
将数据从源映射到目的地--在这里,我认为您将从源绘制一条线(例如,您可以使用变量并使用OLE DB自定义查询对数据进行按摩)。
你将把点从你的来源连接到你的目的地,并保留你想要的物品。请注意,您必须遵循目标表规则--例如,您可能需要保留外键,也可能不需要,因此您希望确保您移动的数据符合目标数据模型。SSDT非常有效地帮助您绘制地图,尝试上面的项目,如果您有问题,请告诉我!
https://stackoverflow.com/questions/47851716
复制相似问题