首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >SSIS包-从多个源文件中获取一列

SSIS包-从多个源文件中获取一列
EN

Stack Overflow用户
提问于 2018-07-04 02:50:45
回答 1查看 147关注 0票数 2

我正在尝试创建一个SSIS包,它可以接受多个(已知的)文件结构,这些结构被转储到同一个处理文件夹中。我正在尝试从每个文件中提取AccountId

我遇到的问题是,我的数据流任务只适用于我为平面文件源设置的一个特定文件。在我的平面文件源中,我只使AccountId列可用,但这似乎并不能解决问题。

当前的SSIS包结构

Foreach循环:循环遍历指定文件夹中的所有文件

数据流任务:处理每个文件并存储在SQL表中

示例CSV文件结构

文件1:

代码语言:javascript
复制
Name | AccountId | Address | City | State
John | 154235    | 1234    | LA   | CA

文件2:

代码语言:javascript
复制
Name | Address | City | State | AccountId | Phone
Kyle | 5825    | Test | KY    | 534534    | 555-555-5555

文件:

代码语言:javascript
复制
Name | Address | City | State | Email      | AccountId | Phone
Bob  | 52345   | Fake | WY    | t@test.com | 756313    | 444-444-4444
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-07-04 03:34:27

平面文件源将使用连接管理器中定义的列的位置。它不会尝试从每个文件的头部单独拉取位置。

如果您想要创建一个可以处理列的不同位置的源,那么您可以购买一个可以处理此场景的组件,或者使用脚本组件编写自己的组件。

下面是一个设置为输出的脚本组件示例,它应该完成这项工作。您必须自己解决文件的解析问题,但这应该不是很难。不要忘记为文件路径配置一个变量,并将AccountId作为输出添加到输入和输出部分。

代码语言:javascript
复制
public override void CreateNewOutputRows()
{
    int colIdx = -1;
    var text = File.ReadAllText(Variables.FilePath); // Set in Script/ReadOnlyVariables
    var rows = ParseText(text);
    var firstRow = rows.FirstOrDefault().ToList();
    // find matching row
    for (var i = 0; i < firstRow.Count; i++)
    {
        if (firstRow[i] == "AccountId")
        {
            colIdx = i;
            break;
        }
    }
    foreach (var row in rows.Skip(1))
    {
        Output0Buffer.AddRow();
        Output0Buffer.AccountId = row.Skip(colIdx).First(); // configure columns in output
    }
}

public IEnumerable<IEnumerable<string>> ParseText(string text)
{
    /** implement yourself.  You can find examples online **/
}
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51161233

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档