首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >跳过ssis中平面文件中的错误行

跳过ssis中平面文件中的错误行
EN

Stack Overflow用户
提问于 2017-01-02 17:14:16
回答 1查看 445关注 0票数 0

我正在尝试从平面文件加载数据。该文件大小约为2.5 GB,行数接近10亿。我使用的是DFT中的平面文件源。文件中有几行不遵循列模式,例如,有一个额外的分隔符或文本限定符作为一列的值。我想跳过这些行,加载其余格式正确的行。我正在使用SSIS 2014。DFT中的平面文件源失败。我已将alwaysCheckforrowdelimiter属性设置为false,但仍不起作用。由于文件太大,无法手动打开和更改。请帮帮忙。

EN

回答 1

Stack Overflow用户

发布于 2017-01-03 18:19:06

我和Nick.McDermaid有同样的想法,但也许我可以帮你更多。你可以用正则表达式清理你的文件。(在脚本中)

您只需要定义一个正则表达式来匹配具有您想要的分隔符数量的行。其他行应该删除。

下面是一个用Notepad++执行的可视化示例

Notepad++ Example screenshot

以下是我的示例中使用的模式:

代码语言:javascript
运行
复制
^[A-Z]*;[A-Z]*;[A-Z]*;[A-Z]*$

和数据示例:

代码语言:javascript
运行
复制
AA;BB;CC;DD
AA;BB;CC;DD
AA;BB;CC;DD;EE
AA;BB;CC;DD
AA;BB;CC
AA;BB;CC;DD
AA;BB;CC;DD

你可以在线尝试一下:https://regex101.com/r/PIYIcY/1

问候你,阿诺德

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41423975

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档