首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >带有文本限定符的SAS导入文件

带有文本限定符的SAS导入文件
EN

Stack Overflow用户
提问于 2015-08-12 15:01:01
回答 1查看 1.8K关注 0票数 0
代码语言:javascript
运行
复制
"6/23/2015 8:55:36 AM,6/23/2015 7:57:55 AM,test,A B,""C, D "",E-MA,F,Personal G,G one,test - TWO THREE,""I LIKE APPLE"",""ONE, TWO"",FCB,6/27/2015 - 6/27/2016,6/23/2015,BIZ,Personal,MA,NY,Personal,Group,""NYC Ins. Companies"",,,""$NYC NY-MA, (Group)"",""$NYC NY-MA, (Group)"",,,,"

数据看起来是这样的,但是有10k行。我首先尝试使用PROC导入,但它没有将逗号(,)识别为文件中的分隔符。然后,我尝试了数据步骤INFILE,但仍然没有解决问题。

是否有人有使用文本限定符导入文件的经验?

谢谢。

更新

  • 不知道如何在这里插入一个表,但是如果我使用excel导入文件,指定逗号作为分隔符,双引号作为文本限定符,它将有30个字段。看起来像下面这张糟糕的桌子.

VAR1 VAR2 VAR3 VAR4 VAR5 VAR6 VAR7 VAR8 VAR9 VAR10 VAR11 VAR12 VAR13 VAR14 VAR15 VAR16 VAR15 VAR17 en29 20 en22 en25#en25 26 en28

2015年6/23/2015 8:55 6/23/2015 7:57公司(集团) $NYC纽约-MA(集团),(集团)

  • 这不是复制粘贴问题。我有原始的csv文件和txt文件。
EN

回答 1

Stack Overflow用户

发布于 2015-08-12 22:10:33

我认为,如果您能够从文件中删除多余的双引号,您可能会在proc import上获得更好的运气:

代码语言:javascript
运行
复制
data _null_;
  infile "original_file.csv" lrecl = 32000;
  file "new_file.csv";
  input;
  _infile_ = tranwrd(substr(_infile_,2,length(_infile_) - 1),'""','"');
  put _infile_;
run;

这个想法非常简单--整行阅读,删除第一个和最后一个字符(假设这些字符总是双引号),然后用双引号替换双引号。

如果您的任何文本字段实际上应该包含双引号,这可能会导致一些进一步的问题,但否则它应该会生成一个文件,该文件应该稍微容易直接导入,可以通过proc导入或者在适当的infile语句上使用dsd选项。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31968892

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档