首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >java regex在csv中删除不需要的双引号

java regex在csv中删除不需要的双引号
EN

Stack Overflow用户
提问于 2016-07-12 23:31:57
回答 1查看 996关注 0票数 1

我有一个csv文件,其中包含以下行。如你所见,数字没有用双引号括起来。

代码语言:javascript
运行
复制
String theLine = "Corp:Industrial","5Nearest",51.93000000,"10:21:29","","","","10:21:29","7/5/2016","PER PHONE CALL WITH SAP, CORRECTING "C","359/317 97 SMRD 96.961 MADV",""

我尝试读取上面的行,并使用regEX进行拆分

代码语言:javascript
运行
复制
String[] tokens = theLine.split(",(?=(?:[^\"]*\"[^\"]*\")*(?![^\"]*\"))");

这并不像我想要的那样在每个逗号处拆分。“每次与SAP的电话呼叫,更正"C",是弄乱它,因为它有额外的,(逗号)和”(双引号)。谁能帮我写一个正则表达式,将转义一个额外的双引号和逗号在两个双引号。

我基本上想要:

代码语言:javascript
运行
复制
"Corp:Industrial","5Nearest",51.93000000,"10:21:29","","","","10:21:29","7/5/2016","**PER PHONE CALL WITH SAP CORRECTING C**","359/317 97 SMRD 96.961 MADV",""
EN

回答 1

Stack Overflow用户

发布于 2016-07-12 23:47:52

有一些解析器比正则表达式更擅长的工作,这类事情通常就是其中之一。我不是说你不能让它为你工作,但是...还有一些开源的CSV解析器,您可以将其投入使用。

话虽如此,你的CSV在我看来是可疑的。

代码语言:javascript
运行
复制
"PER PHONE CALL WITH SAP, CORRECTING "C",

这个值有三个引号--它是否意味着表示一个只有一个引号的字符串?或者应该用引号和字符串将C括起来?

通常,如果要在双引号中包含双引号,则需要特殊的语法。对于CSV,最常见的选择是将其加倍,或者使用反斜杠之类的字符对其进行转义:

代码语言:javascript
运行
复制
"PER PHONE CALL WITH SAP, CORRECTING ""C""",

或者:

代码语言:javascript
运行
复制
"PER PHONE CALL WITH SAP, CORRECTING \"C\"",

这些都不会直接改变你使用正则表达式的问题,但是一旦你有了格式良好的CSV,你成功解析它的机会就会增加。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38333221

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档