我有一个csv文件,其中包含以下行。如你所见,数字没有用双引号括起来。
String theLine = "Corp:Industrial","5Nearest",51.93000000,"10:21:29","","","","10:21:29","7/5/2016","PER PHONE CALL WITH SAP, CORRECTING "C","359/317 97 SMRD 96.961 MADV",""
我尝试读取上面的行,并使用regEX进行拆分
String[] tokens = theLine.split(",(?=(?:[^\"]*\"[^\"]*\")*(?![^\"]*\"))");
这并不像我想要的那样在每个逗号处拆分。“每次与SAP的电话呼叫,更正"C",是弄乱它,因为它有额外的,(逗号)和”(双引号)。谁能帮我写一个正则表达式,将转义一个额外的双引号和逗号在两个双引号。
我基本上想要:
"Corp:Industrial","5Nearest",51.93000000,"10:21:29","","","","10:21:29","7/5/2016","**PER PHONE CALL WITH SAP CORRECTING C**","359/317 97 SMRD 96.961 MADV",""
发布于 2016-07-12 23:47:52
有一些解析器比正则表达式更擅长的工作,这类事情通常就是其中之一。我不是说你不能让它为你工作,但是...还有一些开源的CSV解析器,您可以将其投入使用。
话虽如此,你的CSV在我看来是可疑的。
"PER PHONE CALL WITH SAP, CORRECTING "C",
这个值有三个引号--它是否意味着表示一个只有一个引号的字符串?或者应该用引号和字符串将C括起来?
通常,如果要在双引号中包含双引号,则需要特殊的语法。对于CSV,最常见的选择是将其加倍,或者使用反斜杠之类的字符对其进行转义:
"PER PHONE CALL WITH SAP, CORRECTING ""C""",
或者:
"PER PHONE CALL WITH SAP, CORRECTING \"C\"",
这些都不会直接改变你使用正则表达式的问题,但是一旦你有了格式良好的CSV,你成功解析它的机会就会增加。
https://stackoverflow.com/questions/38333221
复制相似问题