我需要将一行字符串分解为excel中的不同列。这是我得到的输入。
输入
输出:具有结构的CSV记录(代码、Sem/年、科目、课程、考试日期、时间、标记)
我在不同的集合中有数据,这些数据构成了上面的行。例如:
语法(这是一个数组/字典):
FYI
我的假设是,逐字逐句地阅读,并尝试与任何数组中的任何单词匹配。如果它与任何单词匹配,那么将该词归类为下降的类别,并添加到excel的相关列中。
在这里,我知道如何处理数据和一切,除了了解每个单词的优化/最佳方法属于哪一类之外。
有没有词汇分析专家可以分享这方面的一些想法?
发布于 2014-01-09 18:21:54
您应该使用正则表达式来匹配这样复杂的文本模式。
发布于 2014-01-09 18:27:32
请看一下像反这样的词法分析器。如果您了解Java或其他阅读正则表达式的语言,那么在经过一下午(或一周)的折磨之后,您将能够轻松地解析这些表达式。您也可以用Java编写regexp,但是我会提示您使用ANTLR接口,您可以从Eclipse中使用该接口。它将向您展示如何解析这些行。
让ANTLR或Java的输出写出一个CSV文件。CSV将成为您将数据输入Excel电子表格的工具。
https://stackoverflow.com/questions/21027989
复制相似问题