我正在从事基于方面的情绪Analysis.In这个项目,我们从推特收集的数据。在收集数据后,我们执行了文本清理方法并创建了语料库。之后,我们使用这个语料库来查找方面,在python.It中使用noun_phrases给出了名词短语的列表。从这个列表中,我只想选择那些只包含两个单词的方面。我该怎么做呢?
以下是我的代码和生成的输出:
from textblob import Word
comments = TextBlob(' '.join(corpus))
comments.noun_phrases
cleaned = list()
for phrase in comments
我有几个疑问-
1)如何使用现有的EDI to X12解析器?我使用的是Python 3.5。
a) pyx12,用的是python 2,里面应该不支持python >= 3. b) Bots,没有文档,不知道怎么用。c)在开源中找不到其他好的解析器。
2)如果我想构建一个解析器,我应该怎么做?我是说,我刚接触python本身,编写一个解析器算法对我来说有点太难了。
谢谢,阿卡什。