我正在以下列形式在R中得到带有POS标签的文本:
准准型
/T1451-1997 1中转率比较准5 POS=NNP
2.较准确的用语-可接受性比较-7
.
例如,我想检索它标记的单词,而不是作为单词检索所有值的列'type‘。我可以使用scan_tokenizer,但当出现诸如“不是”之类的形式时,问题就出现了-- POS标签将其分解为" is“和"not",这很好,但scan_tokenizer并没有将其标记为”not“。有人能帮我检索一下R标记的单词吗?
谢谢
发布于 2014-11-17 12:55:57
https://stackoverflow.com/questions/26957480
复制相似问题