当使用NLTK进行实体识别时,就会得到一个带有映射到标记的单词的Tree (例如。Mark -> NNP,first -> JJ,.)乍一看,还不清楚所有的标记代表什么,而且我无法在NLTK文档中找到关于这些标记的任何文档。
>>> from nltk import word_tokenize, pos_tag, ne_chunk
>>> sentence = "Mark and John are the first to work at Google from one years old in 39 years."
>&g
What Algorithm/method do I use for a Question Answering System's Question Processing?
我一直在为我的问答系统寻找可能的算法,我认为唯一可能使用的是Parsing,但我在最后一个问题中询问了关于解析的问题,但由于答案在那里,我认为它不可能使用?(我不确定)。
我使用Parsing的想法是将问题逐字切分,然后它将通过单词存储来确定所说的是哪种单词(名词、形容词、动词等)。我使用Parsing的目的是删除或者更确切地说是确定问题的主题。
我的另一个想法是ChatterBot。Chatterbot使用单词查询