首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >树库的Python数据结构?

树库的Python数据结构?
EN

Stack Overflow用户
提问于 2011-11-15 00:57:47
回答 2查看 1.8K关注 0票数 3

我正在寻找一个处理Penn Treebank结构的Python数据结构。这是Treebank的样例:

代码语言:javascript
运行
复制
( (S
    (NP-SBJ (PRP He) )
    (VP (VBD shouted) )
    (. .) ))

从本质上讲,我想要一个数据结构,我可以问这样的问题:“主题NP的孩子是什么?”或者“什么类型的短语支配代词?”,最好是在Python中。有谁有线索吗?

EN

回答 2

Stack Overflow用户

发布于 2011-11-15 01:05:26

NLTK modules可能是用Python语言实现Penn Treebank和其他与自然语言编程相关的东西的一个很好的开始。

票数 3
EN

Stack Overflow用户

发布于 2011-11-15 21:53:19

我仍然建议使用NLTK来读取树库(例如this blog post),但我可以想象它不支持这种通用查询。

“主语NP的子句是什么?”

这将是一个dict,比方说children,将非终端映射到非终端或子节点的sets

“什么类型的短语支配着代词?”

这将是另一个dict,比如parents,将非终结符映射到非终结符的sets

您可能希望构建树节点的关系数据库。确切的模式取决于您想要询问的查询类型,但是一定要检查Python sqlite3模块。

或者,您可以用XML和use XPath to query it对树库进行重新编码。LXML是适用于Python的最好的XML/XPath库。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8125132

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档