我想从非结构化文本中提取一些信息。
例如,我的文本是"Control NewYork temperature under 39“
我需要的信息是("control","NewYork","temperature","under","39")。
在结果信息中,"control“表示动作,"NewYork”表示动作目标,"temperature“表示指示器,"under 39”表示范围。
然而,文本内容的结构是多种多样的。
下面是一些典型的案例。
"Control NewYork temperature under 39"
==>("control","NewYork", "temperature", "under", "39")
"give some money to my brother"
==>("give", "money", "my brother")
"Adjust the height of the table"
==>("adjust", "table", "height")
对我的问题有什么建议吗?非常感谢!
发布于 2017-11-03 22:18:16
你有几个范例来做这种结构化的预测。最常见的是:
使用框架语义:http://www.cs.cmu.edu/~ark/SEMAFOR/
使用语义角色标签(SRL):http://cogcomp.org/page/demo_view/srl
主要区别在于SRL的语义角色对于不同的动词具有不同的含义,而框架语义是为语义概念提供通用角色的抽象。
你可以很容易地在Github上找到执行框架语义解析或SRL的工具。但是,SRL的使用更为广泛。
https://stackoverflow.com/questions/47091614
复制相似问题