我正在寻找一个工具,可以训练从文本输入提取上下文/类别。
例如,在训练之后,工具应该能够识别...“戴尔Inspiron Corei3笔记本电脑班加罗尔最好的价格”是与“计算机”类别下的“笔记本电脑”相关的“塔塔Indicom光子加数据卡”是与“计算机”类别下的“数据卡”相关的。和“摄影”无关!
谢谢,Arvind
发布于 2012-04-27 02:20:52
像Apache Mahout这样的东西?我从未亲自使用过它,但不久前在IBM developerworks上读到过它,它看起来很适合您的问题。
https://stackoverflow.com/questions/10339068
复制相似问题