假设我在一家公司的年报中有一个语料库,显示了他们4个行业的收入数据:汽车、半导体、绿色能源和医疗保健。对于人类来说,找到一个特定行业的收入数据并不难。如果我使用NLP将其自动化,这样我就不必阅读它,那么NLP是否可能将正确的收入数据与一个特定的行业相匹配?
我使用NLP进行情感分析、主题建模和文本生成。但这些似乎都与上面的应用程序无关。有什么想法吗?我可以在哪个库中使用什么函数?
发布于 2020-04-13 09:43:45
如果提问者为4个类别中的每个类别发布一些样本文本,即汽车、半导体、绿色能源和医疗保健,则评论将相对容易。尽管如此,作者试图提供一种在理论上可行的方法。
让我们尝试从NLP的角度来理解这个问题,如下所示。
识别相似内容的方法可以如下所示。这些步骤来自作者here的另一个答案。
https://stackoverflow.com/questions/61136480
复制相似问题