我正在寻找任何新的模型培训,从说唱歌词中提取实体。目前,我正在使用Spacy模型对NER,但有很多错误的分类。这是因为spacy模型是在报纸文章上预先培训的。所以,最初的问题是,有什么模型,我可以用在说唱歌词。
这就是当前的spacy模型如何对一些单词进行分类。
('kanye west','GPE'),(‘2 2pac’,‘积’),('hoochie‘,'ORG'),(’山谷‘,'LOC'),('talkin','NORP'),('nothin','PERSON'),(’100 k‘,’产品‘)
(如果你想知道这些歌词是什么,这些歌词是肯德里克·拉马尔写的)
发布于 2021-05-18 12:48:26
您可能需要生成您自己的培训数据,因为您试图分类的单词非常特定于美国说唱行业,而且很可能没有包含在任何现有的nlp包中。
https://stackoverflow.com/questions/67586277
复制相似问题