前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >spacy 报错 gold.pyx in spacy.gold.GoldParse.__init__() 解决方案

spacy 报错 gold.pyx in spacy.gold.GoldParse.__init__() 解决方案

作者头像
Michael阿明
发布2021-02-19 10:57:00
4150
发布2021-02-19 10:57:00
举报
文章被收录于专栏:Michael阿明学习之路

在使用 spacy 进行 NLP 时出现以下错误:

代码语言:javascript
复制
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-164-8ef00790b0bb> in <module>
      2 opt = nlp.begin_training()
      3 for i in range(n):
----> 4     loss = train(nlp, train_data, opt)
      5     acc = evaluate(nlp, valid_text, valid_label)
      6     print(f"Loss: {loss['textcat']:.3f} \t Accuracy: {accuracy:.3f}")

<ipython-input-155-47db869d5b7c> in train(model, train, optimizer, batch_size)
      8     for batch in batches:
      9         text, label = zip(*batch)
---> 10         model.update(text, label, sgd=optimizer, losses=loss)
     11     return loss

~\AppData\Roaming\Python\Python37\site-packages\spacy\language.py in update(self, docs, golds, drop, sgd, losses, component_cfg)
    508             sgd = self._optimizer
    509         # Allow dict of args to GoldParse, instead of GoldParse objects.
--> 510         docs, golds = self._format_docs_and_golds(docs, golds)
    511         grads = {}
    512 

~\AppData\Roaming\Python\Python37\site-packages\spacy\language.py in _format_docs_and_golds(self, docs, golds)
    480                     err = Errors.E151.format(unexp=unexpected, exp=expected_keys)
    481                     raise ValueError(err)
--> 482                 gold = GoldParse(doc, **gold)
    483             doc_objs.append(doc)
    484             gold_objs.append(gold)

gold.pyx in spacy.gold.GoldParse.__init__()

TypeError: object of type 'float' has no len()

原因:

数据中有 NaN,需要处理它

解决方法:

  • 直接丢弃,train = train.dropna()
  • 替换为空字符串,train = train.fillna(" ")
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/10/15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档