首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >根据训练数据从文本中提取值?

根据训练数据从文本中提取值?
EN

Data Science用户
提问于 2022-07-30 09:05:17
回答 1查看 29关注 0票数 0

我有一个大的结构化数据集,其中有2列,包含:

  1. 包含各种文本和整数的文本段落
  2. 在第一列中的文本中找到的整数

我想要做的是训练模型,它可以从将来的文本中提取正确的整数,最好是在Python中。我见过纳,但我不确定这是否可能。

谢谢你的帮助。

EN

回答 1

Data Science用户

发布于 2022-07-30 10:16:26

根据你的行动有几个悬而未决的问题。

  1. 包含文本和整数的结构化列看起来如何?哪种文字?
  2. 是否有必须提取此整数的标准。

如果A列中的数据在包含结构化数据的所有行之间是对称的,则可能是正则表达式可以提取所需的整数。

PS-这假设文本遵循相同的结构。这就是为什么数据集样本中的峰值可能有助于更好地评估手头的问题,并在需要时找出合适的算法。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/113106

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档