我有一个大的结构化数据集,其中有2列,包含:
我想要做的是训练模型,它可以从将来的文本中提取正确的整数,最好是在Python中。我见过纳,但我不确定这是否可能。
谢谢你的帮助。
发布于 2022-07-30 10:16:26
根据你的行动有几个悬而未决的问题。
如果A列中的数据在包含结构化数据的所有行之间是对称的,则可能是正则表达式可以提取所需的整数。
PS-这假设文本遵循相同的结构。这就是为什么数据集样本中的峰值可能有助于更好地评估手头的问题,并在需要时找出合适的算法。
https://datascience.stackexchange.com/questions/113106
复制相似问题