腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
python
节
从
文本
数据
中
提取
人名
、
我有一个包含图书标题页字符串值的
数据
集(例如,标题页上的所有单词,我的txt文件的每一行都是一本不同的书)。由此,我尝试检索出现在标题页上的作者姓名,并将每个姓名存储在csv文件
中
的单独行
中
。当我输入以下代码时,我会得到每个条目的"no author“值,根据输入
数据
,这是不可信的。有人能帮我找出哪里出了问题吗?谢谢,在过去的几天里,我一直在绞尽脑汁研究这个问题,但是没有结果。
浏览 205
提问于2021-06-30
得票数 1
回答已采纳
5
回答
如何获取所有
人名
(或至少是英文常用
人名
)的
数据
库?
我正在设计一个需要从短
文本
中
提取
人名
的应用程序。有什么想法吗?
浏览 1
提问于2009-11-15
得票数 5
回答已采纳
2
回答
实体识别是否属于分类问题?
、
、
、
我想从
文本
中
提取
命名实体,但我不知道它是属于分类还是属于分类,那么如何准备类来识别
文本
中
的实体(收集几个组织名称和
人名
,并
使用
它们作为我的培训
数据
集是解决方案吗?)
浏览 0
提问于2016-08-12
得票数 2
2
回答
聚焦命名实体识别(NER)?
、
、
我想要识别特定领域(例如棒球)
中
的命名实体。我知道有像StanfordNER,LingPipe,AlchemyAPI这样的工具,我已经用它们做了一些测试。但正如我之前提到的,我希望它们是特定于领域的。
浏览 0
提问于2012-04-06
得票数 3
回答已采纳
2
回答
如何
使用
Spacy
从
Python
中
的
数据
帧中
提取
人名
、
、
我想通过从每一个例子
中
删除人民的名字来识别这一
文本
,同时保留句子的其余部分。
浏览 3
提问于2022-07-19
得票数 0
2
回答
如何
使用
python
删除语料库
中
的
人名
我正在运行主题建模,但在我的
数据
中
,
文本
中有太多的名字。 有没有包含(英文)
人名
的
python
库?或者,如果没有,
从
语料库
中
的每个文档
中
删除
人名
的好方法是什么?
浏览 10
提问于2020-11-09
得票数 0
1
回答
用
Python
从
XML树的子元素中
提取
所有
文本
。
、
、
我正在尝试
提取
政府法案
数据
的一部分,比如这个。我只想要这一
节
中
的
文本
,但不知道如何
使用
python
的xml.etree.ElementTree导航到它;等效的javascript应该类似于getElementbyTagName。
浏览 1
提问于2016-04-17
得票数 0
回答已采纳
2
回答
Python
:
从
列表
中
删除/筛选等于符号
、
、
我的问题是:==Section Name=====Section Name=== 目前,我正在
使用
regex来过滤
文本
中
的部分(页面
文本
)。sections =
浏览 4
提问于2017-03-19
得票数 2
回答已采纳
2
回答
从
NodeJS
中
的
文本
中
提取
人名
、
我是
使用
node js的NLP新手,我正在尝试找出可以用来判断给定
文本
中
的单词是否是
人名
的NLP库。任何与库或代码示例相关的帮助,或者关于如何在nodeJS
中
解决这个问题的任何想法,我们都非常感谢。 谢谢。
浏览 75
提问于2020-08-09
得票数 0
2
回答
从
多个<img>页面中
提取
元素的src (按类选择)
、
、
、
我需要
提取
所有现有的{robotname}变体,然后下载映像,但我很难理解如何将元素存储在对象
中
(例如
Python
或JS )。 我该如何开始/如何阅读才能做到这一点?
浏览 4
提问于2022-05-01
得票数 0
回答已采纳
1
回答
如何像在2.x
中
那样
从
字节字符串中
提取
混合二进制和ascii值?
、
以下是
从
文件中
提取
的二进制图像(插入字节之间的空格以使读取更容易)。文件是以“rb”模式打开的。01 77 33 9F 41 42 43 44 00 11 11 在
Python
2.7
中
,我将其读取为字符串,并
使用
ord()
提取
二进制值,然后可以
提取
甚至搜索字符串
中
的特定
文本
值(例如字符4-7
中
的"格式不是固定的,而是由
数据
结构组成的。例如,字节2
中
的33可能是一个记录长度
浏览 0
提问于2019-07-29
得票数 1
2
回答
阅读Word文档并获取每个标题的
文本
、
我有一个Microsoft文档,我需要根据文档的每个部分
提取
文本
并将其构造成一个
数据
框架。文档的每个部分都以标题开头。标题以Word格式格式化为“标题2”。例如: 这是第一
节
的案文。这是文档的第二部分 我需要得到
数据
框架
中
每一
节
的
文本
,在A列
中
,我将有章节名称,而在B栏
中
,我将得到该
节
文本
。我对
Py
浏览 0
提问于2018-08-03
得票数 4
2
回答
一种分割级联名称的算法
、
、
、
我
使用
最长的前缀匹配算法和名称字典测试了这些解决方案,但并不是那么简单,因为名称可以用多种方式编写。我也增加了语音匹配算法,但也有很多名字可能有相同的发音,所以它们非常模糊。 什么是最好的解决方案?
浏览 0
提问于2017-08-10
得票数 0
回答已采纳
2
回答
python
-docx获取标题
文本
、
、
我想用
Python
从
docx文件
中
读取标题
文本
。我
使用
的是
python
-docx模块。我试着这样做,但没有成功。
浏览 8
提问于2018-01-15
得票数 4
1
回答
选择大的WHERE IN子句需要很长的时间
、
、
我有一个大型的医学
数据
库,我需要根据选定的医生(S)为患者
提取
数据
。一旦我得到了我的病人列表,我就会在从一大堆病人相关的表中
提取
数据
时
使用
它。根据我最初的医生名单,我可能最终得到的病
人名
单是20,000+。该系统
中
病人总数接近100万人。然后,我拿起我的病
人名
单,开始
从
其他表格
中
获取
数据
,大致如下FROM xrays WHERE patID IN (
浏览 0
提问于2012-04-14
得票数 5
1
回答
使用
Python
与PyCrypto::CBC
、
、
、
、
一方面,我
使用
Perl的加密/解密
文本
my $cipher = Crypt::CBC->new( -salt => '12341234' 另一方面,我有
Python
的,我需要对Perl
中
的
数据
进行解码,但也发送给Perl密码可以读取的
文
浏览 0
提问于2015-11-14
得票数 1
回答已采纳
1
回答
从
文件
中
自动
提取
节
(和
节
标题)
、
、
、
、
我需要从.Rmd文件中
提取
所有的子部分(用于进一步的
文本
分析)和它们的标题(例如,
从
01-tidy-text.Rmd的整洁
文本
挖掘书:)。我只知道一个部分
从
##符号开始,并一直运行到下一个#、##符号或文件的末尾。整个
文本
已经被
提取
(
使用
dt <- readtext("01-tidy-text.Rmd"); strEntireText <-dt[1,1])并被定位为变量strEntireText。我想为此
使用</
浏览 1
提问于2018-05-09
得票数 0
回答已采纳
1
回答
Python
套接字缓冲:消息成帧
、
、
我在TCP/IP套接字上接收
从
外部硬件(Zigbee接收器)到PC的
数据
流(46字
节
)。然后通过
Python
编程,
从
接收到的来自TCP/IP套接字的
数据
流中
提取
报文。我的
python
源代码并从
数据
流中
提取
数据
,如下面的链接所示 如果我在单个流
中
接收到
浏览 4
提问于2012-07-10
得票数 0
1
回答
我想从简历中
提取
特定的部分,简历。
、
我想从简历或CV...like教育、经验中
提取
一个特定的章节。我这样做了,但当教育或其他部分最后写在简历上时,它就行不通了。
浏览 1
提问于2021-06-12
得票数 0
3
回答
熊猫:
文本
分析:将原始
数据
传输到
数据
、
、
、
、
我需要从
文本
文件
中
读取行,并从每一行中
提取
引用的
人名
和引文。霍默·辛普森( )回答说:“我永远都不会!”备注: 提示:
使用
“open”方法返回的对象来获取文件处理程序。删除新行如下:line_cln =line.strip(),每一行都有选项(假设这三个选项之一):第一组模式,
人名
出现在引用的
文本
前面。第二组模式,引用的
文本
出现在人的前面。空空如也。如前所述,完成transfer_raw_text_to_dataframe
浏览 2
提问于2022-01-08
得票数 2
回答已采纳
点击加载更多
相关
资讯
如何用Python从PDF文件中提取文本词汇
python中如何使用正则表达式提取数据
如何使用python的csv模块提取一列数据
使用Python删除文本文件中特定内容的行
Python使用OpenCV+pillow提取AVI视频中关键帧图像
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券