腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Pandas
NLTK
-
标记
列
中
的
所有
行
以
进行
自然语言
处理
python
、
pandas
、
nltk
、
jupyter
==Using Juypter Notebooks== 我让
NLTK
处理
单个文本字符串。 Text= 'Hey.,因为我希望在数据框
中
的
许多行上自动执行此操作。基本上,在维护索引键
的
同时对单词
进行
标记
化,这样我就可以在新字段
中
重新组合我想要
的
标记
。例如,我正在查找人名,特别是包含超过1,000
行
的
excel
列
。 当我在数据帧上尝试时,这就是我遇到
浏览 10
提问于2020-05-02
得票数 0
1
回答
用空间
NLTK
标记
词
python
、
python-3.x
、
nltk
在
自然语言
处理
中
,用单词而不是句子来
标记
行
的
代码是什么?text=" Hi how are you, how is live, what are you doing " from
nltk
.tokenize import sent_tokenize
浏览 0
提问于2019-12-09
得票数 1
回答已采纳
2
回答
为什么我要用
nltk
标记
问题,好处是什么?
python
、
nltk
我最近刚刚开始使用
NLTK
;我发现了标签功能,但我在网上查找,没有找到解决这个问题
的
答案。为什么我要
标记
一个字符串?好处是什么?
标记
到底有什么作用呢?
浏览 2
提问于2018-09-13
得票数 0
2
回答
nltk
:根据POS用其他词替换令牌
python
、
nltk
我
的
工作是
自然语言
处理
和需要预
处理
的
一些数据.我
的
数据在文本文件
中
,我必须读取数据并将
所有
名称更改为男性或女性。在读取数据并对其
进行
标记
之后,我应用pos
标记
并使用有名称列表
的
文件
进行
检查,并将名称更改为“男性”或“女性”。: text = open('collegegirl.txt').read()
浏览 1
提问于2018-06-12
得票数 0
回答已采纳
1
回答
在Python上使用
NLTK
创建自己
的
命名实体
python
、
nltk
、
named-entity-recognition
、
chunking
我正在使用一本名为“用Python Cookbook
进行
自然语言
处理
”
的
书来学习
NLTK
。 以下是代码,但根本没有任何解释。grammar = r"NAMED-ENTITY: {<NNP>+}" "Microsoft(s) # ch
浏览 19
提问于2020-08-08
得票数 1
1
回答
将文本拆分成句子
python
、
regex
、
python-3.x
、
text-segmentation
我还需要
处理
缩写。然而,我
的
计划是在更早
的
阶段替换它们。谢谢,巴里 编辑:首先,我很乐意满足上面包含
的
四个测试。这将帮助我更好地理解正则表达式是如何工作
的
。现在,我可以按照测试
中
的
定义将句子定义为X.等。
浏览 1
提问于2011-08-25
得票数 5
回答已采纳
3
回答
一个像Matlab这样
的
NLP工具?
data-mining
、
nlp
Matlab是数学实验、神经网络、图像
处理
的
重要工具。 我想知道是否有这样一个全面和强大
的
工具来
处理
数据和NLP任务?例如
标记
化,词性标注,解析,培训,测试.
浏览 0
提问于2014-09-26
得票数 2
1
回答
无法对整列
进行
定位
python
、
nltk
、
twint
我想从CSV文件中
标记
数据。我正在使用这段代码,我无法
标记
整个
列
。我只能
标记
列
中
的
第一
行
。这一栏被称为“推特”。import
pandas
as pdfrom
nltk
import word_tokenize data=pd.read_csv('/Users/yoshithKotla/Desktop/dingdang
浏览 4
提问于2021-04-12
得票数 1
回答已采纳
2
回答
Python -不带标点符号
的
字符串到列表
中
python
、
python-3.x
我有一个包含句子
的
文件,我需要创建一个函数,将句子拆分成一个列表,将单词作为元素,但删除
所有
标点符号。这就是我所拥有的:它很接近工作,但有一个连字符
的
单词,它只是被放在一起作为一个单词,我需要它拆分。还有,像1,2这样
的
十进制数字会像这样被分割成"1","2“,我不想这样。 有没有更好
的
方法来解决这个问题?也许是一个更简单
的
解决方案?
浏览 39
提问于2021-03-13
得票数 1
1
回答
用斯坦福解析器在python中用
nltk
解析句子
python
、
parsing
、
nlp
、
nltk
、
stanford-nlp
我正在使用python
中
的
一个项目,在该项目中,我需要解析句子
以
进行
比较,并找到句子之间
的
相似性。我看过如何用java
中
的
斯坦福解析器来解析句子,在python
中
也是一样,我已经下载了python
的
nltk
,我对python和
自然语言
处理
都很陌生。提前谢谢。
浏览 3
提问于2014-07-02
得票数 0
回答已采纳
4
回答
PunktSentenceTokenizer在
NLTK
中
的
应用
python
、
nlp
、
nltk
我正在学习
自然语言
处理
使用
NLTK
。我偶然发现了使用PunktSentenceTokenizer
的
代码,它
的
实际使用在给定
的
代码
中
无法理解。该守则是:from
nltk
.corpus import state_union tagged =
nltk
.pos
浏览 7
提问于2016-02-08
得票数 43
回答已采纳
1
回答
在
Pandas
中
,有没有比这段代码更快
的
删除停用词和标点符号
的
方法呢?
python
、
pandas
、
nltk
我使用
的
代码似乎太慢了,也许还有其他选择。import
pandas
as pdimport string
nltk
.dow
浏览 1
提问于2019-04-13
得票数 2
1
回答
NLTK
:无法使用
的
类型:“列表”
python
、
nltk
、
lemmatization
目前,我正在对csv文件
中
的
一个单词
进行
词素化
处理
,之后,我
以
小写字母传递
所有
单词,删除
所有
标点符号,并拆分列。我只使用两个CSV
列
:analyze.info() <class '
pandas
.core.frame.DataFrame'> RangeIndex: 4637 entries, 0 to 4636.\SA_working\venv\lib\site-packages\
nltk</em
浏览 2
提问于2020-10-21
得票数 0
回答已采纳
1
回答
将句子
中
的
每个单词替换为同义词
的
Python程序
python
基本上,我想要做
的
是创建一个程序,它接受一个句子/段落作为用户输入,查找每个单词
的
同义词,并将该单词替换为该同义词。到目前为止,我为此创建
的
程序运行得很好,但也有一些问题/人为错误/逻辑错误。基本上,我把它归结为4个基本问题:2)输入了错误
的
词义,或者返回了在用户输入上下文中没有意义
的
词义;4)当输入一个名词时,返回该单词
的
动词,反之亦然(即“
浏览 2
提问于2016-07-18
得票数 0
2
回答
文本
中
单词分类
的
可用选项?
text-processing
、
natural-language-processing
我正在研究如何在文本
中
对单词
进行
分类,我想知道有哪些选择,哪些最适合这项工作。我最感兴趣
的
是关键字,这些关键字通常是名词。接下来,我试着建立一个黑名单来匹配
所有
的东西,除了已知
的
停止词,动词等等。然而,要建立一个足够大
的
清单来
处理
已知
的</em
浏览 0
提问于2012-02-13
得票数 3
回答已采纳
1
回答
俄语
自然语言
处理
neural-network
、
artificial-intelligence
我正在寻找能
处理
自然俄语
的
图书馆(Es)或服务(S):识别和提取单词
的
组合:“=>”Онистроилижелезнуюдорогу
浏览 0
提问于2018-09-01
得票数 1
1
回答
如何在python中将文本块
标记
为一个令牌?
python
、
nlp
、
nltk
、
tokenize
在以前关于
自然语言
处理
的
工作
中
,我使用了来自
nltk
的
sent_tokenize和word_tokenize来
标记
句子和单词。但是当我在基因组数据集上使用这些功能时,它不能正确地
标记
基因组。,每一
行
文本(例如tattattatacacaatcccggggcgttctatatagttatgtataatgtat )都会成为一个不正确
的
标记
。一个序列块应该被看作是一个
标记
。这里
的
浏览 10
提问于2022-11-30
得票数 3
回答已采纳
1
回答
Python
中
的
可视化和聚类
python
、
nlp
、
k-means
我想基于
自然语言
处理
算法(tf-idf)对评论
进行
分类。我设法对这些集群
进行
了分类,但我想
以
图形
的
方式将它们可视化(直方图、散点图……)from
nltk
import word_tokenizefrom pprint import pprintimport
p
浏览 23
提问于2019-08-19
得票数 1
回答已采纳
2
回答
天文文本
处理
(NLP)从何处开始
nlp
、
text-processing
、
devanagari
我是Devnagaric NLP
的
新手,有没有任何小组或资源可以帮助我开始使用Devnagaric语言(主要是尼泊尔语或类似的印地语)
的
NLP。我希望能够为天成字开发字体,也可以做一些字体
处理
应用程序。如果任何人(在这个领域工作),可以给我一些建议,然后将非常感谢。提前感谢
浏览 4
提问于2017-02-15
得票数 1
1
回答
XMLCorpusReader没有创建一个语料库
python
、
nltk
、
corpus
我正在用python
的
nltk
学习
自然语言
处理
。我想从我目录
中
的
XML文件创建一个语料库。所以我使用了下面的代码。>> from
nltk
.corpus import XMLCorpusReader>> wiki = XMLCorpusReader(corpus_root ,'o
浏览 2
提问于2013-07-29
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
实例教程:如何用自然语言处理来预测垃圾邮件?
数据加载、存储与文件格式
玩转Pandas,让数据处理更easy系列5
pandas入门指南
如何只用一行代码让 Pandas 加速四倍?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券