腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1795)
视频
沙龙
1
回答
NLTK
不对
大写
单词
进行
词汇
化
、
、
例如纸箱,尺寸:19 CARDBOARD高x 10 CARDBOARD宽x 30 CARDBOARD深 我使用
NLTK
包来做到这一点,但它只接受小写字符串,并且我不想让字符串中的所有
单词
都小写。
浏览 16
提问于2021-08-11
得票数 1
回答已采纳
3
回答
NLTK
WordNet词法分析器:它不应该将一个
单词
的所有词形变化都
词汇
化
吗?
、
、
我正在使用
NLTK
WordNet Lemmatizer
进行
词性标注项目,首先将训练语料库中的每个
单词
修改为其词干(就地修改),然后仅在新语料库上
进行
训练。例如,
单词
loves被
词汇
化为love,这是正确的,但是即使在
词汇
化
之后,
单词
loving仍然是loving。这里的loving和句子中的"I'm loving it“一样。同样,许多其他的“ing”形式在
词汇
化
后仍然存在。这
浏览 44
提问于2014-08-28
得票数 38
回答已采纳
1
回答
pandas中的Lemmatize标记
化
列
、
、
我正在尝试对标记
化
的列comments_tokenized
进行
词汇
化
? 我有: import
nltk
lemmatizer == df1["comments_tokenized"].apply(lemmatize_text) 但却有 TypeError: unhashable type: 'list
浏览 44
提问于2020-01-03
得票数 1
回答已采纳
2
回答
nltk
lemmatizer不知道如何处理美国人这个词
、
、
已运行以下程序:wnl().lemmatize("American") wnl().lemmatize("Americans
浏览 1
提问于2011-11-04
得票数 2
回答已采纳
1
回答
使用Python和
nltk
的词例
化
、
、
我需要用Python对一些
单词
进行
词汇
化
Resource punkt not found.Please use the
NLTK
Downloader to obtain the resource: >>>
nltk
.download('punkt') 我已经安装了
nltk
,并且之前导入了库。
浏览 1
提问于2018-12-11
得票数 0
1
回答
如何对句子列表
进行
词汇
化
、
、
、
from
nltk
.stem.wordnet import WordNetLemmatizerlmtzr = WordNetLemmatizer我需要对之前的
单词
进行
标记
化
才能正常工作吗?
浏览 63
提问于2018-06-05
得票数 5
回答已采纳
1
回答
使用
nltk
恢复原始
单词
,并使用完整语义
进行
标记
化
、
我知道使用
nltk
模块我可以对
单词
进行
词汇
化
lemmatizer = WordNetLemmatizer() 或但问题是,我没有完整的句子可以标记
化
。 我想输入一个
单词
,它返回没有句子标记
化
的原始<
浏览 10
提问于2019-10-22
得票数 0
1
回答
使用quanteda
进行
词法分析
、
如何使用quanteda对像makes这样的
单词
进行
词汇
化
,使其成为make。 在Python语言中,可以使用
NLTK
WordNet Lemmatizer
浏览 53
提问于2020-06-12
得票数 0
回答已采纳
1
回答
NLTK
词汇
化
、
、
、
、
我正在尝试用
NLTK
对
单词
进行
词汇
化
。我现在能找到的是,我可以使用stem包得到一些结果,比如将"cars“转换为"car”,将“女人”转换为“女人”,但是我不能对一些带有词缀的
单词
进行
词汇
化
,比如“致谢”。谁能告诉我如何消除
单词
的词缀? 也就是说,当输入为“确认”时,输出为“确认”。
浏览 0
提问于2013-07-17
得票数 4
回答已采纳
2
回答
在Python中对Twitter数据框使用列举
化
和Tf- Idf计算时出错
、
、
我有一个tweet的数据帧,我试图在词条
化
的'tweet‘列上计算Tf-Idf。我对
词汇
化
的结果有一个问题,并且在尝试计算Tf-Idf时得到一个错误。下面是我的代码: w_tokenizer =
nltk
.tokenize.WhitespaceTokenizer() def lemmatize_text我的第一个问题--我如何改进
词汇
化
? 现在,我想要计算此列的Tf- Idf,并在我的数据框中生成包含顶部
单
浏览 54
提问于2020-07-27
得票数 2
回答已采纳
1
回答
NLTK
WordNetLemmatizer将"US“处理为"u”
、
、
如果您将
单词
"US" (美国)从package
nltk
.stem输入到WordNetLemmatizer中,在经过预处理(变成"us",即小写)之后,它将被翻译为"u"。例如: from
nltk
.stem import WordNetLemmatizerword = "US".lower() # "US"becomes "us" lemma = lmtzr.
浏览 7
提问于2019-02-20
得票数 2
回答已采纳
1
回答
Nltk
lemmatizers不识别化学名称的复数形式
、
、
、
所以,我必须承认,我完全是nlp的新手,我对
nltk
一无所知,我只是试图使用上一位开发人员留下的遗留代码。我需要对大部分来自化学和生物技术出版物的词语
进行
词汇
化
。from
nltk
.stem import WordNetLemmatizerlemmatizer.lemmatize('cats')
浏览 5
提问于2020-03-24
得票数 0
1
回答
在Python中优化语言检测代码和
词汇
化
、
、
、
、
lang2)在训练模型之前,我想对我的
单词
进行
词汇
化
但是,如果我们将词性标记为
单词
,
NLTK
中的
词汇
化
将正常工作,我尝试如下所示,但得到一些错误: from
nltk
.ste
浏览 11
提问于2018-02-08
得票数 0
回答已采纳
2
回答
所有熊猫细胞的Lemmatization
、
有一列,让我们把它命名为:'col‘这一列的每个条目都是一个
单词
列表。'word1‘、'word2’等。
nltk
.stem.WordNetLemmatizer().lemmatize('word') 我希望能够为pandas数据集中某一列中所有单元格的所有
单词
找到一个引理。
浏览 1
提问于2017-11-30
得票数 11
回答已采纳
2
回答
训练前语料库的word2vec
词汇
化
、
、
、
然而,
词汇
化
是许多语义相似性任务的标准预处理。我想知道是否有人有在训练word2vec之前对语料库
进行
词汇
化
的经验,以及这是否是一个有用的预处理步骤。
浏览 2
提问于2014-05-27
得票数 30
回答已采纳
1
回答
使用
NLTK
区分word与非word
、
在对文本
进行
词汇
化
之后,我得到了一个
词汇
表。对于这个列表中的每个元素,我想知道它是一个
单词
(“猫”,“狗”,"go","xxx___BATMAN___xxx")还是非
单词
("."如何在Python和
NLTK
中区分word和非word? UPD。(对于
单词
是什么的问题)我想清除我的列表中的全部垃圾。去掉完全不是
单词
的东西。不要接触复杂的边缘情况。
浏览 7
提问于2017-01-18
得票数 0
1
回答
如何使用Fasttext构建词法分析器
、
、
、
我有大量的阿拉伯方言
单词
(4M)和它们对应的词条,我想通过利用它为不在该数据中的新词建立一个
词汇
化
器。问题是如何使用FastText构建这个
词汇
化工具?
浏览 10
提问于2020-04-02
得票数 0
2
回答
朴素贝叶斯分类器忽略的
单词
列表应该是什么?
、
、
我正在使用PHP上的朴素贝叶斯分类器() 在训练系统时,有一个可以忽略的
单词
列表。这些
单词
不会保存到数据库中,因此不会用于分类。我想尽可能地改进这个系统,所以我想知道对于这种系统,是否有任何规则或典型
单词
列表可以忽略。
浏览 1
提问于2012-03-21
得票数 0
回答已采纳
2
回答
wordnet词法分析器的问题
、
我试过wordnet lemmatizer,但我发现像“学习”或“等待”这样的常用词没有得到适当的处理。
浏览 0
提问于2010-06-09
得票数 0
回答已采纳
1
回答
Nltk
的wordnet
词汇
器不是对所有
单词
都
进行
词汇
化
、
、
、
、
我在试着把课文中的
单词
词汇
化
。例如,'pickled‘应该变成'pickle','ran’变成'run',‘run’变成'raisin‘,等等。我正在使用
nltk
的WordNet Lemmatizer,如下所示:>>> >>> lem = WordNetLemmatizer如何获得这些
单词
的'
浏览 0
提问于2017-07-29
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
总结!实用Python文本预处理代码
WordNet及其Python应用
如何使用 Python 库来进行自然语言处理
Python文本预处理:步骤、使用工具及示例
Python自然语言处理:使用SpaCycle库进行标记化、词干提取和词形还原
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券