腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1265)
视频
沙龙
8
回答
python中
的
wordnet
词汇
化
和
pos
标记
python
、
nltk
、
wordnet
、
lemmatization
我想在python中
使用
wordnet
lemmatizer,并且我了解到默认
的
pos
标签
是名词,并且它不会为动词输出正确
的
词条,除非
pos
标签
被明确指定为动词。我
的
问题是,为了准确地执行上述
词汇
化
,最好
的
镜头是什么? 我
使用
nltk
.
pos
_tag做了
pos
标签
,我迷失
在
将
浏览 5
提问于2013-03-23
得票数 71
回答已采纳
2
回答
在
pyspark
dataframe
上
使用
POS
标签
的
nltk
wordnet
词汇
化
python-3.x
、
pyspark
、
apache-spark-sql
、
pyspark-dataframes
我正在处理
pyspark
数据帧中
的
文本数据。.|only showing top 5 rows 然后,我尝试
使用
udf函数对其进行
词汇
化
def get_
wordnet
_
pos
(treebank_tag): return
WORDNET
POS
compliance to W
浏览 5
提问于2020-01-22
得票数 1
1
回答
NLTK
WordNetLemmatizer将"US“处理为"u”
python
、
nltk
、
lemmatization
如果您将单词"US" (美国)从package
nltk
.stem输入到WordNetLemmatizer中,
在
经过预处理(变成"us",即小写)之后,它将被翻译为"u"。becomes "us"print(lemma) # prints "u" 我甚至尝试过
使用
词性
标签
来对这个词进行
词汇
化
,这会根据
nltk
浏览 7
提问于2019-02-20
得票数 2
回答已采纳
1
回答
使用
WordNetLemmatizer.lemmatize()和
pos
_tags抛出KeyError
python
、
text
、
nlp
、
nltk
、
lemmatization
我刚刚读到,当
pos
_tags帮助时,柠檬
化
效果最好。因此,我遵循了下面的代码,但为计算
的
KeyError获取了
POS
_tags。下面是代码 x['Phrase']=x['Phrase'].transform(lambda value:value.lower())x['Phrase']=x['Phrase'].transform(lambda va
浏览 0
提问于2020-05-24
得票数 0
回答已采纳
2
回答
用
NLTK
对词性标注
的
词进行词性标注?
python
、
nlp
、
nltk
我已经用
nltk
.
pos
_tag()标记了一些单词,所以它们被赋予了treebank
标签
。我想
使用
已知
的
POS
标签
来列举这些单词,但我不确定如何
使用
。我正在看
Wordnet
词法分析器,但我不确定如何将treebank
POS
标记转换为词法分析器接受
的
标记。我如何简单地执行这个转换,或者有没有
使用
树库
标签
的
词汇
化
浏览 1
提问于2011-03-20
得票数 17
1
回答
如何加快自然语言处理中停用词去除和
词汇
化
的
计算速度
python
、
pandas
、
performance
、
nlp
作为文本分类模型预处理
的
一部分,我
使用
NLTK
库添加了停用词删除和
词汇
化
步骤。set(stopwords.words('english'))from
nltk
.corpus import
wordnet
(word): """Map
POS
tag to first character lemmat
浏览 14
提问于2021-10-12
得票数 0
1
回答
在
Pyspark
的
列上应用UDF时遇到
的
问题
pyspark
、
nlp
、
databricks
、
lemmatization
我
的
目标是清理
Pyspark
中列中
的
数据。我写了一个清洁
的
函数。(string): a=[wl.lemmatizeram bheem buddy like run get well weekend 然而,当我尝试将此函数应用于
pyspark
中
的
列时,finalpreproces
浏览 12
提问于2022-08-03
得票数 0
回答已采纳
1
回答
在
输出中只给出一行
的
Pos
标记词法
nlp
、
nltk
、
lemmatization
在
标记
化
数据
上
使用
Pos
标签
,它将变成word,
pos
_tag
的
形式。当传递相同
的
词法时,只有第一个值是词法。具有两列
的
数据帧- ID Text 1 'Lemmatization) #Treebank to
Wordne
浏览 11
提问于2019-04-16
得票数 0
1
回答
如何在
Pyspark
dataframe
中
使用
POS
标签
执行
词汇
化
(不
使用
Pandas)
pyspark
、
nltk
、
lemmatization
如何在
Pyspark
dataframe
中
使用
POS
标签
执行
词汇
化
(不
使用
Pandas) 我对
pyspark
和尝试词性标注
的
词汇
化
是个新手。我
的
数据是表格格式
的
。将列作为文本
的
。我已经清理了文本,但无法
使用
词性对标记进行词法分类。
浏览 14
提问于2019-06-06
得票数 0
2
回答
多语言
NLTK
,用于词性标记和词法分析
python
、
nlp
、
nltk
、
pos-tagger
、
lemmatization
最近,我接触了自然语言处理,尝试
使用
和来分析文本。我想开发一个应用程序,分析旅行者
的
评论,因此我必须管理许多用不同语言编写
的
文本。我需要做两个主要
的
操作:
POS
标签
和
词汇
化
。我已经看到,
在
NLTK
中,有可能为句子标记
化
选择正确
的
语言,如下所示: tokenizer =
nltk
.data.load('tokenizers/punkt/
浏览 3
提问于2015-09-23
得票数 14
2
回答
wordnet
词法分析器
的
问题
python
、
wordnet
我试过
wordnet
lemmatizer,但我发现像“学习”或“等待”这样
的
常用词没有得到适当
的
处理。 我是不是遗漏了什么?
浏览 0
提问于2010-06-09
得票数 0
回答已采纳
1
回答
Nltk
lemmatizers不识别化学名称
的
复数形式
python
、
nlp
、
nltk
、
lemmatization
所以,我必须承认,我完全是nlp
的
新手,我对
nltk
一无所知,我只是试图
使用
上一位开发人员留下
的
遗留代码。我需要对大部分来自化学和生物技术出版物
的
词语进行
词汇
化
。我通常
使用
WordNetLemmatizer。大多数情况下,它都是有效
的
。from
nltk
.stem import WordNetLemmatizerlemmatizer.lemmatiz
浏览 5
提问于2020-03-24
得票数 0
1
回答
使用
spacy和
nltk
的
单词
词汇
化
没有给出正确
的
引理
python-3.x
、
lemmatization
我想要得到下面列表中单词
的
词汇
化
: (例如) words = ['Funnier','Funniest','mightiest','tighter'] 当我做spacy时, import spacybiggify']for items in doc:F
浏览 12
提问于2019-09-27
得票数 0
回答已采纳
1
回答
NLTK
分类与列表理解
python
、
nltk
、
wordnet
如何验证我在这个列表理解中是否正确地
使用
了
NLTK
调词器,特别是它是否考虑了
POS
标签
?))))我正在
使用
我
在
Stackoverflow
上
找到
的
转换器从树库切换到
Wordnet
令牌,它工作得很好。我
的
问题是,对于lemmatized_tokens来说,狐猴实际
上
是同时考虑了单词和(w,t)元组
的
标记,还是仅仅是在看w并在此基础上进行符号
化
(假设一
浏览 1
提问于2016-08-17
得票数 2
回答已采纳
1
回答
python中
的
wordet synset
python
、
python-2.7
、
nltk
、
wordnet
我
在
代码中
使用
了
wordnet
.synset()函数>>> cb>>> tagged =
nltk
.
pos<
浏览 2
提问于2013-03-31
得票数 0
回答已采纳
1
回答
如何为
nltk
狐猴提供(或生成)标记
python
、
nltk
、
stemming
、
lemmatization
我有一组文件,我想把它们转换成这样
的
形式,这样我就可以用这些文档中
的
单词来计数tfidf (这样,每个文档都用tfidf-数字
的
向量表示)。然后,我读到,我应该提供一个提示
的
狐猴-
标签
代表一种类型
的
单词-无论是名词,动词,形容词,等等。 我
的
问题是-我怎么拿到这些
标签
?我该怎么处理这些文件才能拿到这个?我用
的
是python3.4,而且我一次用一个词来修饰+词干。我尝试了WordNetLemmatizer,EnglishStemmer来
浏览 1
提问于2016-11-12
得票数 2
回答已采纳
1
回答
NLTK
:柠檬和
pos
_tag
python
、
nltk
、
lemmatization
我正在
使用
WordNetLemmatizer,并需要
pos
_tag作为每个令牌,以避免出现这样
的
问题:爱->引理=爱和爱->引理=爱.我认为默认
的
WordNetLemmatizer
POS
-标记是n (=Noun),但是如何
使用
pos
_tag呢?我认为预期
的
WordNetLemmatizer
POS
标签
与我得到
的
pos
_tag不同。在这一行中,我认为word_
p
浏览 3
提问于2016-03-08
得票数 3
回答已采纳
1
回答
将平均感知器
POS
转换为
WordNet
POS
避免元组错误
python
、
python-3.x
、
nlp
、
nltk
、
pos-tagger
我有用
NLTK
的
平均感知器标记
POS
的
代码:from
nltk
.stem import WordNetLemmatizer我尝试过用代码循环遍历每个标记标记,并
使用
WordNet
柠檬池对其进行符号
化
:for w in tokensPOS:
浏览 5
提问于2017-06-28
得票数 1
回答已采纳
3
回答
NLTK
WordNet
词法分析器:它不应该将一个单词
的
所有词形变化都
词汇
化
吗?
python
、
nlp
、
nltk
我正在
使用
NLTK
WordNet
Lemmatizer进行词性标注项目,首先将训练语料库中
的
每个单词修改为其词干(就地修改),然后仅在新语料库上进行训练。然而,我发现lemmatizer并没有像我预期
的
那样起作用。 例如,单词loves被
词汇
化为love,这是正确
的
,但是即使
在
词汇
化
之后,单词loving仍然是loving。这里
的
loving和句子中
的
"I'm
浏览 44
提问于2014-08-28
得票数 38
回答已采纳
2
回答
无法
在
AWS EMR上下载
nltk
语料库,I/O操作
在
关闭
的
文件
上
python
、
amazon-web-services
、
nltk
、
amazon-emr
并
使用
import
nltk
导入
nltk
。有什么我应该试着调试
的
吗?我尝试过
在
引导脚本中安装它,它可以正确地安装。pip install
nltk
但是当我尝试
使用
它时,我仍然会发现这个错误。(resource_not_found)更新 我找到了
wo
浏览 4
提问于2019-12-17
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
WordNet及其Python应用
Python NLP入门教程
10个常用的NLP库
知识图谱之WordNet
神级程序员花了三个礼拜来整理的资料!带来Python NLP入门教程!
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券