腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
从
文本
生成
搭配
python
、
nlp
、
nltk
我是NLP的新手,正在阅读一篇关于
搭配
的文章。下面是使用nltk
从
文本
生成
搭配
的代码片段。在实现代码时,我得到了下面分享的错误。我不能明白我做错了什么。
浏览 24
提问于2020-12-19
得票数 0
1
回答
从
文档中提取单个KeyWord
python
、
machine-learning
、
nlp
、
nltk
我希望
从
用户推文等小
文本
生成
关键字。我已经检查过这些链接了。 问题是他们使用二元语法或三元语法
搭配
,因此他们只找到多个单词的关键短语。我希望找到一个关键字作为主题。我应该
如何
修改它们?
浏览 1
提问于2013-04-15
得票数 1
1
回答
Python :查找没有点分隔词的
搭配
python
、
nltk
我试图通过使用内置方法在
文本
中查找与NLTK的
搭配
。', 'foo', '5'] # test. footokenizationNot中的在句子边框上查找
搭配
()?所以在这个例子中,它根本不应该打印任何
搭配
,但是我想你可以想象更复杂的
文本
,在句子中也有
搭配
。我可以猜到我
浏览 4
提问于2012-02-05
得票数 6
回答已采纳
3
回答
带有频率的Ngram的Python列表
python
、
nltk
、
scikit-learn
我需要从
文本
中获取最流行的ngram。Ngram长度必须介于1到5个单词之间。我能用nltk/scikit做到这一点吗?我需要从一个
文本
中获得不同长度的ngram组合? 例如,使
浏览 85
提问于2012-08-02
得票数 16
回答已采纳
1
回答
什么是适合我的?generateAllGrams()或generateCollocations()对我来说足够了吗?
mahout
、
summarization
我正在开发一个基于wordnet的文档summarizer.in项目,我需要这个项目来提取
搭配
。在浏览网页的时候,我发现了这个:最重要的是
如何
使用它?
如何
使用?源
浏览 2
提问于2011-03-14
得票数 0
1
回答
使用
搭配
进行NLTK标记化
python
、
nltk
我正在使用NLTK,并希望根据
搭配
对
文本
进行标记化:例如,"New York“应该是一个单一的标记,而天真的标记化会将"New”和"York“分开。我知道
如何
找到
搭配
和
如何
标记化,但找不到
如何
将两者结合起来…… 谢谢。
浏览 0
提问于2014-05-06
得票数 2
1
回答
在斯坦福POS标记器中识别
搭配
?
nlp
、
stanford-nlp
斯坦福大学的词性标记器能够检测
搭配
吗?如果是这样,我该
如何
使用它?这意味着我必须将单词“归入”实体和
搭配
中,对吗?如果是这样,我
如何
从
标记器中找到
搭配
? 我避免了使用解析器的需要。
浏览 2
提问于2010-07-06
得票数 1
回答已采纳
1
回答
AttributeError:'FreqDist‘对象没有属性'viewitems’
python
、
attributes
、
nltk
、
attributeerror
我正在根据教程
生成
基于PMI的大写图。我想得到
文本
中
生成
的大写的频率。在这里建议使用 import stringimport nltk from nltk.collocations或者在使用
搭配
时是否有其他的方法来获得频率?
浏览 0
提问于2018-12-06
得票数 1
1
回答
学习:不要使用一些单词作为一个词的特征,而是在
搭配
中使用。
python
、
scikit-learn
、
text-classification
我正在使用Python和scikit进行
文本
分类--学习。 现在,我使用TfidfVectorizer作为向量器(用于将原始
文本
转换为特征向量),使用MultinomialNB作为分类器。我看到,在集信息最多的特性中,我有单词( ngram=1),它对分类没有影响,但是在bigram (单词
搭配
)中,它们会产生很大的影响。所以,我不能使用stop_words,因为Tfidfvectorizer不会在
搭配
中考虑这个词,也不能以同样的理由使用预处理器。问:
如何
排除tfidfvectorizer中的一些单词,但
浏览 3
提问于2014-07-22
得票数 1
回答已采纳
1
回答
从
Lucene索引中提取
搭配
词
solr
、
lucene
、
text-analysis
我需要从索引中提取所有
搭配
词及其频率。我知道有各种算法可以检测给定文档中的
搭配
,但我不知道有什么现成的库可以专门用Lucene来完成这项任务。有谁知道图书馆吗?我知道
如何
从
lucene索引中仅提取二元语法,但并不是所有的二元语法都是
搭配
词。
浏览 1
提问于2014-02-06
得票数 0
5
回答
如何
在
文本
中查找
搭配
python
、
sorting
、
find
如何
在
文本
中找到
搭配
?
搭配
是一系列经常出现在一起的单词。python内置了返回单词对的函数二元语法。
浏览 7
提问于2010-11-09
得票数 5
回答已采纳
2
回答
为什么在使用Python的wordcloud库时,停止单词不被排除在单词云之外?
python
、
nlp
、
word-cloud
、
stop-words
STOPWORDS.add('They')然后我跑了:我正在运行python版本3.7.3 我知道我可以在运行wordcloud之前修改
文本
输入以删除
浏览 13
提问于2020-05-22
得票数 3
回答已采纳
1
回答
从
文本
语料库中提取给定单词的
搭配
- Python
python
、
nltk
、
n-gram
、
collocation
、
log-likelihood
我正在尝试找出
如何
从
文本
中提取特定单词的
搭配
。例如:在整个
文本
语料库中,哪些单词与单词"hobbit“具有统计意义的
搭配
?我期望得到一个类似于单词列表(
搭配
)或元组(我的单词+其
搭配
)的结果。我知道
如何
使用nltk制作二元和三元语法,也知道
如何
只选择包含我感兴趣的单词的二元或三元语法。我使用以下代码(改编自)。但我并不是真的想只
从
三元组列表中选择单词。我想要在我选择的窗口中进行所有可能的N
浏览 10
提问于2017-08-17
得票数 1
1
回答
Apache中亲和力
搭配
的工作
gridgain
、
ignite
如果我有以下3个表(这里的数值是整数值),而在table_1_key中,我在companyId上有关联
搭配
。那么亲和
搭配
是
如何
发生的呢?表1的条目将与表2条目或表3条目
搭配
(因为两个表都有整数值为1到10的列)?_key --> {company_name, companyId(1-10 numeric value)} has 10 entries 在其他情况下,如果我们假设female_personId范围
从
1-10变为1-5,那么亲和
搭配
将
如何
发生?
浏览 2
提问于2016-10-06
得票数 0
回答已采纳
1
回答
从
文本
/句子中提取
搭配
词
r
、
collocation
我确实怀疑sub()将是有用的和正则表达式,但不知道(确切地)
如何
组装查询。怎么做呢?
浏览 1
提问于2018-04-25
得票数 0
回答已采纳
2
回答
从小
文本
内容(如tweet)
生成
标签
twitter
、
nlp
、
text-extraction
、
nltk
、
text-analysis
我之前已经问过了,但我没有指出我有很大的限制:我正在处理一些小的
文本
集,比如用户推文来
生成
标签(关键字)。问候
浏览 0
提问于2010-05-04
得票数 15
回答已采纳
1
回答
如何
使用Python识别单个字符之间的
搭配
?
python
、
string
、
nlp
、
nltk
、
linguistics
我想用NLTK来识别日语汉字和汉语汉字之间的
搭配
。与词语
搭配
一样,一些汉字序列比其他序列更容易出现。例:汉语和日语中的许多单词都是两个字符的双字形-A和B(例如:A和B)。日本=日本,日文为尼汉,中文为里本.给定字符A (日),本更有可能以字符B的形式出现,因此字符日和本是
搭配
的。(1)给定字符A,哪些字符最有可能是字符B?相关地:如果我有一个汉字/汉字的频率列表,我可以强迫NLTK
搭配
模块只检查我列表中的汉字/汉字之间的关系,而忽略所有其他字符吗?这将过滤掉单个
浏览 2
提问于2017-04-23
得票数 7
2
回答
Regex匹配词,然后向后看,直到另一个单词,然后抓住两者之间的一切。
python
、
regex
以下是一个
文本
示例: 根据我的研究,下面的工作应该是可行的,但后面的工作是行不通的。而不是我想要的:“
搭配
红色面料衬里”
浏览 2
提问于2017-03-02
得票数 0
回答已采纳
1
回答
异种亲和力-
搭配
是
如何
运作的?
ignite
我正在阅读,但我并没有很好地了解亲和力
搭配
是
如何
工作的或它的行为。
从
亲和类定义中,它只定义要与之
搭配
的affKey,但它没有指定拥有此affKey的缓存
浏览 1
提问于2016-12-12
得票数 0
回答已采纳
2
回答
是否有机会手动重新安排执行计划?
sql
、
performance
、
tsql
、
sql-server-2012
、
sql-execution-plan
我有两张桌子, 现在来看一下查询的下面的查询和执行计划。 FROM dbo.Need N ON nc.NeedId = n.NeedId AND CategoryId= 2 ORDER B
浏览 0
提问于2014-11-27
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谷歌推出 MusicLM,从文本生成音乐的模型
从零基础开始:教你如何使用Shap-E,从文本生成模型到3D打印
如何用 Python 从海量文本抽取主题?
使用 ChatGPT AI 从英文文本生成 Linux 命令|Linux 中国
BigDL 教程:使用 Stable Diffusion 从文本生成你自己的图像
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券