腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
4
回答
NLTK
和
语言
检测
python
、
nlp
、
nltk
、
detection
如何使用
NLTK
检测
文本是用哪种
语言
编写的? 我见过的示例使用
nltk
.detect,但是当我在我的mac上安装它时,我找不到这个包。
浏览 0
提问于2010-07-06
得票数 37
回答已采纳
8
回答
python网站
语言
检测
python
、
scrapy
、
web-crawler
、
language-detection
我使用Scrapy (python 2.7框架)来抓取每个网站的第一页,任何帮助都将不胜感激。
浏览 1
提问于2012-07-16
得票数 5
回答已采纳
1
回答
如何在
NLTK
中向Stopword添加更多
语言
?
python
、
nlp
、
nltk
、
stop-words
我使用带有秒词的
NLTK
来使用的Alejandro描述的方法来
检测
文档的
语言
,而且它工作得相当好。我还使用了一些未包含在
NLTK
塞字包中的其他
语言
,如捷克语
和
罗马尼亚语,它们与其他
语言
一样得到错误匹配。这些是断句中的
语言
:如何扩展
NLTK
支持的
语言
列
浏览 1
提问于2014-01-26
得票数 12
回答已采纳
1
回答
Apache Open NLP与
NLTK
architecture
、
nlp
、
nltk
、
opennlp
我们有一个与Node.js
和
socket.io聊天应用集成的spring引导应用程序,我们希望将自然
语言
处理集成到这个应用程序中。对于我们来说,对于这两个Apache-OpenNlp or
NLTK
中的哪一个不确定方向是一个更好的选择,因为这两个框架都提供了我们需要的处理类型。 Wrt对框架提供的特性来说,它们都是好的。
浏览 4
提问于2017-10-30
得票数 4
回答已采纳
2
回答
Spacy -
NLTK
:
语言
检测
nltk
、
spacy
然而,我在问自己,Spacy/
NLTK
是否会自动
检测
它必须为每个帖子使用哪种
语言
的词干/停用词等(取决于它是英语帖子还是西班牙语帖子)?目前,我只是将每个帖子解析为词干分析器,而没有明确指定
语言
。pip install
nltk
from
nltk
import SnowballStemmerfrom
nltk
.stem.p
浏览 39
提问于2020-03-24
得票数 0
1
回答
如何使用Python通过文本的标题
检测
文本的
语言
(.csv)?
python
、
text
、
nlp
、
nltk
为了研究目的,我应该:我试着用Python和它的库
NLTK
来做第2
和
第3点,如果你做过类似的事情,你能给我一些提示吗? 提前谢谢你!
浏览 0
提问于2020-05-18
得票数 3
1
回答
英国英语和美国英语的Python NLP差异
python
、
nlp
、
stanford-nlp
、
spacy
目前,我正在使用nlp
和
python进行一个项目。我有内容,需要找到
语言
。我在用空间探测
语言
。图书馆只提供英语
语言
。我想知道它是英国英语还是美国英语?有什么建议吗?我试过Spacy,
NLTK
,lang-
检测
。但是这个图书馆只提供英语。但我需要在英国和美国分别显示为en-GB
和
en-US。
浏览 2
提问于2019-10-01
得票数 0
回答已采纳
9
回答
NLTK
:设置代理服务器
python
、
nltk
、
proxy-server
我正在尝试学习 -用Python
语言
编写的自然
语言
工具包,我想安装一个样本数据集来运行一些示例。我的web连接使用代理服务器,我尝试按如下方式指定代理地址:>>>
nltk
.download()Traceback (most rece
浏览 14
提问于2012-12-17
得票数 18
回答已采纳
1
回答
csv文件文本分析软件
open-source
、
data-analysis
、
csv
我有一个csv与数千(+5k行)关于评论的条目。每一行都是对某一特定主题的评论。有任何开源软件可以帮助这类事情吗?
浏览 0
提问于2017-03-30
得票数 1
回答已采纳
1
回答
如何在python中
检测
句子的
语言
python
、
pandas
、
nlp
我正在尝试
检测
python中一个句子的
语言
。我尝试了'langdetect‘
和
'
nltk
word corpus’,但没有给出预期的结果:我的示例df是: df = pd.DataFrame({'text': ['Auxiliar Director
浏览 4
提问于2021-09-12
得票数 0
1
回答
是否有任何基于.NET的使用英语的框架?
frameworks
、
human-factors
我正在编写一个web应用程序,在这个应用程序中我需要分析单词(现在只是用英语,但将来可能在任何
语言
中)。我试图编写一个框架来完成这项工作,但很快就证明了这是一件非常困难的事情。是否有任何框架(最好与.NET或PHP兼容)可用于使用人类
语言
(例如英语)?
浏览 0
提问于2011-08-26
得票数 4
1
回答
俄语自然
语言
处理
neural-network
、
artificial-intelligence
我正在寻找能处理自然俄语的图书馆(Es)或服务(S):识别
和
提取单词的组合:“=>”Онистроилижелезнуюдорогу
浏览 0
提问于2018-09-01
得票数 1
1
回答
(无
nltk
)
java
、
python
、
ubuntu
、
stanford-nlp
、
linguistics
我试图在Ubuntu18.04.3上安装Stanford ,完全没有安装
NLTK
包,但我不确定它是如何安装的,以便能够与Java或Python一起使用。我已经下载了完整的软件包和我需要的
语言
从官方网站斯坦福分析器 ]。因此,我还安装了Java
和
Java,但我无法
检测
到Stanford。 我是新来的。*--
浏览 0
提问于2019-09-02
得票数 0
回答已采纳
1
回答
在Python中优化
语言
检测
代码
和
词汇化
python
、
pandas
、
nltk
、
lemmatization
、
textblob
这里我有两个问题: from
nltk
import pos_tag overall reviewText
浏览 11
提问于2018-02-08
得票数 0
回答已采纳
1
回答
如何避免
NLTK
的句子符号在缩略语上分裂?
python
、
nlp
、
nltk
、
tokenize
我目前正在使用
NLTK
进行
语言
处理,但我遇到了语句标记的问题。from
nltk
.tokenize.punkt import PunktSentenceTokenizer, PunktParametersimport
nltk
nl
浏览 4
提问于2016-01-15
得票数 16
回答已采纳
1
回答
Python KeyError:'‘用于自动
语言
检测
python
我正在使用停用词在python中进行自动
语言
检测
import
nltk
dictiolist={}FREElanguages dictiolist[lang]=stopwords.words(lang) tokens=
nltk<
浏览 0
提问于2013-04-24
得票数 0
回答已采纳
2
回答
Python中的
NLTK
语言
检测
代码
python
、
parsing
、
natural-language-processing
import
nltk
import reNON_ENGLISH_STOPWORDS = set(
nltk
.corpus.stopwords.words()) - ENGLISH_STOPWORDS STOPWORDS_DICT= {lang: set(
nltk
.corpus.stopwords.word
浏览 0
提问于2012-07-28
得票数 2
1
回答
可用于单词标记化
和
句子标记化的
NLTK
语言
nlp
、
nltk
、
multilingual
、
tokenize
、
nltk-book
我需要理解哪些
语言
可以在
NLTK
中进行标记化。我想我需要用这样的
语言
:lang = "WHATEVER_LANGUAGE"text = "something in some specified whatever language" tokenizer.tokenize(text
浏览 10
提问于2022-01-31
得票数 0
3
回答
一种算法能从不同自然
语言
的文本中提取关键词吗?
data-mining
、
nlp
、
algorithms
我是新的实践NLP
和
大多数相关的话题,但我想做一个程序,可以收集
和
提取数据为我自己。具体来说,我想告诉节目“我想要更多关于这个话题的信息(例如心脏病发作)”,然后该节目将从www周围找到、收集
和
摘取关于这个主题的有意义的文本。例如," are“
和
" and”都是英语中的停止词,在挪威语中是主语。还可能出现其他挑战。 所以我的问题是:我是否需要为每一种自然
语言
创建单独的算法来进行解释?
浏览 0
提问于2015-06-03
得票数 4
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券