NLTK和语言检测

文章/答案/技术大牛

发布

4回答

python、nlp、nltk、detection

如何使用NLTK检测文本是用哪种语言编写的？我见过的示例使用nltk.detect，但是当我在我的mac上安装它时，我找不到这个包。

浏览 0提问于2010-07-06得票数 37

回答已采纳

8回答

python网站语言检测

python、scrapy、web-crawler、language-detection

我使用Scrapy (python 2.7框架)来抓取每个网站的第一页，任何帮助都将不胜感激。

浏览 1提问于2012-07-16得票数 5

回答已采纳

1回答

如何在NLTK中向Stopword添加更多语言？

python、nlp、nltk、stop-words

我使用带有秒词的NLTK来使用的Alejandro描述的方法来检测文档的语言，而且它工作得相当好。我还使用了一些未包含在NLTK塞字包中的其他语言，如捷克语和罗马尼亚语，它们与其他语言一样得到错误匹配。这些是断句中的语言：如何扩展NLTK支持的语言列

浏览 1提问于2014-01-26得票数 12

回答已采纳

1回答

Apache Open NLP与NLTK

architecture、nlp、nltk、opennlp

我们有一个与Node.js和socket.io聊天应用集成的spring引导应用程序，我们希望将自然语言处理集成到这个应用程序中。对于我们来说，对于这两个Apache-OpenNlp or NLTK中的哪一个不确定方向是一个更好的选择，因为这两个框架都提供了我们需要的处理类型。 Wrt对框架提供的特性来说，它们都是好的。

浏览 4提问于2017-10-30得票数 4

回答已采纳

2回答

Spacy - NLTK:语言检测

nltk、spacy

然而，我在问自己，Spacy/NLTK是否会自动检测它必须为每个帖子使用哪种语言的词干/停用词等(取决于它是英语帖子还是西班牙语帖子)？目前，我只是将每个帖子解析为词干分析器，而没有明确指定语言。pip install nltkfrom nltk import SnowballStemmerfromnltk.stem.p

浏览 39提问于2020-03-24得票数 0

1回答

如何使用Python通过文本的标题检测文本的语言(.csv)？

python、text、nlp、nltk

为了研究目的，我应该：我试着用Python和它的库NLTK来做第2和第3点，如果你做过类似的事情，你能给我一些提示吗？提前谢谢你！

浏览 0提问于2020-05-18得票数 3

1回答

英国英语和美国英语的Python NLP差异

python、nlp、stanford-nlp、spacy

目前，我正在使用nlp和python进行一个项目。我有内容，需要找到语言。我在用空间探测语言。图书馆只提供英语语言。我想知道它是英国英语还是美国英语？有什么建议吗？我试过Spacy，NLTK，lang-检测。但是这个图书馆只提供英语。但我需要在英国和美国分别显示为en-GB和en-US。

浏览 2提问于2019-10-01得票数 0

回答已采纳

9回答

NLTK:设置代理服务器

python、nltk、proxy-server

我正在尝试学习 -用Python语言编写的自然语言工具包，我想安装一个样本数据集来运行一些示例。我的web连接使用代理服务器，我尝试按如下方式指定代理地址：>>> nltk.download()Traceback (most rece

浏览 14提问于2012-12-17得票数 18

回答已采纳

1回答

csv文件文本分析软件

open-source、data-analysis、csv

我有一个csv与数千(+5k行)关于评论的条目。每一行都是对某一特定主题的评论。有任何开源软件可以帮助这类事情吗？

浏览 0提问于2017-03-30得票数 1

回答已采纳

1回答

如何在python中检测句子的语言

python、pandas、nlp

我正在尝试检测python中一个句子的语言。我尝试了'langdetect‘和'nltk word corpus’，但没有给出预期的结果:我的示例df是： df = pd.DataFrame({'text': ['Auxiliar Director

浏览 4提问于2021-09-12得票数 0

1回答

是否有任何基于.NET的使用英语的框架？

frameworks、human-factors

我正在编写一个web应用程序，在这个应用程序中我需要分析单词(现在只是用英语，但将来可能在任何语言中)。我试图编写一个框架来完成这项工作，但很快就证明了这是一件非常困难的事情。是否有任何框架(最好与.NET或PHP兼容)可用于使用人类语言(例如英语)？

浏览 0提问于2011-08-26得票数 4

1回答

俄语自然语言处理

neural-network、artificial-intelligence

我正在寻找能处理自然俄语的图书馆(Es)或服务(S)：识别和提取单词的组合：“=>”Онистроилижелезнуюдорогу

浏览 0提问于2018-09-01得票数 1

1回答

(无nltk)

java、python、ubuntu、stanford-nlp、linguistics

我试图在Ubuntu18.04.3上安装Stanford ，完全没有安装NLTK包，但我不确定它是如何安装的，以便能够与Java或Python一起使用。我已经下载了完整的软件包和我需要的语言从官方网站斯坦福分析器 ]。因此，我还安装了Java和Java，但我无法检测到Stanford。我是新来的。*--

浏览 0提问于2019-09-02得票数 0

回答已采纳

1回答

在Python中优化语言检测代码和词汇化

python、pandas、nltk、lemmatization、textblob

这里我有两个问题： from nltk import pos_tag overall reviewText

浏览 11提问于2018-02-08得票数 0

回答已采纳

1回答

如何避免NLTK的句子符号在缩略语上分裂？

python、nlp、nltk、tokenize

我目前正在使用NLTK进行语言处理，但我遇到了语句标记的问题。from nltk.tokenize.punkt import PunktSentenceTokenizer, PunktParametersimport nltk nl

浏览 4提问于2016-01-15得票数 16

回答已采纳

1回答

Python KeyError：'‘用于自动语言检测

python

我正在使用停用词在python中进行自动语言检测import nltk dictiolist={}FREElanguages dictiolist[lang]=stopwords.words(lang) tokens=nltk<

浏览 0提问于2013-04-24得票数 0

回答已采纳

2回答

Python中的NLTK语言检测代码

python、parsing、natural-language-processing

import nltkimport reNON_ENGLISH_STOPWORDS = set(nltk.corpus.stopwords.words()) - ENGLISH_STOPWORDS STOPWORDS_DICT= {lang: set(nltk.corpus.stopwords.word

浏览 0提问于2012-07-28得票数 2

1回答

可用于单词标记化和句子标记化的NLTK语言

nlp、nltk、multilingual、tokenize、nltk-book

我需要理解哪些语言可以在NLTK中进行标记化。我想我需要用这样的语言：lang = "WHATEVER_LANGUAGE"text = "something in some specified whatever language" tokenizer.tokenize(text

浏览 10提问于2022-01-31得票数 0

3回答

一种算法能从不同自然语言的文本中提取关键词吗？

data-mining、nlp、algorithms

我是新的实践NLP和大多数相关的话题，但我想做一个程序，可以收集和提取数据为我自己。具体来说，我想告诉节目“我想要更多关于这个话题的信息(例如心脏病发作)”，然后该节目将从www周围找到、收集和摘取关于这个主题的有意义的文本。例如，" are“和" and”都是英语中的停止词，在挪威语中是主语。还可能出现其他挑战。所以我的问题是:我是否需要为每一种自然语言创建单独的算法来进行解释？

浏览 0提问于2015-06-03得票数 4

点击加载更多