腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
NLTK
/
pyNLTK
可以
“每种
语言
”(
即
非
英语
)
工作
吗?
python
、
nlp
、
nltk
我
如何
告诉
NLTK
以特定的
语言
处理文本? 偶尔,我会编写一个专门的NLP例程,在
非
英语
(但仍然是印度-欧洲)文本域上进行词性标记、标记化等操作。
浏览 2
提问于2009-11-25
得票数 10
回答已采纳
1
回答
用于
非
英语
语言
的基于Python的标记器
nltk
、
tokenize
、
spacy
Scikit learn默认支持
英语
laungauge的标记化。我们还希望添加对
非
英语
语言
(西班牙语、法语、德语、意大利语、日语、土耳其语)的支持。我正在寻找一个python库,支持上述
语言
。我遇到了SpaCy和
NLTK
,但我正在寻找是否还有其他的python库,
以及
是否有基准测试、内存使用、准确性、对多
语言
的支持、稳定性和社区支持方面的比较图表。我找到了这个,但我想知道是否有人也对其他python库做了一些研究,并有类似的比较图表,以便它有助于我为我
浏览 17
提问于2020-05-09
得票数 0
2
回答
多
语言
NLTK
,用于词性标记和词法分析
python
、
nlp
、
nltk
、
pos-tagger
、
lemmatization
最近,我接触了自然
语言
处理,尝试使用和来分析文本。我想开发一个应用程序,分析旅行者的评论,因此我必须管理许多用不同
语言
编写的文本。我需要做两个主要的操作: POS标签和词汇化。我已经看到,在
NLTK
中,有可能为句子标记化选择正确的
语言
,如下所示: tokenizer =
nltk
.data.load('tokenizers/punkt/PY3/italian.pickle')我还没有找到正确的方法来设置不同
语言
的POS标签和Lemmati
浏览 3
提问于2015-09-23
得票数 14
8
回答
python网站
语言
检测
python
、
scrapy
、
web-crawler
、
language-detection
我正在写一个机器人,
可以
检查数以千计的网站,无论他们是
英语
或不是。有人能给我推荐一下检查网站
语言
的最好方法吗?
浏览 1
提问于2012-07-16
得票数 5
回答已采纳
1
回答
如何
在
NLTK
中向Stopword添加更多
语言
?
python
、
nlp
、
nltk
、
stop-words
我使用带有秒词的
NLTK
来使用的Alejandro描述的方法来检测文档的
语言
,而且它
工作
得相当好。我还使用了一些未包含在
NLTK
塞字包中的其他
语言
,如捷克语和罗马尼亚语,它们与其他
语言
一样得到错误匹配。这些是断句中的
语言
:
如何
扩展
NLTK
支持的<em
浏览 1
提问于2014-01-26
得票数 12
回答已采纳
1
回答
西欧
语言
的非独码数据的sql排序规则排序
sql
、
sql-server
、
collation
我使用默认排序规则运行SQL server2014,
即
SQL_Latin1_General_CP1_CI_AS。我需要帮助来理解对列出的
语言
进行排序是否
可以
很好地使用默认排序规则,或者我会遇到什么样的问题?
浏览 0
提问于2016-10-24
得票数 1
4
回答
如何
使用Python计算段落中
英语
单词的百分比
python
、
character
、
word-count
假设我有一个段落,里面有不同的
语言
。像这样: This is paragraph in English. 这是在英国段。Это пункт на английском языке.我想计算一下这个段落中包含
英语
单词的百分比(%)。因此,我想问一下在python中
如何
做到这一点。
浏览 6
提问于2014-07-29
得票数 2
回答已采纳
1
回答
使用Voiceover进行Web可访问性
语言
检测
html
、
web
、
accessibility
、
voiceover
、
web-accessibility
Voiceover
如何
检测
语言
,
以及
如何
让它在整个网站中“说”相同的
语言
? 我的电脑是英文的,我在一个提供各种本地化的网站上
工作
。Voiceover
可以
很好地读取当前本地(
非
英语
)中的<p>或<span>元素,但当我关注<button>元素时,它无法检测
语言
并读取所有的
英语
内容,这没有任何意义,因为文本不是
英语
的。这就是画外音的
工作</e
浏览 17
提问于2020-12-23
得票数 3
回答已采纳
2
回答
PHP
如何
从字符串中删除非
语言
字符?
php
、
regex
、
string
、
preg-replace
如何
删除所有
非
语言
字符?preg_replace("/[^a-z0-9A-Z\-\'\|\!\.\?\:\)\(\;\*\"]/u", " ", $text );有没有什么字符串函数
可以
用来保留所有的
浏览 2
提问于2012-01-25
得票数 1
回答已采纳
1
回答
ITEXT :用PDF格式写
非
英语
字符
spring
、
pdf
、
unicode
、
fonts
、
itext
嗨,我在spring应用程序中使用itext (5.5.6)创建PDF,动态内容
可以
是多种
语言
(我的应用程序支持33种
语言
)。 ,Q1.,我检查了一些其他的答案,它们说新的字体可能不支持这些
语言
。但是,如果这是真的,
如何
将
非
英语
内
浏览 4
提问于2017-06-19
得票数 1
1
回答
基于机器学习算法的词分类
machine-learning
、
nltk
、
svm
、
naivebayes
、
nltk-trainer
让我更具体地说,关于输入一些词,我需要检查这些词是否属于一种被称为“马来语”的
语言
。这些是用
英语
表达的马来语单词。
浏览 7
提问于2017-09-24
得票数 0
回答已采纳
1
回答
JavaFX -获取
非
ASCII字符的KeyEvent
java
、
javafx
、
keyboard-events
、
scalafx
无论当前的键盘布局(
语言
)
如何
,这些命令都应该
工作
。例如,用户可能正在输入泰语(ภาษา),然后要通过
按
'Escape‘和want 'S’(或:‘然后再按'w',vim样式)保存。我发现KeyEvents为
非
英语
(
非
ASCII?)提供了未定义的密钥代码。人物。+ Shift switches from English to Hebrewtext: ש code name:
浏览 4
提问于2014-10-15
得票数 1
2
回答
未登录词和已知词的词性
nlp
、
stanford-nlp
、
oov
有没有什么工具
可以
预测单词的词性标注..
浏览 4
提问于2013-05-20
得票数 0
6
回答
如何
标记马来语单词?
python
、
unicode
、
nltk
ഇതുഒരുസ്ടലംമാണ് 这是一个Unicode字符串,意思是
nltk
.wordpunct_tokenize('ഇതുഒരുസ്ഥാലമാണ്'.decode('utf8'))也不适用于其他示例 "കണ്ടില്ല " = കണ
浏览 2
提问于2013-10-22
得票数 17
1
回答
如何
在多
语言
Drupal7网站的
语言
切换器菜单中只显示未选择的
语言
?
drupal
、
hide
、
multilingual
、
language-switching
我正在使用Drupal7构建一个法语和
英语
的多
语言
网站。我使用国际化和实体翻译模块来翻译页面中的内容和块。我已经有一个正常
工作
的
语言
切换块了。(如果我使用的是
英语
浏览 5
提问于2013-07-31
得票数 0
1
回答
没有
语言
部分的多
语言
uri
php
、
codeigniter
、
codeigniter-2
、
multilingual
、
codeigniter-url
我已经搜索了很多,并在CI的多
语言
URL上找到了更多的主题。但是大多数的答案已经不再
工作
的链接到CI维基,或没有解释一点我想要什么。
英语
uri - example.com/blog
浏览 0
提问于2014-08-10
得票数 0
1
回答
用不同的本地(没有
英语
)解析JSON字符串
ios
在JSON字符串下面,我面临问题解析,因为它包含
非
英语
本地
语言
: error:&error]; 如果只使用
英语
,它
可以
正常
工作
,我
浏览 4
提问于2012-03-31
得票数 1
回答已采纳
2
回答
如何
确保Excel不更改其他
语言
版本中数据标签的数字格式?
excel
、
vba
、
number-formatting
我有一个带有VBA代码的
工作
簿,它为水平条形图中的数据标签指定一个数字格式。当
工作
簿以
英语
以外的
语言
在另一份Excel (O365)副本中打开时,Excel似乎插入了一个
可以
看到 (
即
0\.0)的反斜杠。输出应该在哪里,例如3.7、 0.4。当我在
工作
簿被
非
英语
Excel访问后加载它时,问题仍然存在--我的版本不会丢弃反斜杠。当我删除反斜杠时,这个问题就消失了,并且输出也和预期的一样。当
工作
簿以不同的
语言</
浏览 2
提问于2018-10-17
得票数 3
回答已采纳
2
回答
将TextView的文本设置为来自JSON响应的
非
英语
文本
android
、
textview
我从服务器呼叫中得到了(Foursquare)场地的名称,返回的场地名称
可以
是
英语
的,也
可以
是非
英语
的。{...:然而,对于阿拉伯名字,我发现在原始JSON对象中加入阿拉伯字符(应该是这样),应用程序中显示的字符(
即
TextView中的字符)是不相交的。(我对其他
语言
不太熟悉,所以不能真正判断它们是否也表现得不正确。) 为了正确地从JSON对象中提取
非
英语</em
浏览 1
提问于2012-03-13
得票数 0
4
回答
使用
NLTK
创建新的语料库
python
、
nlp
、
nltk
、
corpus
我有一堆.txt文件,我希望能够使用
NLTK
为语料库
nltk
_data提供的语料库功能。我已经尝试过PlaintextCorpusReader,但是我不能做得更深入:>>>from
nltk
.corpus import PlaintextCorpusReader>>>corpus_root = './' >>>newcorpus = PlaintextCorpusReader(corpus_
浏览 1
提问于2011-02-10
得票数 86
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券