腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
可以
从
NLP
ML
管道
中
的
nltk
向
量器
访问
词汇表
吗
?
、
、
、
我
的
管道
看起来像 model = make_pipeline( MultiOutputClassifier这有可能
吗
?
浏览 17
提问于2020-09-29
得票数 0
回答已采纳
7
回答
NLTK
vs斯坦福
NLP
、
、
、
我最近开始使用
NLTK
工具包来创建一些使用Python
的
解决方案。
可以
通过Python使用Stanford
NLP</em
浏览 10
提问于2016-10-13
得票数 29
2
回答
是否有可能导出和使用spaCy NER模型而不使用vocab,并动态地注入令牌/向量?
、
,跳过
词汇表
以节省磁盘空间和内存使用 最后,加载模型以运行某些推断,使用在我
的
管道
中
预先计算过
的
标记和向量,而不是使用模型
词汇表
(标准方法)再次计算。我之所以保存模型而不使用
词汇表
,是因为在我
的
分布式
管道
中
,首先做
的
事情之一是对文本进行标记/矢量化,这样剩下
的
任务就有了这个输入。在继续之前,我想澄清
的
是,在标准
的
方法(保存<
浏览 4
提问于2021-11-23
得票数 2
回答已采纳
2
回答
nlp
.vocab和
nlp
.vocab.strings有什么区别?
、
、
我正在学习
NLP
,我想看看我用spacy下载
的
词汇量。import spacy
nlp
2 = spacy.load('en_core_web_sm')len(
nlp
.vocab)len(
nlp
2.vocab)len(
nlp
.vocab.string
浏览 3
提问于2021-08-21
得票数 1
回答已采纳
1
回答
在人工智能项目中,spacy,
nltk
,prodigy,sklearn在哪里适合?
、
、
、
像spacy、sklearn、prodigy、
nltk
这样
的
工具适用于下面的AI项目体系结构,以及这些项目的一些常见
的
替代方案: 📷
浏览 0
提问于2020-02-07
得票数 0
2
回答
NLP
中
的
单词总数(列表长度)与列表或文件
的
词汇量之间
的
差异?
、
、
、
如何计算在python
中
存储为列表
的
语料库
的
单词和词汇量?这两个术语
的
主要区别是什么? 假设,我使用以下列表。单词总数或列表长度
可以
由len(L1)计算。然而,我有兴趣知道如何计算以下清单
的
词汇表
。
浏览 0
提问于2018-09-25
得票数 0
回答已采纳
1
回答
Spacy -预处理和词汇化需要很长时间
、
、
、
输入文件有大约20,000条记录,每条记录只有很少
的
句子。文件
的
总大小为45MB。我使用
的
是Spacy 2.0.12。import spacy
nlp
= spacy.load('en', disable=['parser', 'tagge
浏览 1
提问于2018-09-19
得票数 0
1
回答
如何在Spacy
中
创建具有多模型
的
NER
管道
、
、
我正试着训练新
的
实体为斯佩西纳。我尝试将我
的
新实体添加到现有的spacy 'en‘模型
中
。然而,这影响了'en'和我
的
新实体
的
预测模型。比如说我把“马”训练成动物实体。用我目前
的
设置,它只识别马。
nlp
= spacy.load('en') hsnlp =
浏览 0
提问于2019-02-24
得票数 15
1
回答
标签,使用自定义
词汇表
(python)
从
自由文本中提取短语?
、
、
、
、
我有一个大约是定制
的
词汇表
。SQL表
中
的
1M行。每一行都有一个UID和一个相应
的
短语,
可以
是多个单词
的
长度。此表很少更改。 我需要标签,提取,块或识别(纳?)根据上面提到
的
自定义
词汇表
,自由文本文档
中
的
实体短语。因此,对于在免费文本中找到
的
短语,我
可以
提取它
的
UID。哪一种
NLP
工具,最好是基于Python
的
工
浏览 1
提问于2015-11-23
得票数 1
6
回答
使用
nltk
从
文本文件中提取所有名词
、
有没有更有效
的
方法来做到这一点?我
的
代码读取文本文件并提取所有名词。import
nltk
lines = File.read() #read all lines if (pos == 'NN' or pos == 'NNP' or pos == &
浏览 7
提问于2015-11-07
得票数 22
回答已采纳
4
回答
用Spacy找到俄语
的
引理(那些没有模型
的
词)
、
import spacydoc =
nlp
(u'Two apples') print(token, token.lemma, token.lemma_)Two 11711838292424000352 two现在我也想对俄语语言做同样
的
事情。但是Spacy没有俄语
的
模型。但是我看到了他们
的
,我认为代
浏览 0
提问于2019-02-04
得票数 6
1
回答
从
非结构化文本中提取带有属性
的
事件
、
、
我正在抓取组织(主要是零售商)
的
网站,我想使用
NLP
从
网站
的
非结构化文本中提取信息。我想做
的
第一件事是在文本
中
识别与贪欲相关
的
事件,例如“商店将从3月3日起关闭”或“不幸
的
是我们不得不永久关闭”。词汇是相当有限
的
,可能涉及几十个(或最多几百个)短语/表达。 我对正则表达式非常熟悉,我认为
可以
使用基于规则
的
方法提取一些事件及其属性(例如日期),特别是使用一个小
词汇表
。然而,
浏览 0
提问于2021-01-26
得票数 2
1
回答
Spark预培训
管道
是否只适用于linux系统?
我正在尝试设置一个简单
的
代码,在其中传递一个数据,并使用johnSnowLabs Spark库提供
的
经过预先训练
的
解释
管道
来测试它。我正在使用anaconda
的
jupyter笔记本,并使用apache安装了。每次我运行应该加载预先训练
的
管道
的
步骤时,它都会抛出一个tensorflow错误。确保Op和内核已在此进程
中
运行
的
二进制文件中注册。请注意,如果您正在从tf.contrib加载使用ops
的
已保存
浏览 0
提问于2019-08-22
得票数 8
回答已采纳
2
回答
用于自然语言处理
的
Java或Python
、
、
我想知道在Java中使用哪个
NLP
库,因为有很多库(LingPipe、GATE、OpenNLP、StandfordNLP)。对于Python,大多数程序员推荐
NLTK
。但是如果我要做一些文本处理或者
从
非结构化数据(仅仅是自由形成
的
纯英语文本)中提取一些有用
的
信息,那么最好
的
选择是什么?Java还是Python?合适
的
图书馆?更新
的
我想做
的
是
从
非结构化数据中提取有用
的
产品信息(例如,用户用不太标准<
浏览 19
提问于2014-04-07
得票数 116
1
回答
如何使用Thinc模型创建自定义spaPcy
管道
组件
、
、
我想在spaCy
中
创建一个自定义
管道
组件,它使用
的
是经过预处理
的
Thinc模型。我希望修改Thinc
的
输出预测,然后将修改后
的
值传回
管道
,即有效地修改ner
管道
组件。 class_value = np.argmax(class_probabilities, axis=1) return doc print(
nlp</em
浏览 2
提问于2022-06-22
得票数 1
回答已采纳
5
回答
使用自定义数据进行
NLTK
命名实体识别
、
、
、
我正在尝试使用
NLTK
从
我
的
文本中提取命名实体。我发现
NLTK
NER对于我
的
目的来说并不是很准确,我也想添加一些我自己
的
标签。我一直在试图找到一种方法来训练我自己
的
NER,但我似乎找不到合适
的
资源。我有几个关于
NLTK
的
问题- 我
可以
使用自己
的
数据在
NLTK
中
训练命名实体识别器
吗
?如果我
可以
使用自己
的
浏览 125
提问于2012-07-05
得票数 48
3
回答
我如何学习*实用
的
*自然语言处理?
、
、
我有一些Java、Pascal、PERL、SQL和R方面的背景知识,并且希望找到一条从这种背景
中
获得自动或半自动
从
文本中提取概念并将结果转化为可进行统计分析(如果需要的话愿意学习新语言)
的
合理
的
最小阻力路径我想我将需要在几千页
的
文本上执行一些
NLP
任务,特别是POS处理、名词短语
的
识别、词义消歧。后者,我相信,可能需要半监督机器学习
的
准确性。我
的
问题是
从
哪里开始学习实用
的
NLP
?
浏览 4
提问于2013-10-05
得票数 0
回答已采纳
2
回答
NLP
情感分析
中
的
TF-下手向量大小法
、
、
、
、
我对
NLP
和情感分析还比较陌生,但我参加了机器学习课程,并且正在创建一个情感分析
NLP
,它将阅读一篇金融文章,并确定总体情绪是好还是坏。 目前,我有一个大约2000篇文章
的
数据集。我
的
问题是,我如何确定这个
词汇表
?我发现
的
一种方法是实现预处理(消除停止词、噪音词、标点符号等)。然后在训练集
的
每一篇文章中使用所有的单词。在这里,您
可以
删除实例很少
的
单词(不重要
的
单词)和有太多实例
的
单词(没有区别的单词
浏览 0
提问于2018-04-17
得票数 2
回答已采纳
1
回答
ImportError:无法
从
'spacy.lang.en‘导入名称'LEMMA_INDEX’
、
、
我试图在spaCy
中
创建一个词汇化程序,但是当我运行我拥有的代码时,这个错误总是弹出。from spacy.lemmatizer import Lemmatizerlemmas = lemmatizer(u'ducks', u'NOUN')我有最新
的</e
浏览 65
提问于2019-11-09
得票数 4
回答已采纳
3
回答
SyntaxNet创建树到根动词
、
、
我是Python和
NLP
世界
的
新手。最近宣布
的
Google
的
Syntaxnet引起了我
的
兴趣。然而,我在理解有关syntaxnet和相关工具(
nltk
等)
的
文档时遇到了很多困难。我偶然发现了"spacy.io“,似乎封装了我想要完成
的
任务: POS标记一个字符串,并将它加载到某种树结构
中
,这样我就
可以
从
根动词开始,遍历这个句子。我使用了syntaxnet/demo.sh,并按照<
浏览 6
提问于2016-05-17
得票数 7
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
10个常用的NLP库
NLP之文本分类:“Tf-Idf、Word2Vec和BERT”三种模型比较
自然语言处理如何快速理解?有这篇文章就够了!
如何快速理解?有这篇文章就够了!
最佳NLP工具、库和服务推荐
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券