腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
Pandas
Series
创建
Python
Spacy
NLP
对象
的
最佳
方法
python
、
pandas
、
vectorization
、
spacy
我想从存储在
Pandas
数据框列中
的
25万字符串
对象
中
创建
Spacy
nlp
对象
。有没有办法优化下面的“应用”
方法
,也就是说,有没有办法向量化
spacy
nlp
对象
的
调用?import
pandas
as pd
nlp
=
spacy
.load("en_core_web_s
浏览 18
提问于2020-07-23
得票数 1
回答已采纳
2
回答
熊猫UDF (PySpark) -错误类型错误
pandas
、
apache-spark
、
pyspark
、
user-defined-functions
、
spacy
我正在尝试使用
spaCy
和
Pandas
(PySpark)提取实体,但我得到了一个错误。def __get_entities(x):
nlp
=
spacy
.load("en_core_web_lg") get_entities_udf = F.udf(__get_entities), T.ArrayTy
浏览 4
提问于2020-09-01
得票数 0
回答已采纳
1
回答
用空间和潘达斯
python
、
pandas
、
spacy
、
text-classification
我正在尝试使用
Spacy
构建一个多类文本分类器,我已经构建了这个模型,但是在将它应用到我
的
完整数据集时遇到了问题。)._.catsValueError: [E1041] Expected a string, Doc, or bytes as input, but got: <class '
pandas
.core.
series
.
Series
'> 在这种情况下,我想使用
Pandas
的
原因是dataset有两个列: ID
浏览 29
提问于2022-12-02
得票数 1
1
回答
pandas
系列和Dataframe中使用
Spacy
的
词汇化问题
python
、
pandas
、
dataframe
、
series
、
spacy
我正在研究具有(14640,16)形状
的
,使用
Pandas
和
Spacy
进行预处理,但在获取lemmetized形式
的
文本时有问题。此外,如果我使用仅包含文本列
的
pandas
系列(即只包含一列
的
数据帧),也会出现不同
的
问题。代码:(Dataframe)df['parsed_tweets'] = df[
浏览 12
提问于2019-11-14
得票数 1
回答已采纳
1
回答
将
spaCy
对象
导入到运行Django项目的不同
的
Docker容器中
python
、
django
、
docker
、
spacy
我正在运行一个带有3个服务(或容器)
的
坞-撰写文件: 我
的
最终目标是在
spacy
-web中
创建
2个
nlp
对象
(
nlp
_en,
nlp
_fr),使用入口点(运行
python
脚本:
spacy
_entrypoint.py),我
创建
了2个
nlp
对象
,每种语言都有一个(
nlp
_en、
nl
浏览 0
提问于2019-09-06
得票数 0
1
回答
Python
创建
nlp
文档-参数‘
SpaCy
’
的
类型不正确
python
、
nlp
、
spacy
我是
Python
NLP
的
新手,我正在尝试用
SpaCy
处理CSV文件。使用
Pandas
可以很好地加载文件,但当我尝试使用
SpaCy
的
nlp
函数处理它时,编译器在处理文件内容
的
过程中出现了大约5%
的
错误。代码块如下:df = pd.read_csv('./reviews.washington.dc.csv') import <e
浏览 14
提问于2017-08-18
得票数 1
1
回答
调用
nlp
时出现
Python
Spacy
错误: UnicodeDecodeError:'ascii‘编解码器无法解码字节0xe2
python
、
pandas
、
nlp
、
spacy
Python
3.6:我在
pandas
df中
的
一列文本上使用
Spacy
。文本中确实有“特殊字符”,我需要保留它们。出于某种原因,
nlp
需要使用unicode。我从下面的
nlp
得到一个错误:import
spacy
df['TextCol'] = df[&
浏览 19
提问于2019-08-15
得票数 0
2
回答
在PySpark中没有命名为“
spacy
”
的
模块
pyspark
、
user-defined-functions
、
google-cloud-dataproc
、
named-entity-recognition
、
spacy-3
: pd.
Series
) -> pd.
Series
:
nlp
= broadcasted_
nlp
.valueCLARIFICATIONS: 第1条:“您使用哪条命令
创建
集群?”:我使用了
方法
,因此该命令在“显而易见
的
情况下”是不可见
的
;然而,我刚刚意
浏览 7
提问于2022-08-24
得票数 1
回答已采纳
1
回答
错误解析配置重写- `
nlp
.tokenizer`节不存在
spacy
我在
Spacy
遇到了一个奇怪
的
问题,我不知道我是不是做错了什么,还是它是一个真正
的
bug。我使用
Spacy
项目并通过以下
方法
创建
默认配置文件:然后,我尝试使用以下配置加载
NLP
对象
:config/
spacy
.cfg')
nlp</e
浏览 6
提问于2021-03-02
得票数 0
回答已采纳
1
回答
将自定义语言添加到
Spacy
3.0中,并在其中训练管道
python
、
spacy
、
spacy-3
到目前为止,我一直在使用
Spacy
2.3.1。我
创建
了自己
的
自定义类,继承自Language类,并在其中使用
Python
脚本训练了一个NER管道。但在
Spacy
3.0中,引入了一堆方便
的
CLI命令和配置,以便训练自定义管道,强烈建议使用这些命令来代替
Python
脚本。以下是
nlp
对象
的
配置示例: ...[
nlp
]pipeline = ["t
浏览 11
提问于2021-04-11
得票数 1
回答已采纳
2
回答
如何过滤
Pandas
数据中包含
的
spaCy
标记文本
的
停止词
python
、
pandas
、
dataframe
、
spacy
我正在尝试将一些
spaCy
NLP
函数应用到包含在熊猫数据中
的
文本中。对于简单
的
进程,lambda函数似乎可以工作。但是,当尝试执行需要在单独
的
函数中定义更复杂
的
语句
的
任务时,我很难使lambda
方法
正常工作。具体来说,对于包含在dataframe中
的
标记化文本,什么是过滤掉停止词
的
最佳
方法
?最起码
的
例子:import <e
浏览 2
提问于2020-06-08
得票数 0
回答已采纳
2
回答
毫升起火花放电作用
python
、
pandas
、
apache-spark
、
pyspark
、
apache-spark-sql
下面是一个示例:from pyspark.sql.types import StringTypeHe loves him'], StringType()) import
spacy
nlp
=
spacy
.load) return doc._.core
浏览 2
提问于2020-06-16
得票数 5
1
回答
使用
spaCy
& Transformers -循环内外运行时
的
不同结果
python
、
spacy
、
huggingface-transformers
、
named-entity-recognition
我注意到,直接给出输入行时得到
的
输出与
从
文件读取输入行时不同(见下面的屏幕快照)。有人对如何解决这个问题有建议吗?import
pandas
as pdimport
spacy
from transformers import
python
-m
spacy
download en_core_web_trf
nlp
=
spa
浏览 1
提问于2021-10-06
得票数 0
回答已采纳
2
回答
我
的
问题是“模块'textacy‘没有’Doc‘属性”
spacy
、
textacy
找不到没有属性'Doc‘
的
模块'textacy’我正在尝试
从
spacy
中提取动词短语,但是没有这样
的
库。请帮助我如何使用
spacy
提取动词短语或形容词短语。我想做完整
的
浅层解析。def extract_named_nouns(row_
series
): row_
series<
浏览 43
提问于2019-06-23
得票数 3
1
回答
NLP
:根据分隔符
创建
spaCy
文档
对象
,或将多个文档
对象
合并为一个
对象
pandas
、
nlp
、
spacy
、
named-entity-recognition
我正在尝试使用make_doc()函数
创建
一个
spaCy
文档
对象
(
spacy
.tokens.doc.Doc)。这就是我所做
的
:
nlp
=
spacy
.load('en') print(list(a)) # [Sam, ,, Software, Engineer] 但我想要
的
浏览 20
提问于2021-05-25
得票数 2
回答已采纳
1
回答
基于
spaCy
的
令牌化
string
、
dataframe
、
nlp
、
spacy
、
text-mining
我是
Python
的
新手,我希望在这里为我
的
文本分析项目找到帮助。我试图标记
从
python
中
的
excel导入
的
几个文本元素。每个文本元素都位于单独
的
行中。df2 = df['Textelements']
nlp
= Ge
浏览 2
提问于2022-08-13
得票数 1
1
回答
使用
spacy
-stanza模型高效地
创建
doc
对象
python
、
spacy
根据
SPACY
的
创建
者,
从
文本列表
创建
文档
对象
的
最有效
方法
如下其中:texts:我们想要转换为doc
对象
的
文本列表 但是,当我将此代码与
spacy
-stanza语言模型一
浏览 18
提问于2020-09-27
得票数 0
1
回答
如何在网站内使用
Spacy
NLP
python
、
reactjs
、
nlp
、
spacy
我已经与
Spacy
NLP
在木星笔记本中练习了一段时间,并
创建
了一些脚本,以满足我
的
需要。 我也有一个网站,我已经
创建
(内置
的
反应)。我需要能够根据用户在我
的
网站上选择
的
内容将数据传递给
Spacy
脚本,然后当
Spacy
NLP
脚本完成其传递
的
数据时,需要再次
从
Spacy
NLP
脚本接收结果。我已经寻找了相当长
的
浏览 1
提问于2017-10-28
得票数 1
1
回答
在内存中为其他
python
程序提供
python
对象
python
、
server
、
nlp
、
spacy
考虑下面的代码第二行大约需要一分钟才能完成,对于每个程序,我有以下几行,那么我如何才能更好地服务于
nlp
对象
,而不是每次都从不同
的
程序加载它呢?import
spacy
最理想
的
情况是:
nlp
对象
很大,大约大于2 2GB,因此不需要序列化解决方案我更喜欢为内存中
的
nlp</
浏览 2
提问于2016-06-07
得票数 0
1
回答
星火3.2 -
NLP
.pipe - pd.
Series
.__iter__()上
的
熊猫没有实现
python
、
apache-spark
、
pyspark
、
spark-koalas
、
pyspark-pandas
目前,我正在尝试将一些过程
从
python
迁移到(熊猫上) some,以衡量性能,直到现在,一切都进行得很顺利:
nlp
定义为:
nlp
=
spacy
.load(texts,batch_size=20)上发现了用于文档
的
错误: PandasNotImplementedError:
方法
pd.
Series
./
spacy
/languag
浏览 9
提问于2022-03-09
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券