腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Spacy
中
生成
要
添加到
短语
匹
配器
的
模式
时
,
加快
模式
创建
速度
、
、
、
尝试
在
flask应用程序中使用
Spacy
的
phraseMatcher从给定
的
文本片段
中
识别实体。
在
创建
模式
和
添加到
PhraseMatcher
时
,我使用了最快
的
推荐方法,使用tokenizer.pipe作为指定
的
。我成功地
创建
了一个大小为1200
的
实体列表,而且在运行时
速度
也相当快。但当达到150K实体
时
,它会显
浏览 12
提问于2020-02-05
得票数 0
1
回答
如何使用动词时态/语气构建
spacy
matcher
模式
?
、
、
、
我一直
在
尝试使用动词、时态和语气为
spacy
matcher
创建
一个特定
的
模式
。我发现了如何使用model.vocab.morphology.tag_maptoken.tag_访问使用
spacy
解析
的
单词
的
形态特征,当动词处于虚拟
模式
(我感兴趣
的
模式
)
时
,它会打印出类似这样
的
内容:True,'Number_sing':True,'Pe
浏览 3
提问于2020-09-02
得票数 3
1
回答
spaCy
中
的
令牌扩展与匹
配器
与
短语
匹
配器
与实体统治者
的
比较
、
、
dev.7次运行
中
,每一次循环10000次) import
spacy
.pipeline import
spacy
.pipeline ruler =
spacy
.pipeline.EntityRulerEntityRuler似乎是最慢<
浏览 0
提问于2019-04-25
得票数 12
回答已采纳
9
回答
Java中用于设计
模式
的
类库?
、
、
我发现我自己一遍又一遍地写着许多新项目中相同
的
编程
模式
。我一直
在
考虑
创建
我自己
的
这种
模式
的
典型实现
的
可重用库-not试图涵盖所有可能
的
设计
模式
,但只有它们才能证明将此类典型实现放在库(例如适
配器
、工厂等)
中
是有意义
的
--但在我想知道是否已经有用于此目的
的
现有库之前我知道,
要
完全概括编程
模式
是非常困难
的<
浏览 7
提问于2011-11-06
得票数 7
回答已采纳
2
回答
有什么办法可以用白兰素标签吗?
、
我是
spaCy
的
新手,目前正在尝试使用
spaCy
英语大模型从句子
中
识别人如果我说“亚历克斯
在
吃苹果”。它将成功地返回亚历克斯是一个人例如,太阳锯蜜蜂正在吃苹果或亚历山德罗很快就开始吃苹果了。我想知道是否有类似白名单添加“太阳锯蜜蜂”或“亚历山德罗”作为一个人,没有再培训
spaCy
英语
模式
? 或者以
浏览 4
提问于2020-07-21
得票数 0
回答已采纳
2
回答
仅来自PhraseMatcher
的
空间实体
、
我有一个
短语
列表,我想标记为一个新
的
实体类型。我最初尝试过训练一个NER模型,但是由于有一个有限
的
术语列表,我认为简单地使用Matcher应该更容易。我
在
中看到,您可以根据Matcher将实体
添加到
文档
中
。我
的
问题是:如何对新
的
实体执行此操作,而不让NER管道标记任何其他标记作为该实体?理想情况下,只有通过matcher找到
的
令牌才应该标记为实体,但我需要将其作为标签
添加到
NER模型
中
,然后将一些标
浏览 2
提问于2018-03-04
得票数 4
回答已采纳
1
回答
空间实体规则
模式
不适用于ent_type
、
、
、
我试图让实体标尺
模式
使用引理和ent_type
的
组合来为
短语
“land(或land)
在
巴尔的摩(Location)”
生成
一个标签。它似乎与Matcher一起工作,但不是我
创建
的
实体统治者。从输出
中
可以看到,
模式
规则是
在
NER之后添加
的
,我已经将覆盖设置为true。如有任何意见或建议,将不胜感激! matcher标记整个
短语
(
在
巴尔的摩登陆),但实体规则没有。码样例
浏览 8
提问于2021-12-22
得票数 2
回答已采纳
2
回答
使用
Spacy
提取动词
短语
、
我一直
在
使用
Spacy
提供
的
Doc.noun_chunks属性来提取名词块。如何使用
Spacy
库(形式为'VERB ? ADV * verb +‘)从输入文本中提取动词
短语
?
浏览 2
提问于2017-12-17
得票数 17
回答已采纳
1
回答
为了使用匹
配器
或PhraseMatcher,管道需要包含标记器
、
、
、
、
当我试图将一个引理
添加到
模式
中
时
,最终得到了这个错误::#代码: from
spacy
.matcher import Matcher nlp = E
浏览 12
提问于2020-06-03
得票数 1
2
回答
爆炸
的
Spacy
ValueError:[E012]不能将零令牌
的
模式
添加到
matcher
、
、
我不断地收到标题中
的
错误信息,而且我
的
头脑已经到了尽头。我留下了索取信息
的
请求。那里。它包含了一些额外
的
信息,这些信息引用了之前
的
一篇文章,在这里似乎与此无关。 你能帮我解释一下错误信息吗?但是我不能
创建</e
浏览 4
提问于2021-10-10
得票数 1
1
回答
如何测试Oracle DB?
、
如果数据库
中
存储
的
数据是否完全正确,我必须在Oracle中使用SQL进行测试。例如,确保我们是最新
的
,没有未来
的
日期,没有
在
varchar列上
的
无效字符,等等。考虑到团队
中
唯一
的
知识是SQL,那么这种测试
的
最佳选择是什么。
浏览 0
提问于2019-01-08
得票数 2
1
回答
VS 2013 / BizTalk 2010
生成
的
模式
没有
添加到
更正子目录
、
、
我正在通过以下步骤将
生成
的
模式
添加到
VS 2013 BizTalk项目中,但它们似乎没有
添加到
选定
的
project子目录
中
。我需要切换哪些VS配置选项来允许将
模式
添加到
子目录
中
?右键单击要向其添加架构
的
项目子目录,并选择“添加
生成
项.” 我选择消费适
配器
服务,并填充向导
中
的
所有相关信息(SQL连接、强类型过程、选择存储过程和
浏览 2
提问于2019-08-09
得票数 0
回答已采纳
2
回答
最快
的
迭代和基于数据
的
图像显示?
、
、
、
我有一个带有10000+条目的sql数据库,这些条目是
在
wpf列表框
中
填充
的
。我想根据表
中
某一列
中
的
整数来显示图像。对于每个整数,我只有10个以上
的
选择,所以我只需要@10个图像。我
的
问题是,如果用户向下滚动列表框,使用c#和wpf将图像链接到值
的
最快方法是什么?someInt
浏览 3
提问于2012-03-06
得票数 0
1
回答
使用whoosh作为不带索引
的
匹
配器
、
、
有没有可能在不构建索引
的
情况下,就将whoosh用作匹
配器
? 我
的
情况是,我
的
订阅是用字符串预定义
的
,文档是以流
的
形式传入
的
。我检查每个文档是否与订阅匹配,如果匹配,则发送它们。目前只使用简单
的
匹配,但当消费者要求基于字段和/或逻辑等进行搜索
时
,我想知道是否可以使用呼呼匹
配器
并允许呼呼查询语法。我在网上找不到任何文档或问题来说明如何做到这一点,我
的
尝试也没有奏效。或者,这个库是不是不适合这
浏览 31
提问于2020-07-17
得票数 1
回答已采纳
1
回答
从S3读取Json文件
的
最快方法: Spark
、
、
、
、
我有一个文件夹目录,每个文件夹都包含压缩
的
JSON文件(.gz)。目前我正在做
的
事情是:df.show()testData/May/01/00/File.json.gz我有: 压缩
的
文件有多个json对象
浏览 4
提问于2016-07-06
得票数 8
回答已采纳
1
回答
从数据库日志记录中排除表
、
我们
的
产品包含多个包含自定义应用程序安全信息
的
表。
在
某些情况下,这些securityinfo表可能包含相当多
的
行(
在
一种情况下为1300万行),这些表
的
存在是为了
加快
查询
速度
,并且可能从头开始重建,但这会耗费大量
的
时间/处理能力等。
在
设计应用程序
的
方式
中
,(
在
程序运行期间)删除安全部分
的
记录,然后插入新记录,这比识别
要
浏览 0
提问于2012-05-16
得票数 2
回答已采纳
3
回答
是否有一种特定
的
方法来赋予某个子类一些超类
的
功能?
、
、
、
问题我想过
要
实现一些类似于复合
模式
的
东西, 正如GoF所描述
的
那样。我将将搜索操作(例如术语搜索、
短语</e
浏览 0
提问于2019-07-03
得票数 7
回答已采纳
1
回答
spacy
自定义标记器不对单词分组
、
、
使用
spacy
,我试图将三个不同
的
令牌合并到一个令牌
中
。 import
spacy
nlp =
spacy
.load(
浏览 6
提问于2021-03-04
得票数 1
回答已采纳
1
回答
Python:
Spacy
NER和内存消耗
、
、
、
我
在
en_core_web_md上有我自己训练过
的
模型。我
的
模型大小是223兆字节。当模型加载到内存
中
时
,它使用800兆字节。对于NER来说,有没有可能不加载所有的东西(lexemes.bin,string.json,key2row),而只加载向量和模型(分别重4MB和24MB),从而消耗更少
的
内存?
浏览 49
提问于2020-05-01
得票数 1
回答已采纳
1
回答
将模糊搜索结合到匹配对象
中
、
、
、
我
的
任务是使用如下规则查询医学文本
中
的
机构名称:只有当两个术语都包含在其中
时
,规则才能使匹配一致我已经尝试过,它封装了
spaCy
,对于单个术语或
短语
非常有用。然而,无论是
spaCy
,而不是空格,都不允许有多个错误
的
模糊多词规则,就像在“”
中
那样。
浏览 3
提问于2020-12-26
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spacy是什么?超级能干的助手,让你秒变NLP大师!
Python自然语言处理:使用SpaCycle库进行标记化、词干提取和词形还原
如何将Python自然语言处理速度提高100倍?
Midjourney系列教程【1】–命令
机器人意图识别和词槽抽取RasaNLU解析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券