腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
是否存在logstash的grok功能的
Python
实现?
python
、
regex
、
string-parsing
、
logstash
是一个建立
在
regex之上的
字符串
解析工具,它提供了许多模式,使得
字符串
解析任务变得非常容易,我
在
第一次使用它时就爱上了它。但是不幸的是,它是用Ruby编写的,使得我的
Python
项目无法使用,所以我想知道是否有任何
Python
实现的grok,或者有任何
Python
替代方案可以简化
字符串
解析,就像grok做的那样?
浏览 10
提问于2014-04-15
得票数 7
回答已采纳
3
回答
消除Java
中
命名实体的歧义
java
、
named-entity-recognition
我有一个
字符串
列表(
在
本例
中
是公司名称),还有一个Java程序可以
从
大多数
非
结构化
文本中
提取
出看起来像公司名称的内容列表。我需要将
提取
文本的每个元素与列表
中
的一个
字符串
进行匹配。注意:
非
结构化
的文本有打字错误,比如"Blah,Inc.“我尝试过Levenshtein编辑距离,但由于可预见的原因,它失败了。是否有已知的最佳实践方法来解决此问题?或者我又回到了手工
数据
浏览 3
提问于2010-06-09
得票数 3
回答已采纳
1
回答
从
非
结构化
字符串
中
提取
JSON
字符串
java
、
regex
我有一个
非
结构化
字符串
,我想使用regex
从
其中
提取
下面的JSON
字符串
。
数据
为示例,但格式和“餐厅”标签是正确的。+}";,它将所有的
数据
提取
到最后一个}。 String htmlString = contentBuilder.toString(); Docume
浏览 1
提问于2020-07-10
得票数 0
回答已采纳
2
回答
用于自然语言处理的Java或
Python
java
、
python
、
nlp
Java还是
Python
?关于这件事,我发现了很多问题和答案。但我仍然迷失
在
选择使用哪一种。我想知道
在
Java中使用哪个NLP库,因为有很多库(LingPipe、GATE、OpenNLP、StandfordNLP)。对于
Python
,大多数程序员推荐NLTK。但是如果我要做一些文本处理或者
从
非
结构化
数据
(仅仅是自由形成的纯英语文本)中
提取
一些有用的信息,那么最好的选择是什么?Java还是
Python
?合适的图书馆?更
浏览 19
提问于2014-04-07
得票数 116
1
回答
如何使用
python
(类似于JFK文件中生成的图形)使用azure认知搜索索引
中
的
数据
创建知识图
python
、
azure
、
azure-cognitive-search
、
knowledge-graph
我
在
蓝色认知搜索
中
索引了一组
非
结构化
文档(.docx)。请帮帮我。提前谢谢你
浏览 3
提问于2020-08-12
得票数 0
3
回答
“汤”和“美汤”
中
的“汤”是什么意思?
beautifulsoup
、
jsoup
“汤”和“美汤”
中
的“汤”是什么意思,为什么它被称为“汤”?
浏览 1
提问于2014-05-19
得票数 10
1
回答
使用
Python
中
的知识库
从
文本中
提取
实体
nlp
、
dbpedia
、
freebase
、
wikidata
、
named-entity-extraction
我有一个实体
提取
任务,需要像维基
数据
,freebase,DBpedia的知识库。考虑到它们的巨大规模,很难
从
它们中下载和
提取
实体。有没有一个
python
客户端可以进行API调用,以
非
结构化
文本作为输入来获取
提取
结果?
浏览 23
提问于2019-10-17
得票数 0
1
回答
从
字符串
中
提取
正则模式
python
、
regex
是否有任何方法(库、算法等)
从
(
非
结构化
的和随机的)
字符串
中
识别和
提取
正则表达式?例如,我得到了以下
字符串
: $betterline = ($line -match "\(\d+\)(?我更喜欢
python
,但我也可以使用其他语言。
浏览 9
提问于2020-07-10
得票数 1
1
回答
使用
Python
从
docx中
提取
非
结构化
数据
/文本
python
、
regex
、
docx
我是
python
的新手。我想从docx文件中
提取
非
结构化
数据
作为键值对。
数据
采用表格格式和原始文本格式。我以前也
从
表中
提取
过值,但我不知道该怎么做。有没有人能告诉我我指的是哪个包或链接?
浏览 29
提问于2019-11-13
得票数 0
回答已采纳
1
回答
在
MySQL中使用RegEx更新复杂的SQL表
mysql
、
sql
、
regex
我正在从源中
提取
非
结构化
数据
,并尝试将
结构化
的from放入DB
中
。为了通过用多个查询轰炸我的服务器来最小化开销,我想知道是否有一种方法可以做一个复杂的查询:
在
一个
字符串
中
搜索一个正则表达式模式,比如A0-9G+,然后
在
另一个表
中
添加一个新行,where row.column=
从
正则表达式中找到列
浏览 3
提问于2011-07-05
得票数 2
回答已采纳
2
回答
Golang: Json
从
URL作为地图
json
、
rest
、
go
从
url中
提取
json的最佳方法是
从
Go中
提取
Rest服务?而且,go
中
的大多数rest客户端库都强制使用json.marshall,这需要与其一起使用一个结构。
在
非
结构化
数据
的情况下,这是行不通的,在这种情况下,您不完全知道接下来会出现什么。有没有一种方法可以让它成为一个映射
字符串
:string
浏览 3
提问于2015-07-05
得票数 2
回答已采纳
3
回答
R
中
向量的子串
提取
regex
、
r
、
stringr
我正在尝试
从
非
结构化
文本中
提取
子
字符串
。例如,假设一个国家名称向量:如何传递这个字符值向量,
从
非
结构化
文本中
提取
准确的匹配。States is a match", "Not a match", "Not a match&quo
浏览 4
提问于2015-03-22
得票数 3
回答已采纳
1
回答
在
Python
中
从
非
结构化
字符串
中
提取
数据
python
、
pandas
、
dataframe
、
data-science
、
feature-engineering
我正在使用一个求职公告板的
数据
集,我打算将“薪资待遇”一栏变成我可以用来进行计算、比较和预测的内容。对于列
中
的
数据
,我有五种不同的情况: 某一范围内的-Yearly薪资(YSWR) 即:每年15,000-17,000英镑 某个范围内的-Hourly薪资(HSWR) 即:每小时22.00-26.00英镑我需要将这个字段预处理为: 指示薪资是按年还是按小时计算的-One列 指示最低/最高工资的-Two列(0表示
非
指定值,等值表示不在范围内的情况) 你知道
从
哪里开始吗?.I正在使用蟒蛇和熊猫。当涉及到
浏览 80
提问于2021-02-12
得票数 0
1
回答
非
结构化
数据
是什么意思?
在
使用ETL工具处理
数据
方面?
csv
、
edi
我和一个队友
在
讨论我们的工作经验,他说他
在
一个叫做Informatica的工具
中
工作。他的工作包括
从
EDI文件中
提取
所需的信息并进行转换,然后将它们加载到
数据
库
中
。他说,EDI文件具有
非
结构化
数据
,而不是像.CSV和.SQL这样的格式,而在EDI文件
中
,列由“\”符号分隔。在我看来,EDI和CSV没有任何区别,只有CSV是',‘分离’和EDI是‘\’分开的,那么为什么EDI文件会被归类为<
浏览 5
提问于2015-09-01
得票数 1
回答已采纳
1
回答
从
网站中
提取
非
结构化
数据
的适当/可能方法
machine-learning
、
nlp
、
feature-extraction
、
nltk
、
scraping
我正在使用
Python
,使用Scrapy和NLTK来尝试理解如何
从
大学网站中
提取
数据
。我的刮刀可以浏览大学网站并找到它们的学费页面,但当试图
提取
特定的费用时,如:
非
居民每学期 由于
数据
从一个站点到另一个站点的
非
结构化
,我遇到了麻烦。我尝试使用NLTK来解析基于语音标记和regex分块的
数据
,试图
提取
诸如“居民的学费:12,500美元”这样的句子,但大学可以通过多种方式显示这些<
浏览 0
提问于2018-03-14
得票数 0
回答已采纳
1
回答
如何使用zonal OCR方法动态
提取
行项目?
c#
、
ocr
、
tesseract
根据预定义的模板
提取
固定区域是可以的,但是
从
扫描的发票中
提取
行项目是困难的,因为每个发票都有不同的行项目。
浏览 0
提问于2018-11-08
得票数 0
1
回答
如何在
Python
中
的
结构化
数据
集中应用TFIDF?
python
、
nlp
、
tfidf
我知道TFIDF是一种用于特征
提取
的NLP方法。但这不是我想要的RepID RepText1 Doctor sys patient has diabetes and我想要的是为我的
数据
集中的每一个单词找到TFIDF。 我想把我的
数据
集转换成一种
非<
浏览 0
提问于2021-05-22
得票数 3
3
回答
使用Ruby
从
文本
中
解析日期
ruby
、
text-extraction
、
information-extraction
我正在尝试找出如何使用Ruby
从
非
结构化
文本中
提取
日期。 例如,我想从这个
字符串
中
解析出日期"Applications started after 12:00 A.M.
浏览 2
提问于2010-02-17
得票数 1
回答已采纳
1
回答
MySQL -将所有JSON属性作为单独的列列出
mysql
、
mysql-json
我们将
非
结构化
数据
作为JSON存储
在
MySQL
中
(其中一个表与
结构化
数据
一起)。我们想
提取
数据
,但我们不确定如何
提取
JSON
数据
,因为JSON
数据
可以包含任何属性(没有公共属性)。
浏览 45
提问于2020-03-31
得票数 0
2
回答
信息抽取和文本挖掘有什么不同?
nlp
、
information-retrieval
、
text-mining
、
information-extraction
这看起来可能很容易。但我很困惑。
浏览 7
提问于2013-06-22
得票数 11
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python获取字符串中的特定位置的数据
Python爬虫数据提取
Python正则表达式初识(二)
要成为一个专业的爬虫大佬,你还需要了解这些
爬虫是什么
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券