腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
逻辑语义、信息抽取与总结
nlp
、
semantics
、
analysis
、
information-extraction
、
summarization
我想知道关于这些问题的一般想法,在数据分析和NLP领域。包括哪些步骤?如果我想从任何特定领域的文本中检索有意义的信息,并理解任何文本的一般概念。原谅我的无知。我想了解更多,如果你建议一些教程或阅读材料,这将对我有很大的帮助。
浏览 1
提问于2015-10-04
得票数 1
回答已采纳
1
回答
在文本中查找字符串的特定模式
string
、
algorithm
、
pattern-matching
、
text-mining
、
string-search
我在寻找一种方法在文本中找到一些特定的模式。例如,如果我想以这样的格式从文本中找到所有引用:因此,任何类似于此的内容都将从输入文本中返回。有什么算法对此很好吗。到目前为止,我发现的只是搜索文本中类似字符串的算法。
浏览 1
提问于2012-06-19
得票数 0
1
回答
如何从Nutch爬行网页数据库中获取XML格式的信息
xml
、
nutch
、
aggregation
、
text-mining
我正在尝试建立图书聚合门户。Nutch为我提供了优秀的网络爬虫,但我想要非常具体的信息,如书名,书价,ISBN,作者等。如何从爬虫页面提取这些信息?如果可能的话,我想以XML格式获取这些信息。
浏览 0
提问于2013-04-10
得票数 1
回答已采纳
1
回答
加密与唯一标识
encryption
为什么不使用指纹
识别
系统作为私密密钥呢?为什么不使用指纹和/或其他唯一的标识符,如视网膜或晶状体扫描,以标识您的终端到计算机?为什么不使用这种
识别
方法来
识别
所有要保护的
信息提取
和/或进入系统(s)的设备?
浏览 0
提问于2015-01-18
得票数 0
1
回答
使用openie复制提取,如(Angeli et.( al)
stanford-nlp
然而,它是非常基本的,没有
识别
多个子句,也没有在其基础论文“利用语言结构进行开放领域
信息提取
”中阐明的任何例子。我想复制一下论文中所示的摘录。
浏览 5
提问于2015-09-27
得票数 1
回答已采纳
3
回答
如何
识别
场景图像的文本
c#
、
image-processing
、
ocr
我正在尝试构建一个系统(使用C#),可以
识别
场景图像的文本。我看到场景文本
识别
是一项具有挑战性的任务,因为低分辨率,复杂的背景,不均匀的闪电或模糊效果…… 任何解决这个问题的想法都将不胜感激。
浏览 0
提问于2012-01-08
得票数 0
2
回答
文本分析与自然语言处理有什么区别?
nlp
、
stanford-nlp
、
uima
今天我度过了一个艰难的夜晚,试图说服我的一位同事,NLP或自然语言处理程序是超级集,Text Analytics是其中的一个子集。在最好的情况下,两者可能是同义词,可以互换使用。
浏览 3
提问于2017-08-22
得票数 1
1
回答
文本挖掘:何时使用解析器、标记器、NER工具?
python
、
nlp
、
nltk
我正在做一个挖掘博客内容的项目,我需要帮助区分使用哪种工具。什么时候使用解析器,什么时候使用标记器,什么时候需要使用NER工具?顺便说一句,我用的是nltk,但我在看斯坦福大学的标记器或解析器,因为有几个家伙说它很好。
浏览 0
提问于2010-06-24
得票数 1
回答已采纳
1
回答
如何利用机器学习从文本中提取特征?
machine-learning
、
python
、
deep-learning
、
machine-learning-model
我想开发某种模型/算法,允许我提取给定产品名称的特征。(比方说品牌、款式和颜色)。例如:{ model: "6s", color: "Silver"如有任何建议,将不胜感激。谢谢。
浏览 0
提问于2018-11-15
得票数 4
回答已采纳
1
回答
如何使用神经网络检测和
识别
文档上的信息?
neural-network
、
conv-neural-network
我认为第一步需要使用YOLO网络进行
信息提取
。因此,YOLO网络应该使用如图所示的边界框来本地化此信息: ? 提取信息后,需要对其进行
识别
。所以,我认为这可能是一种类似于车牌
识别
的方法,首先定位车牌,然后
识别
车牌,对吗? 因此,第二步是
识别
本地化信息,如下所示: ? 我认为这种方法与发票处理的一些方法非常相似。
浏览 12
提问于2020-09-11
得票数 0
回答已采纳
1
回答
寻找人工智能(AI)食谱阅读器研究
artificial-intelligence
、
nlp
食谱是一个非常有限的领域,在自然语言
识别
引擎中可以做到一定程度的准确性。
浏览 4
提问于2010-08-25
得票数 2
回答已采纳
1
回答
如何使用python & NLTK提取评论的副主题句?
python
、
nlp
、
nltk
、
feature-extraction
有没有什么有效的方法来使用python和NLTK library.As提取评论的副主题解释?举个例子,关于手机的用户评论可能是“这部手机的电池很好,但显示效果很差”,我想提取上面两个特征,比如"display is a bullshit"<NN.?><VB.?>?<JJ.?> 这个模式作为子topic
浏览 2
提问于2017-05-25
得票数 1
3
回答
从HTML页面中提取文本块的Java库
java
、
html
、
text
、
information-extraction
我想提取所有的文本,但
识别
每一个作为一个单独的文本,而不仅仅是一个。编辑:我使用Jsoup来解析,但我不想进行解析,而是像页面中的boilerpipe那样进行
信息提取
。
浏览 0
提问于2012-01-20
得票数 1
2
回答
通过搜索引擎进行Web挖掘
machine-learning
、
web-crawler
、
data-mining
当我通过谷歌地图购买公寓时,将各种列表复制到电子表格中,以便更容易地比较和附加注释,这时我意识到这是多么不必要的重复和低效。我可以很容易地写一个脚本来自动查询Google并提取我需要的数据,但是要获得一些数据(例如联系电话号码),我需要沿着一个链接到一个列表特定的网站并四处寻找数据,而我从来没有写过这样动态的网络爬虫。在给定任意HTML的情况下,有哪些常见的数据挖掘和/或机器学习技术和工具来提取一段信息的“最佳猜测”?
浏览 0
提问于2010-11-10
得票数 1
回答已采纳
1
回答
从文档列表中提取一个人的个人信息并进行汇总
nlp
、
nltk
如果有两个人的名字相同,应该
识别
出正确的人。如果此人有昵称,也需要进行
识别
。程序的输入可以是人名,地址,组织名称等。我已经使用NLTK库从文本中提取了命名实体,如个人,组织,位置等。
浏览 11
提问于2019-03-07
得票数 0
1
回答
Google =是否公式在多个工作表中偶尔工作
google-sheets
、
google-sheets-formula
我使用一个=IF公式来
识别
Sheet1中有数据匹配的实例,并将相应列的头中的
信息提取
到Sheet2中。错误或未能将逻辑函数
识别
为真。 我怎样才能使公式对所有的细胞有效?
浏览 2
提问于2019-12-09
得票数 0
1
回答
基于人类语言的elasticsearch搜索
elasticsearch
、
nlp
、
named-entity-recognition
、
information-extraction
能让elasticsearch理解人类语言吗?是否有任何软件包或elasticsearch自然支持它?或者如果理论上可能的话,任何基本的想法都可以实现
浏览 1
提问于2016-09-21
得票数 4
回答已采纳
1
回答
在PHP上读取附加到*.fpt文件的*.dbf文件的数据
php
、
xampp
、
odbc
、
foxpro
、
dbf
我有一个使用Visual的软件,所以它使用dbf+cdx+fpt文件来存储所有数据。我很幸运,到目前为止,这个项目看起来很棒。但现在我有麻烦了,我不知道你能不能帮我。到目前为止,我使用了以下结构来完成这个任务: 在Windows上,安装了XAMPP,并创建了"Microsoft驱动程序“的OD
浏览 1
提问于2018-07-14
得票数 1
1
回答
在GUI中
识别
的文件类型,但在命令行上不
识别
debian
、
file-types
最近我意识到Debian上的file不会
识别
我正在处理的一些文件格式,告诉我它们只是ZIP文件:file.key: Zip archive data, at least v2.0 to extract 但是,如果我使用pcmanfm查看文件,就会发现正确地
识别
了这些文件类型
浏览 0
提问于2022-03-15
得票数 3
回答已采纳
1
回答
对于给定的代表字符串的有限列表的正则表达式的语法推断?
regex
、
language-agnostic
、
grammar
、
automata
、
dfa
我正在分析一个大型公共数据集,其中包含大量冗长的人类可读字符串,这些字符串显然是由一些常规(在形式语言理论意义上)语法生成的。基本上,我正在寻找一个现有的算法(最好有一个现有的参考实现)来获取任意的字符串列表,并尝试来推断出一些可以用来生成它们的最小(对于最小的合理定义)生成正则表达式的集合(即,从由该语法生成的语言的有限字符串集合中推断出一个正则语法)。 我曾考虑过重复进行贪婪的最长公共子字符串消除,但这只能做到这一点,因为它不会
浏览 23
提问于2013-03-20
得票数 25
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
时间序列的表示与信息提取
身份证信息提取的简易方法
淘宝新开店旺旺爬虫软件,当天店铺信息提取工具
进项发票票面信息提取的最佳解
Python网络爬虫与信息提取Week 2整理(2)
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券