腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
逻辑语义、信息抽取与总结
、
、
、
、
我想知道关于这些问题的一般想法,在数据分析和NLP领域。包括哪些步骤?如果我想从任何特定领域的文本中检索有意义的信息,并理解任何文本的一般概念。原谅我的无知。我想了解更多,如果你建议一些教程或阅读材料,这将对我有很大的帮助。
浏览 1
提问于2015-10-04
得票数 1
回答已采纳
1
回答
在文本中查找字符串的特定模式
、
、
、
、
我在寻找一种方法在文本中找到一些特定的模式。例如,如果我想以这样的格式从文本中找到所有引用:因此,任何类似于此的内容都将从输入文本中返回。有什么算法对此很好吗。到目前为止,我发现的只是搜索文本中类似字符串的算法。
浏览 1
提问于2012-06-19
得票数 0
1
回答
如何从Nutch爬行网页数据库中获取XML格式的信息
、
、
、
我正在尝试建立图书聚合门户。Nutch为我提供了优秀的网络爬虫,但我想要非常具体的信息,如书名,书价,ISBN,作者等。如何从爬虫页面提取这些信息?如果可能的话,我想以XML格式获取这些信息。
浏览 0
提问于2013-04-10
得票数 1
回答已采纳
1
回答
加密与唯一标识
为什么不使用指纹
识别
系统作为私密密钥呢?为什么不使用指纹和/或其他唯一的标识符,如视网膜或晶状体扫描,以标识您的终端到计算机?为什么不使用这种
识别
方法来
识别
所有要保护的
信息提取
和/或进入系统(s)的设备?
浏览 0
提问于2015-01-18
得票数 0
1
回答
使用openie复制提取,如(Angeli et.( al)
然而,它是非常基本的,没有
识别
多个子句,也没有在其基础论文“利用语言结构进行开放领域
信息提取
”中阐明的任何例子。我想复制一下论文中所示的摘录。
浏览 5
提问于2015-09-27
得票数 1
回答已采纳
3
回答
如何
识别
场景图像的文本
、
、
我正在尝试构建一个系统(使用C#),可以
识别
场景图像的文本。我看到场景文本
识别
是一项具有挑战性的任务,因为低分辨率,复杂的背景,不均匀的闪电或模糊效果…… 任何解决这个问题的想法都将不胜感激。
浏览 0
提问于2012-01-08
得票数 0
2
回答
文本分析与自然语言处理有什么区别?
、
、
今天我度过了一个艰难的夜晚,试图说服我的一位同事,NLP或自然语言处理程序是超级集,Text Analytics是其中的一个子集。在最好的情况下,两者可能是同义词,可以互换使用。
浏览 3
提问于2017-08-22
得票数 1
1
回答
文本挖掘:何时使用解析器、标记器、NER工具?
、
、
我正在做一个挖掘博客内容的项目,我需要帮助区分使用哪种工具。什么时候使用解析器,什么时候使用标记器,什么时候需要使用NER工具?顺便说一句,我用的是nltk,但我在看斯坦福大学的标记器或解析器,因为有几个家伙说它很好。
浏览 0
提问于2010-06-24
得票数 1
回答已采纳
1
回答
如何利用机器学习从文本中提取特征?
、
、
、
我想开发某种模型/算法,允许我提取给定产品名称的特征。(比方说品牌、款式和颜色)。例如:{ model: "6s", color: "Silver"如有任何建议,将不胜感激。谢谢。
浏览 0
提问于2018-11-15
得票数 4
回答已采纳
1
回答
如何使用神经网络检测和
识别
文档上的信息?
、
我认为第一步需要使用YOLO网络进行
信息提取
。因此,YOLO网络应该使用如图所示的边界框来本地化此信息: ? 提取信息后,需要对其进行
识别
。所以,我认为这可能是一种类似于车牌
识别
的方法,首先定位车牌,然后
识别
车牌,对吗? 因此,第二步是
识别
本地化信息,如下所示: ? 我认为这种方法与发票处理的一些方法非常相似。
浏览 12
提问于2020-09-11
得票数 0
回答已采纳
1
回答
寻找人工智能(AI)食谱阅读器研究
、
食谱是一个非常有限的领域,在自然语言
识别
引擎中可以做到一定程度的准确性。
浏览 4
提问于2010-08-25
得票数 2
回答已采纳
1
回答
如何使用python & NLTK提取评论的副主题句?
、
、
、
有没有什么有效的方法来使用python和NLTK library.As提取评论的副主题解释?举个例子,关于手机的用户评论可能是“这部手机的电池很好,但显示效果很差”,我想提取上面两个特征,比如"display is a bullshit"<NN.?><VB.?>?<JJ.?> 这个模式作为子topic
浏览 2
提问于2017-05-25
得票数 1
3
回答
从HTML页面中提取文本块的Java库
、
、
、
我想提取所有的文本,但
识别
每一个作为一个单独的文本,而不仅仅是一个。编辑:我使用Jsoup来解析,但我不想进行解析,而是像页面中的boilerpipe那样进行
信息提取
。
浏览 0
提问于2012-01-20
得票数 1
2
回答
通过搜索引擎进行Web挖掘
、
、
当我通过谷歌地图购买公寓时,将各种列表复制到电子表格中,以便更容易地比较和附加注释,这时我意识到这是多么不必要的重复和低效。我可以很容易地写一个脚本来自动查询Google并提取我需要的数据,但是要获得一些数据(例如联系电话号码),我需要沿着一个链接到一个列表特定的网站并四处寻找数据,而我从来没有写过这样动态的网络爬虫。在给定任意HTML的情况下,有哪些常见的数据挖掘和/或机器学习技术和工具来提取一段信息的“最佳猜测”?
浏览 0
提问于2010-11-10
得票数 1
回答已采纳
1
回答
从文档列表中提取一个人的个人信息并进行汇总
、
如果有两个人的名字相同,应该
识别
出正确的人。如果此人有昵称,也需要进行
识别
。程序的输入可以是人名,地址,组织名称等。我已经使用NLTK库从文本中提取了命名实体,如个人,组织,位置等。
浏览 11
提问于2019-03-07
得票数 0
1
回答
Google =是否公式在多个工作表中偶尔工作
、
我使用一个=IF公式来
识别
Sheet1中有数据匹配的实例,并将相应列的头中的
信息提取
到Sheet2中。错误或未能将逻辑函数
识别
为真。 我怎样才能使公式对所有的细胞有效?
浏览 2
提问于2019-12-09
得票数 0
1
回答
基于人类语言的elasticsearch搜索
、
、
、
能让elasticsearch理解人类语言吗?是否有任何软件包或elasticsearch自然支持它?或者如果理论上可能的话,任何基本的想法都可以实现
浏览 1
提问于2016-09-21
得票数 4
回答已采纳
1
回答
在PHP上读取附加到*.fpt文件的*.dbf文件的数据
、
、
、
、
我有一个使用Visual的软件,所以它使用dbf+cdx+fpt文件来存储所有数据。我很幸运,到目前为止,这个项目看起来很棒。但现在我有麻烦了,我不知道你能不能帮我。到目前为止,我使用了以下结构来完成这个任务: 在Windows上,安装了XAMPP,并创建了"Microsoft驱动程序“的OD
浏览 1
提问于2018-07-14
得票数 1
1
回答
在GUI中
识别
的文件类型,但在命令行上不
识别
、
最近我意识到Debian上的file不会
识别
我正在处理的一些文件格式,告诉我它们只是ZIP文件:file.key: Zip archive data, at least v2.0 to extract 但是,如果我使用pcmanfm查看文件,就会发现正确地
识别
了这些文件类型
浏览 0
提问于2022-03-15
得票数 3
回答已采纳
1
回答
对于给定的代表字符串的有限列表的正则表达式的语法推断?
、
、
、
、
我正在分析一个大型公共数据集,其中包含大量冗长的人类可读字符串,这些字符串显然是由一些常规(在形式语言理论意义上)语法生成的。基本上,我正在寻找一个现有的算法(最好有一个现有的参考实现)来获取任意的字符串列表,并尝试来推断出一些可以用来生成它们的最小(对于最小的合理定义)生成正则表达式的集合(即,从由该语法生成的语言的有限字符串集合中推断出一个正则语法)。 我曾考虑过重复进行贪婪的最长公共子字符串消除,但这只能做到这一点,因为它不会
浏览 23
提问于2013-03-20
得票数 25
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一扫即识,3个文字识别APP让信息提取更便捷
时间序列的表示与信息提取
文字识别方法有哪些?4种方法帮你解决信息提取困难的问题!
淘宝新开店旺旺爬虫软件,当天店铺信息提取工具
身份证信息提取的简易方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券