专栏首页人工智能快报德企开发出基于人工智能的新型文本分析技术

德企开发出基于人工智能的新型文本分析技术

新闻门户网站和社会媒体都含有丰富的信息资源,例如对股票市场趋势的预测信息。如今,很多服务提供商允许通过向其搜索引擎输入描述性关键字来搜索大量的文本集。然而关键词往往是高度模糊的,目前的搜索技术常常捉襟见肘。德国的一家企业开发了一种新的文本分析技术,大大提高了利用人工智能技术搜索巨大文本集合的速度。除了搜索之外,这项技术还能协助作者进行研究,甚至能够通过自动提供背景信息帮助编写文本,并给出相关的网站链接建议。

Ambiverse是马普学会信息学院的一家衍生公司。该公司在3月14日到18日的汉诺威CeBIT 2016会议期间展示了这一新技术。生活在商业智能手机和企业聊天室的时代,公司的大部分信息不是通过语言发布的,而是通过电子邮件、分布式数据库,以及内部的新闻门户网站来完成。马普学会情报研究所研究员与Ambiverse公司的创始人Johannes Hoffart表示,根据市场分析公司Gartner的调查显示,目前仅25%的公司在使用自动方法来分析他们的文本信息。Gartner预测到2021年将有65%以上的公司会这样做。这是因为公司的数据量在不断增长,因此保持这些数据的结构化及进行搜索将变得越来越昂贵。他的团队开发了一种新的文本分析技术,用于分析海量文本。在这个背景下,强大的计算能力与人工智能不断“协同思考”来完成任务。

Hoffart表示,对于文本的分析,我们依靠的是非常大的知识图谱。这些图谱有免费的来源,如维基百科或网络上的大型媒体门户网站。这些图谱可以通过领域知识或公司的专业知识进行增强,如产品目录或客户信函。通过使用复杂的算法,这些文本会得到进一步的筛选,并借助语言工具进行分析。他解释说:“随后,我们的软件会将企业和业务领域分配到相应的类别,这使我们能够收集宝贵的意见,指导我们如何在市场中将自己的产品与竞争对手进行对比定位”。特别具有挑战性的是,产品或公司名称在不同的环境中往往有完全不同的含义,导致它们非常难以识别。

这位计算机科学家解释说:“我们的技术可以将单词和短语映射到真实世界的正确目标,从而可以自动解决模糊问题。例如,“巴黎”这个词可以表示光之城和法国首都,也是希腊神话中的一个角色,或是大家耳熟能详的一个具有德国祖先的派对女孩-其真实含义总是依赖于上下文的。只有当名称或概念的不同含义得到正确解决,才可能有效地搜索巨大的文本集合。随着时间的推移,由他的团队开发出的智能搜索引擎会得到不断的学习与提高,从而可以自动将新的文本条目匹配到合适的类别。于是,对利用分析网络媒体或社交网络来衡量产品的知名度或营销活动的成功度的公司来说,这些算法就具有了吸引力。”

本文分享自微信公众号 - 人工智能快报(AI_News)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-05-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 人工智能帮助打击盗猎者

    盗猎者每天大约会杀害96头非洲大象。而生态环保人士发出警告,认为如果不扭转局势,这种标志性的动物可能在未来几十年就惨遭灭绝。但现在,科学家希望通过一种新的人工智...

    人工智能快报
  • 深度学习可听到机器故障信号

    人们绝不想开车开到在路上出故障了才想起要日常保养,但预防性维护检查或定期维护检查经常发现不了可能会出现的问题。一家初创公司提出了更好的办法:利用人工智能去听车辆...

    人工智能快报
  • 英特尔拟在2022年赢得100亿美元人工智能芯片市场

    英特尔执行副总裁Navin Shenoy表示,该公司计划在2022年赢得100亿美元的人工智能芯片市场。

    人工智能快报
  • 大盘点|OCR算法汇总

    介绍了一种基于旋转的新颖网络框架,用于自然场景图像中面向任意方向的文本检测。论文的主要思想为旋转区域提案网络(RRPN),该网络旨在生成带有文本方向角度信息的倾...

    3D视觉工坊
  • 锚文本具体有那些作用?

    很多人都知道锚文本,但是很多人都不确切锚文本究竟改看看,一般做锚文本分为车站内做锚文本和站外锚文本,锚文本只不过是链接的一种方式,那么明确锚文本有那些作用呢?上...

    小白程序猿
  • 文本挖掘 – Text mining

    文本摘要:许多文本挖掘应用程序需要总结文本文档,以便对大型文档或某一主题的文档集合做出简要概述。

    easyAI
  • 浙江大学和海康威视提出:视频场景文本定位算法SVST(集成检测,跟踪和识别于一体)

    【导读】本文分享一篇浙江大学和海康威视最新联合提出的视频场景文本定位(Video Scene Text Spotting)方向的算法:SVST(spotting...

    Amusi
  • 海量短文本场景下的去重算法

    在大多数情况下,大量的重复文本一般不会是什么好事情,比如互相抄袭的新闻,群发的垃圾短信,铺天盖地的广告文案等,这些都会造成网络内容的同质化并加重数据库的存储负担...

    腾讯QQ大数据
  • 【NLP保姆级教程】手把手带你RCNN文本分类(附代码)

    之前介绍的都是属于深度神经网络框架的,那么在Deep Learning出现或者风靡之前,文本分类是怎么做的呢?

    NewBeeNLP
  • <i>标签

    Html5知典

扫码关注云+社区

领取腾讯云代金券