德企开发出基于人工智能的新型文本分析技术

新闻门户网站和社会媒体都含有丰富的信息资源,例如对股票市场趋势的预测信息。如今,很多服务提供商允许通过向其搜索引擎输入描述性关键字来搜索大量的文本集。然而关键词往往是高度模糊的,目前的搜索技术常常捉襟见肘。德国的一家企业开发了一种新的文本分析技术,大大提高了利用人工智能技术搜索巨大文本集合的速度。除了搜索之外,这项技术还能协助作者进行研究,甚至能够通过自动提供背景信息帮助编写文本,并给出相关的网站链接建议。

Ambiverse是马普学会信息学院的一家衍生公司。该公司在3月14日到18日的汉诺威CeBIT 2016会议期间展示了这一新技术。生活在商业智能手机和企业聊天室的时代,公司的大部分信息不是通过语言发布的,而是通过电子邮件、分布式数据库,以及内部的新闻门户网站来完成。马普学会情报研究所研究员与Ambiverse公司的创始人Johannes Hoffart表示,根据市场分析公司Gartner的调查显示,目前仅25%的公司在使用自动方法来分析他们的文本信息。Gartner预测到2021年将有65%以上的公司会这样做。这是因为公司的数据量在不断增长,因此保持这些数据的结构化及进行搜索将变得越来越昂贵。他的团队开发了一种新的文本分析技术,用于分析海量文本。在这个背景下,强大的计算能力与人工智能不断“协同思考”来完成任务。

Hoffart表示,对于文本的分析,我们依靠的是非常大的知识图谱。这些图谱有免费的来源,如维基百科或网络上的大型媒体门户网站。这些图谱可以通过领域知识或公司的专业知识进行增强,如产品目录或客户信函。通过使用复杂的算法,这些文本会得到进一步的筛选,并借助语言工具进行分析。他解释说:“随后,我们的软件会将企业和业务领域分配到相应的类别,这使我们能够收集宝贵的意见,指导我们如何在市场中将自己的产品与竞争对手进行对比定位”。特别具有挑战性的是,产品或公司名称在不同的环境中往往有完全不同的含义,导致它们非常难以识别。

这位计算机科学家解释说:“我们的技术可以将单词和短语映射到真实世界的正确目标,从而可以自动解决模糊问题。例如,“巴黎”这个词可以表示光之城和法国首都,也是希腊神话中的一个角色,或是大家耳熟能详的一个具有德国祖先的派对女孩-其真实含义总是依赖于上下文的。只有当名称或概念的不同含义得到正确解决,才可能有效地搜索巨大的文本集合。随着时间的推移,由他的团队开发出的智能搜索引擎会得到不断的学习与提高,从而可以自动将新的文本条目匹配到合适的类别。于是,对利用分析网络媒体或社交网络来衡量产品的知名度或营销活动的成功度的公司来说,这些算法就具有了吸引力。”

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-05-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

百度IDL最新成果:从自然语言入手,教AI智能体像人类一样学习

尽管人工智能取得了巨大的进步,但在许多方面仍然存在局限。例如,在电脑游戏中,如果AI智能体未预先编程游戏规则,则必须尝试数百万次才能确定正确的选择。人类可以在更...

2896
来自专栏人工智能

车品觉:人工智能快速增长的两个动因

使得人工智能快速成长的力量来自哪里?来自以下这么几个方面:机器学习提高了预测的精度,大型的数据集驱动有更多的新型的智能应用,整个运算的机器从GPU到了TPU,强...

1865
来自专栏开源优测

大数据测试学习笔记之数据质量

大数据测试学习笔记之数据质量 数据质量定义 先搜索了一把,发现当前对于数据质量的定义没有一个共识的定义,通过阅读一些资料,做了些总结,可以从以下几个方面来定义数...

4278
来自专栏企鹅号快讯

前沿人工智能技术,日益改变我们生活

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然...

36210
来自专栏软件成本造价评估

软件项目工作量估算中使用的功能点方法是什么?

简单的说,功能点方法是一种估算软件项目大小的方法,它是从用户视角出发,通过量化系统功能来度量软件的规模,这种度量主要基于系统的逻辑设计。功能点规模度量方法在国...

2476
来自专栏ThoughtWorks

数据质量管理的一些思考

在近期的项目当中,我们为客户落地实施了数据资产平台。随后,在数据平台中接入了客户子公司的一个业务系统的明细数据。客户希望在我们的数据平台上通过数据探索和数据分析...

1604
来自专栏ATYUN订阅号

亚马逊为开发者带来249美元的学习工具:DeepLens深度学习相机

亚马逊的云计算子公司亚马逊网络服务(AWS)终于为美国开发者推出了DeepLens深度学习相机。

1003
来自专栏数据猿

四方伟业上海售前总监任鹏:智能分析在智慧司法系统的应用

2017年11月10日,由上海大数据联盟、数据猿主办,上海科睿联合主办的《构建智慧法院,促进司法职能——魔方大数据》在上海超级计算机中心举行。本站整理了四方伟业...

32911
来自专栏机器之心

观点 | 除了学位证书,如何证明自己的深度学习实力?

选自fast.ai 作者:Rachel Thomas 机器之心编译 参与:蒋思源、晏奇 不是研究生,不是相关专业的我们又该怎样证明自己的深度学习技能?也许很多读...

2686
来自专栏灯塔大数据

Google大数据案例解析

将系统产生的大数据传输,存储,分类等很多是技术型工作,随着大数据技术的发展,通用的解决方案,越来越成熟,也越来越廉价(几乎每两年存储价格降低一倍)。但是对于大...

2865

扫码关注云+社区