专栏首页CSDN技术头条为什么说 NLP 将是未来数据领域的珠峰?

为什么说 NLP 将是未来数据领域的珠峰?

人工智能或许是人类最美好的梦想之一。追溯到公元前仰望星空的古希腊人,当亚里士多德为了解释人类大脑的运行规律而提出了联想主义心理学的时候,他恐怕不会想到,两千多年后的今天,人们正在利用联想主义心理学衍化而来的人工神经网络,构建的超级人工智能成为最能接近梦想的圣境,并一次又一次地挑战人类大脑认知的极限。

在以大数据、云计算为背景的技术框架支撑下,互联网发展极为迅速,过去一个技术或者行业热点从诞生到消亡需要几年乃至更长的时间。

但是最近几年,其生命周期在不断缩短,大多数的热点从产生到消亡只需要1-2年,有些仅仅是半年甚至几个月的时间。

互联网行业越来越凸显出快鱼吃慢鱼的特点。从技术本身也有体现,比如2012-2014年是移动互联网的热潮,Android 和 iOS App 开发工程师当时非常流行。

随后,2015大数据、云计算之年,2016年后大数据时代,2017年被称为人工智能元年,2018年炒得最火的是区块链和币圈。

在互联网以这种迅雷不及掩耳之势的发展速度下,作为初学者就很容易被各种技术概念迷惑,找不到自己想要的突破口和深入的领域,即便是计算机从业者有时候也分不清到底如何定位自己未来的技术方向。

数据领域的发展将何去何从?

首先,我们从中国互联网的四大浪潮说起。

互联网从1994年诞生(加入国际互联网)到现在才短短的24年,就在这24年里,我们经历了四次非同凡响、一次比一次更彻底的发展大高潮。

第一次互联网大浪潮(1994年—2000年),以四大门户和搜索为代表,能做网站的工程师就可以被称为技术牛人;

第二次互联网大浪潮(2001年—2008年),从搜索到 PC 端社交化网络的发展,我们的社交形态发生了根本的变化,从线下交流正转变为线上交流,大量的数据开始生成;

第三次互联网大浪潮(2009年—2014年)PC 端互联网到移动互联网,此时各种 App 如雨后春笋般的冒出来,尽管后来有很多 App 都死了,但是移动互联网几乎颠覆了整个中国老百姓个人生活和商业形态,改变着我们每一个人的生活、消费、社交、出行方式等。

第四次互联网大浪潮(2015—至今),是在前三次发展基础上,以大数据、云计算为背景发展起来的人工智能技术革命,分布式计算让大数据处理提速,而昔日陨落的巨星深度学习此刻再次被唤醒,并很快在图像和语音方面取得重大突破,但在自然语言方面却显得有些暗淡,突破并不是很大。

尽管有很多人都去从事计算机视觉、语音等方面的工作,但随着 AI 的继续发展,NLP 方向正显得越来越重要。

接着,我们总结一下数据领域成就和挑战。有一个不可否认的事实,当前从事互联网的人们已经制造出了海量的数据,未来还将继续持续,其中包括结构化数据、半结构化和非结构化数据。

我发现,对于结构化数据而言,在大数据、云计算技术“上下齐心”的大力整合下,其技术基本趋向成熟和稳定,比如关系型数据库以及基于 Hadoop 的 HDFS 分布式文件系统、Hive 数据仓库和非关系型数据库 Hbase,以及 Elasticsearch 集群等数据存储的关系数据库或者 NoSQL,可以用来管理和存储数据;

基于 MapReduce、Spark 和 Storm、Flink 等大数据处理框架可以分别处理离线和实时数据等。

而半结构化、非结构化的数据,除了以 ELK 为代表的日志处理流程,过去在其它限定领域基于规则和知识库也取得了一定的成果,因其自身的复杂性,未来更多领域应用都具有很大的困难和挑战。

最后,我们看看国内外人工智能领域的工业现状。 今年5月19日我有幸在北京国家会议中心参加了2018全球人工智能技术大会(GAITC)。

在大会上,从中国科学院院士姚期智提出人工智能的新思维开始,其重点讲述了人工神经网络为代表的深度学习以及量子计算机将是未来发展的新思维;

紧接着中国工程院院士李德毅分享了路测的学问——无人驾驶的后图灵测试,提出未来无人驾驶挑战应该是让无人驾驶具有司机的认知、思维和情感,而不是当前以 GPS 定位和动力学解决无人驾驶的问题;

接下来微软全球资深副总裁王永东向我们展示的微软小冰,大家一起见证了微软小冰在社交互动、唱歌、作诗、节目主持和情感方面不凡的表现,而本人也真实测试了一下,小冰现在的表现已经非常优秀了。

然而要达到一个成年自然人的水平,在某些方面还不能完全表现出人的特性。下面这幅图是微软小冰的个人介绍。

人工智能产业的快速发展,资本市场大量资金涌入,促使中国人工智能领域投融资热度快速升温,这充分表明资本市场对于人工智能发展前景的认可。

《2018年人工智能行业创新企业 Top100》发布,据榜单显示:进入2018年人工智能行业创新企业前十名的企业分别是:百度、阿里云、美图秀秀、华大基因、科大讯飞、微鲸科技、华云数据、爱驰亿维、青云、七牛云。

作为人工智能的一个重要组成部分,自然语言处理(NLP)的研究对象是计算机和人类语言的交互,其任务是理解人类语言并将其转换为机器语言。

在目前的商业场中,NLP 技术用于分析源自邮件、音频、文件、网页、论坛、社交媒体中的大量半结构化和非结构化数据,市场前景巨大。

为什么说未来数据领域的珠穆朗玛峰是中文自然语言处理?

正是基于上面对中国互联网发展的总结,对当前数据领域所面临的挑战以及资本市场对人工智能的认可分析,未来数据领域的重点是自然语言处理技术及其在智能问答、情感分析、语义理解、知识图谱等应用方面的突破。

对于我们国内中文来说,如何更好的把前面所说的应用在中文处理上,显得更为重要和急迫。

本文分享自微信公众号 - GitChat精品课(CSDN_Tech)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-12-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何确保A.I.营养充足

    人工智能就像孩子一样,需要合适的教育来激发他们的潜能,也需要合适健康的饮食——高质量的数据。 业务的快速增长亟需人工智能加快判断能力,但是在人工智能的黑盒子里,...

    CSDN技术头条
  • 是什么技术让人工变得“智能”?

    在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。

    CSDN技术头条
  • Google Deepmind的自杀开关研究或缓解人工智能恐慌

    很多人被科幻电影中描述的机器人统治世界的暗示吓到了,现在,Google的一项研究可能会缓解人们的这种恐惧。 Google的DeepMind是伦敦的一家人工智能...

    CSDN技术头条
  • 人工智能已箭在弦上,创业者还有哪些机会?

    最近,阿里云研究中心发布了《人工智能:未来致胜之道》的报告,对于人工智能的定内涵、应用、未来趋势、格局都做了详尽的分析,非常具有参考意义。其主要观点有: 数据、...

    AI科技评论
  • “汇新杯”新兴科技成果专项赛——人工智能

    为深入贯彻落实党的十九大报告中提出的“加快建设创新型国家”国家战略,根据《中国制造2025》、《国务院关于深化“互联网+先进制造业”发展 工业互联网的指导意见》...

    创成汇创新创业大赛
  • 【人工智能≠类人智能】超越图灵测试的世界观

    I.人们对于人工智能这个热点话题仍说法各异。 像史蒂芬·霍金、伊隆·马斯克、比尔·盖茨这样的专家,最近越发看重它的潜力和威胁。在读完尼克·博斯特伦《超级人工智能...

    新智元
  • 【人工智能≠类人智能】超越图灵测试的世界观

    I.人们对于人工智能这个热点话题仍说法各异。 像史蒂芬·霍金、伊隆·马斯克、比尔·盖茨这样的专家,最近越发看重它的潜力和威胁。在读完尼克·博斯特伦《超级人工智能...

    新智元
  • 关于人工智能,麦肯锡五问专家

    麦肯锡发布了其对人工智能业内专家的访谈记录,多位专家就以下五个问题分享了自己的观点。 Q:当前推动人工智能发展的动力有哪些? 全球对冲基金巨头城堡公司(Cita...

    人工智能快报
  • 人工智能在牙科领域的未来

    我们中的一些人还记得威尔·罗宾逊在20世纪60年代的《迷失太空》系列中忠实的机器人朋友。其他人将把智能自动机器人的科幻愿景追溯至《终结者》(Terminator...

    程序你好
  • 2020科幻元年来了!面对愈发智能的机器,人类“最强大脑”有哪些建议?

    1982年《银翼杀手》上映,电影中幻想着37年后的世界。现在是2019年12月,洛杉矶一切正常,我们没有被“复制人”所带来的伦理问题所困扰,也没有拥有赛博朋克化...

    大数据文摘

扫码关注云+社区

领取腾讯云代金券