Web与人工智能时代

摘要 “人工智能”一词最初是在1956年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能(Artificial Intelligence)英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。
视频内容

增强人类的智慧

现在人工智能非常火,首先是因为云计算发达,提供了强大的计算能力。

高强度的算法可以帮助做到人工智能。

人工智能需要大量数据来训练、规划,我们有海量的数据来做人工智能。

这是人工智能三股强大的动力。

MicrosoftGraph是一个开发平台,它提供了强大的网络、强大的API,可以连接不同的数据、不同应用。利用相应平台的不同数据,做到跨设备跨平台的无缝对接。

AI Infrastructure&Service

微软在人工智能提供了不同的平台,要把AI带到每个人身边,让不同层次的开发者都能利用微软技术帮助他们的业务。

如图所示,最底层是硬件的创新,有海量的硬件计算能力。有GPU、scale和FPGA。例如FPGA可以把相应的算法编成可编程的阵列写进硬件里,使计算更高速。

上一层提供了海量数据的存储和分析。

第三层是Machine Learning的算法,Cognitive Toolkit。提供了开源算法的工具包,研究人员可以用工具包来写自己的算法并研究相应的人工智能技术。

Azure Machine Learning Studio是Azure的一项机器学习的服务,服务包含了一些现成算法。通过可视化界面,用拖拉拽的方式就可以将算法运行起来,也可以添加Python或者R的脚本。数据科学家只需理解这些算法,但不用自己写太高难度的算法。

CognitiveService供开发者使用,它是一套API,可以直接调用。

微软在不同层次提供了相应的服务。

Microsoft AI Portfolio

从另一个维度来看,微软人工智能的四大支柱是Agent、Applications、Services、Infrastructure。

Agent:有Cortana和XiaoIce。

Applications:微软把人工智能技术运用到自家的应用里,比如office、输入法、pix和skype等等。

Services:还有像Bot Framework、Cognitive Services、Cognitive Toolkit等相应的Services。

Infrastructure:基础设施,比如硬件、存储、分析都属于Infrastructure,微软提供了相应的一些基础设施服务用于机器学习。

Cognitive Services

认知服务是一套REST API,无论是写Web、Andriod还是ios,不管是什么样的开发者,都可以使用这套REST API来帮助业务或应用服务变得更加智能化。

CognitiveServices主要有五个部分,vision、language、speech、search和knowledge。

在之前的推广过程中,我们发现很多开发者喜欢自定义的东西,所以我们推出了自定义服务。

比如自定义的视觉服务、自定义智能语言理解服务、自定义语音服务、自定义搜索和自定义决策。

视觉

计算机影像API:上传一张图,它可以识别出图中的内容。

人脸API:做人脸识别、登录等操作。

内容审查器:内容合法性识别。

情感API:把人脸分析成八种表情并识别出来,每种表情给出百分比数据。

Video API:对视频进行防抖处理、动作检测、人脸追踪等。

CustomVision Service:自定义计算机视觉服务。

Video Indexer:识别视频内容、对视频进行分析。

先进的图像处理算法可帮助自动审查内容,通过返回人脸、图像和情绪等智能见解构建更人性化的应用。

Computer Vision

Analyze Image

识别出图片里的内容。

OCR

提取图片中的文字。

它会把图片的语言、方向、文本的位置都识别出来,可以做叠加。目前更适合做文本的扫描,全球版还能识别手写的文字。

Smart Thumbnail

用API做图片的智能识别。

Face APIs

FaceAPI——Detection

上传一张人脸图片,人脸检测会返回一个json的格式。Json格式包含了人脸的属性、人脸特征点的位置。

Face API——Verification

Face API——Group

人脸分组。

FaceAPI——Identify

人脸识别需要先上传图片,建立一个库。以后根据人脸的特征点就能进行识别。

Emotions APIs

语音

处理应用程序中的语音。

自定义语音服务:在特定场景下,对一些特定词汇进行调整,提高识别率。

说话人识别API:先训练几段语音,在后来上传语音的时候就能自动进行识别。

Translator语音API:通过语音进行翻译。

还有必应语音API。

语音API

Voice Recognition Model

语音识别分为REST和WebSocket两种方式。Result通过N-Bset的算法计算出来。

Custom Speech自定义语音识别服务

克服语音识别障碍,如说话风格、词汇和背景噪音。用户可以通过调整语音识别器的语言模型,使其匹配应用程序的词汇和用户的说话风格,针对自己的场景进行自定义,提高语音识别在特定场景的识别率。

语言

语言理解智能服务(简称LUIS, luis.ai)、Web语言模型API、Translator文本API、必应拼写检查API、文本分析API、Linguistic Analysis API。

让应用能够处理自然语言、评估观点和主题,并了解到如何识别用户需求。

文本分析API

情感分析:该API会在完成分析后返回一个介于0-1之间的分值。接近1的分数表示积极情感,接近0的分数表示消极情感。情感分数是基于分类技术而产生的。分类器的输入特性包含n-gram,词性标签中的特性以及单词嵌入。目前,支持的语言包括英语、法语、西班牙语和葡萄牙语。

关键短语提取:该API会返回一个字符串列表表示输入文本的要点。我们采用Microsoft Office的复杂的自然语言处理工具。目前,英语是唯一受支持的语言。

话题检测:这是一个新发布的API。该API可以返回在提交的文本中所检测到的话题。话题是根据一个关键短语来确定的,关键短语可以是一个或者多个相关联的词语。该API要求每次提交至少100条文本记录,可以帮助你在成千上万条文本记录中检测话题。每一次文本记录提交均会收取一次API调用费用。该API适用于人类书面编写的较短的文本,例如评论或用户反馈等。

语言探测:API会返回探测到的语言以及一个介于0-1之间的数值。数值为1表示100%确定探测到的语言种类。目前共支持120种语言。

Language Understanding Intelligent Service

人类要表达一个意思,有好几种说话方式。Language Uderstanding Intelligent Service就是要让计算机也能够理解人类用不同方式表达出的同一个意思。

Intent,意图,是指所要表达的意思。

Entites是一个实体,就是里面的参数。

用户可以通过自定义意图和实体,在用户的场景下实现定制化的语音理解服务,一般可以与Bot Framework结合,实现智能客服的场景。

QnAMaker,这个服务可以快速生成一个能够回答FAQ问题的智能客服机器人。

知识

详细规划复杂的信息和数据,以解决智能推荐和语义搜索等任务。

搜索

通过必应搜索API使你的应用、网页和其它体验功能更加智能、更具吸引力。

实验室项目

发掘探索最新的认知服务技术。在认知服务正式发布之前,可以在这里探索、尝试新的认知服务技术,并提供反馈。

Redefining Microsoft with AI

人工智能需要大量数据,最重要的是如何去获取这些数据。Microsoft Graph允许用户使用组织内的数据来推动人工智能的转型。它借助office365、必应这些数据和外界数据的结合,与业务系统结合,打造出很多智能应用和服务。

我今天的演讲就到这里,谢谢大家。

原文发布于微信公众号 - IT大咖说(itdakashuo)

原文发表时间:2017-08-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

微软为Power BI推出AI模型构建器、关键驱动分析和Azure机器学习集成

微软的Power BI是一种商业分析服务,用户可以在不具备编程经验或深厚技术专长的情况下创建报告、仪表盘等更多内容。公司今天宣布了一些新的AI功能,包括图像识别...

10820
来自专栏人工智能头条

如何利用“图计算”实现大规模实时预测分析

21720
来自专栏机器之心

业界 | 无缝整合PyTorch 0.4与Caffe2,PyTorch 1.0即将问世

21150
来自专栏Python中文社区

大数据告诉你买车的正确姿势!

專 欄 ❈ hectorhua,Python中文社区专栏作者,研究生毕业,现居北京。目前在互联网企业,擅长领域python数据抓取,清洗整合。 博客地址:ht...

21160
来自专栏机器之心

资源 | OpenAI发布强化学习环境Gym Retro:支持千种游戏

14750
来自专栏PPV课数据科学社区

R语言什么鬼??你知道吗?

R语言什么鬼?可以用来做什么?和大数据又有什么关系?有没有好的课程推荐啊?学大数据一定要懂R语言么?…… 网络上太多类似的问题,如果恰好你也有类似的疑惑,那么...

35140
来自专栏知晓程序

秒杀微信运动!有了它,在微信群也能 PK 步数 | 亲儿子 #15

所以,除了每晚 10 点推送的微信运动好友排名,这个小程序还能直观地显示出微信群好友的运动情况。

11220
来自专栏BestSDK

【重磅!】Facebook 发布开源框架 PyTorch,兼容 Python

本周,Facebook 的 AI 研究团队发布了一个 Python 工具包,专门针对 GPU 加速的深度神经网络(DNN)编程。它有望辅助、或在一定程度上替代,...

41060
来自专栏AI科技评论

动态丨Facebook 发布开源框架 PyTorch, Torch 终于被移植到 Python 生态圈

本周,Facebook 的 AI 研究团队发布了一个 Python 工具包,专门针对 GPU 加速的深度神经网络(DNN)编程。它有望辅助、或在一定程度上替代,...

32470
来自专栏PPV课数据科学社区

关联分析案例:一套数据学会如何从数据到信息到决策

俗话说,忘记历史就是背叛自己,今天这篇用此做开场再合适不过。 这一篇将根据一个虚拟的故事,来介绍如何通过历史数据来帮助一个销售人员发现规律信息从而辅助他来做一些...

46340

扫码关注云+社区

领取腾讯云代金券