首页
学习
活动
专区
工具
TVP
发布

只要 1 分钟,人工智能了解一下!

图文综合整理自KnowingAI知智

你说的人工智能是哪种智能?

一分钟,轻松了解 AI 领域基础概念!

通常人们所说的人工智能,和真正的人工智能是什么关系?

「通用人工智能」(AGI)「应用人工智能」(Applied AI)最大的区别是什么?

不用很麻烦很累,点击观看下方视频,你对人工智能的认知就能轻松超过全世界 99% 的人类!

欢迎大家留言讨论~

一分钟看懂计算机视觉

为什么要让计算机看见世界?

让计算机看见世界分几步?又有什么用?

图文版本,送给不方便打开视频的朋友们(☆w☆)

计算机视觉是一门研究让机器「看」见世界的科学。

人类能够认出照片中的事物,推理它们之间的关系,但对于计算机来说,图像只是一连串 RGB 数值 ,没有任何意义。

让机器看见世界有四个阶段,也是计算机视觉的四个核心问题:

图像分类(image classification),即为不同的图片打上对应标签;

物体检测(Object Recognition),找到物体的位置,并认出他们是什么;

语义分割(Semantic Segmentation),找到物体之间的关系和联系;

视频分析(Video Analysis),即看懂视频中的内容。

(前两者让计算机「看见」世界,后两者让计算机「看懂」世界。)

让计算机看见世界有什么用?

小到手机拍照中的人脸定位,银行里的人证比对

大到自动驾驶医疗影像诊断,都是计算机视觉的用武之地。

一分钟看懂语音识别

将语音变成文字,总共分几步?

图文版本,送给不方便打开视频的朋友们(☆w☆)

与计算机视觉不同,语音识别有且只有一个核心任务——

将人类的语音转换成文字

这个过程并不涉及对语音内容的理解

机器如何识别语音?

语言由单词组成,单词由音素组成。

我们将一段语音的声波按帧切开用帧组成状态用状态组成音素再将音素合成单词,语音就变成了文字。

严格来说不是逐帧切开,帧与帧之间有所交叠

与语音相关,仍属人工智能研究范围内的任务还有不少。

声纹识别(Speaker Recognition),即识别说话者是谁;

语音合成(Speech Synthesis),即将文字信息转换为人类听得懂的语音。

Siri、智能音箱、车载设备,都是语音识别看得见、摸的着的应用。

感觉效果不好?口音、距离、噪声都会影响识别结果,下次可以换个安静的环境试试。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190108A15NFF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券