展开

关键词

人工智能 - 语音识别的技术原理是什么

深入浅出地介绍了基于HMM的语音识别的原理,不注重公式的细节推导而是着重阐述公式背后的物理意义。 2. Bilmes J A. 详细介绍了用E-M算法训练HMM参数的推导过程,首先讲E-M的基本原理,然后讲解如何应用到GMM的训练,最后讲解如何应用到HMM的训练。 3. 语音识别的第一个特点是要识别的语音的内容(比声韵母等)是不定长时序,也就是说,在识别以前你不可能知道当前的 声韵母有多长,这样在构建统计模型输入语音特征的时候无法简单判定到底该输入0.0到0.5秒还是0.2 解码的原理通常是在给定了根据语法、字典对马尔科夫模型进行连接后的搜索的网络(网络的每个节点可以是一个词组等)后,在所有可能的搜索路径中选择一条或多条最优(通常是最大后验概率)路径(字典中出现词组的词组串 以上就是我理解的语音识别的原理,包括大致的系统构成和基本设计思路。

60520

AI智能体使用日常语言生成解释其行为的原理

观众观看智能体玩视频游戏Frogger,然后根据每个人对人工智能游戏动作的描述程度,以描述AI移动的好坏对屏幕上列出的三个原理进行排序。 向上,向下,向左或向右移动的简单游戏机制允许参与者看到AI正在做什么,并评估屏幕上的基本原理是否清楚地证明了移动的合理性。 参与者根据以下因素判断原理: 信心:这个人对AI执行任务充满信心 类人的:看起来像是由人类做出决定 充分的理由:充分证明采取的行动是正确的 可理解性:帮助人们理解AI的行为 AI生成的理论,在参与者中排名较高 另一项相关研究证实,研究人员决定设计他们的AI智能体,使其能够提供两种不同类型的原理中的一种: 简洁的,专注的 整体的,全貌 在第二项研究中,参与者在观看AI玩Frogger后才获得AI生成的原理。 他们被要求在人工智能出错的情况下选择他们更喜欢的答案,他们不知道原理分为两类。 四分之三的参与者赞成分类为“全貌”类别的答案。

38620
  • 广告
    关闭

    腾讯云校园大使火热招募中!

    开学季邀新,赢腾讯内推实习机会

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    春节赏花赏月赏秋香,没有这个小程序怎么行?

    今天推荐的小程序是一个帮你了解花朵类目的小程序「花君」。你可以把看到的花都拍下来,它会告诉你这是什么花。 花君的页面非常简洁,打开就看到发现页面,直接可以拍照花。 ? 花君还有一个「花园」。 知晓君自己试了一下,发现花君的成功率还是很高的,成功识别出了山茶花和牡丹花。 即使知晓君自己用来识别的牡丹花是一幅画,花君还是成功识别出来了。 ? 这个「花君」的小程序是由腾讯「你所见」 AI 产品团队研发,通过人工智能技术,为用户提供智能识别植物服务的小程序。目前可以识别近 6000 植物品种,准确率达到了 90%,居行业第一。 ? 二者都是由「你所见」AI 产品团队研发,QQ 浏览器下拉扫一扫除了植物识别之外,还能识别 600 万本图书、60 万红酒酒标和 2500 款汽车,识别率均达 80% 以上,在识别率和线上内容储备上均超越市场上同类功能应用 此外,为了更方便赏花,在今年广州花市期间,除了为用户提供丰富的植物知识,腾讯还将投放印有广州花城版的AI 卡片,到各大花市、各大花景公园,让大家逛花市的同时,能够更全面了解我们周围的花草植物。

    26030

    「形色」专访:爆款识花软件的炼成之路

    在知乎上,有人将几种常见识花软件进行对比,雷锋网 AI 研习社看到,形色花的好评数很多,而微软花相较来说准确度逊色于其他主流花软件。 有人提出这样一种看法,「形色识别的准确度比较高是因为前期训练数据比较多,而微软花识别率太低是因为训练数据少,但他们的算法相对来说比较优秀。」 「最初版本的人工智能,其实是『人工+智能』,当时为了避免因为数据不足而产生的识别错误,我们还在后台配备了人工解答问题。」 除了中国版,形色也推出海外版花软件 PictureThis,对于推出海外版的原因,形色对雷锋网 AI 研习社如是说道,「一方面,全球化是目前软件发展的趋势,软件做大后肯定要走向更广阔的市场;另一方面, 未来,他们会进一步进军海外市场,推出更多语言版本的形色,让世界各地的人们都能享受人工智能带来的便捷和乐趣。各位小伙伴也可以即刻体验形色带来的花乐趣。

    74940

    最新:中国第一本《人工智能基础(高中版)》教材,你能看懂吗?

    华东师大二附中、上海交通大学附中、清华大学附属中学、上海市市西中学等40所全国学校成为首批“人工智能教育实验基地校”。这是国内中等教育体系首次引入AI教材,人工智能教育在中国正式迈入基础教育阶段。 本书是面向高中学生的教材,讲授人工智能的发展历史、基本概念以及实际应用,使学生理解人工智能的基本原理,特别是数据、算法与应用之间的相互关系。 并结合常见的应用场景,理解人工智能技术(包括感知与决策)的基本工作方式,通过动手实践,更深入地理解人工智能技术的原理、能力,以及在实用中面临的挑战。 本书强调人工智能基本理念与原理的传递,注重创造力、想象力、整体思考,以及动手能力的提升。 读者评价: 作为研究生毕业的文科生,真心看不懂这个高中版里面的数学啊! ——悠悠地游 向我科普了几种每天在用的技术背后的算法,比如花和听歌曲。读完我最大的感受是人类是比上帝更慷慨的造物主。

    28920

    人民大学提出听音AI框架,不用人工标注,嘈杂环境也能Hold住,还可迁移到物体检测

    比如这个演奏会视频,AI就能判断出哪些乐器在发声,还能定位出各自的位置。 这是中国人民大学高瓴人工智能学院最近提出的新框架。 对于人类而言,听音物是一件小事,但是放在AI身上就不一样了。 然后运用聚类的方法,让AI把所有的样本进行划分。聚类的每一个簇,被认为能够代表一种语义类别的视觉表征集合。 由此一来,AI便在无形之中掌握了不同乐器在外观和声音上的关系,也就是可以听音物了。 具体来看,对于某一帧多声源的场景,AI会先从画面中提取到不同物体的特征,然后再和字典中的各个类别比对,从而完成听音物的初步定位。 △每行前3张为真实演奏场景,后4张为合成场景 在具体表现上,研究人员分别使用了合成音乐、二重奏等4个数据集来测试这个框架识别的水平。 团队主要来自人大AI学院 本项研究由中国人民大学高瓴人工智能学院主导,通讯作者为GeWu实验室胡迪助理教授,主要内容由GeWu实验室博士生卫雅珂负责。

    8840

    被小米的智能物感动到哭

    郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 小米手机的相机里,隐藏了一个“智能物”的AI。你只需要拍摄一张照片,这个AI就能识别出来你拍的是什么。 △ 出处请见水印 这个尴尬的画面,就是前不久网友们活捉的小米智能物“智障”瞬间。 然而,你可别小看这个AI。 它可是一个求生欲很强,很有套路的人工智能。比方,让这个AI识别这张照片。 ? 在小米的官网应用商店里,对“智能物”的评价严重两极分化:46%的用户打了五星,36%的用户打了一星…… 这个AI到底有怎么样? 量子位搞了一场识别评测,一组人脸,一组物品。 物品挑战:玉米生姜傻傻分不清 找一些日常用品,也能成功“刁难”AI。 ? 胸,贴? 为不熟悉的朋友们科普一下,这是一种可以有效防止胸部激*凸的道具。看来小米智能物懂得很多。 ? 但出身小米的智能AI却和微软AI“心灵相通”,它的识别结果是这样的: ? 五个在我们人类看来奇形怪状的生成物中,其中三个小米智能物都成功识别出是鸟类。难道,小米和微软“串供”了?

    51450

    AI智能技术是如何监控学生上课行为的?原理是什么?

    随着网络信息的高速普及,智能手机的更新换代,越来越多的学生都拥有智能手机。 基于上述种种,校园智能手机检测成为校园课堂教学活动的监管重点之一。 随着AI智能检测分析、大数据、互联网等新兴技术的发展,AI智能检测学校学生玩手机的场景,已经成为智慧校园管理的重要一环。 针对以上痛点和AI智能科技的运用,TSINGSEE青犀视频以AI智能分析为依托,通过云平台数据汇总、GPS定位、智能告警与安防监控视频等功能,联合高校研发,助力打造AI智能别的产学研项目,实现AI智能识别学生课堂玩手机的监测 作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。 技术实现 1.输入手机图片。 技术扩展应用 课堂智能手机使用的智能识别检测研究,不但能应用到学校课堂当中,还可以应用到日常办公等场景。而且这一套目标检测算法走通以后,还可以实现其他场景中的人、车、物、行为等的识别检测。

    24640

    手机人工智能时代,华为Mate 10这些功能一定要知道

    AI智慧物:更懂你的智慧拍照   华为Mate 10搭载了全球首款移动AI芯片麒麟970,除了常规的CPU和GPU以外,还加入了NPU(Neural Network Processing Unit神经网络处理器 智慧物识别天气和美食   AI相机功能可以实现AI物,根据不同的场景自动识别人像、夜景等13种拍照环境,在拍摄类似食物、人、狗、文字等内容时,ISP+NPU的组合可以实现本地智慧物的功能,并且自动调节拍照参数 这也是目前AI智能手机上最显性的应用场景。 智慧屏:懂你所想知你所需   曾经无所不能的指关节操作,如今变得更加丰富。 并且,有了AI人工智能的加持,可以在本地进行快速翻译,不能上网都可以准确翻译。 ?    语音助手:真正实现正常对话   EMUI8.0也引入了麒麟970的智慧引擎,在人工智能方面除了上文提到的物、屏、在线翻译 ,这次语音助手也进行了全面升级,能更懂我们说的话了。 ?

    2K90

    一张图带你读懂腾讯青少年人工智能教育解决方案

    全面的课程体系内容 紧跟国家AI人才培养标准 依托于腾讯AI Lab、腾讯优图实验室、微信智聆等腾讯内部领先的人工智能实验室资源,腾讯教育还打造了一系列面向中小学生的人工智能课程,致力于激发青少年学习编程与人工智能的兴趣 据悉,课程的开发依托于腾讯丰富的前沿AI应用案例,如拍照花、决策树等。将腾讯AI作为底层能力开放,帮助科技辅导员打造具有影响力的课程,提供了丰富的平台内容。 花君AI实验图 对应5-6年级的学生,设计了“人工智能硬件入门课程”及“生活中的AI”课程,帮助学生认知及体验AI相关技术,了解人工智能在各领域中的应用及发展,初步了解物联网在学习生活中的运用。‍ AI猜拳智能实验图 在小学阶段积累了一定基础知识后,腾讯青少年人工智能教育为初中阶段的学生,开设了一系列结合“互联网创新”“物联网探究”“人工智能应用”主题的人工智能与编程课程,帮助学生们初步了解并掌握 python代码编程、AI综合应用、AI模型及原理等内容,鼓励学生们积极运用人工智能及编程技术来创作可以解决生活实际问题的作品。

    85320

    实测华为Mate 20 Pro:配备麒麟980芯片后AI到底有多强

    以下就是我们的上手实测~ 先来跑个分 在智能手机领域,一直流传着这么一句话:不服跑个分。 测评手机的AI能力,自然需要用有AI特色跑分程序。 除了给视频、照片创造出各种戏剧化效果之外,这款手机还围绕着相机,做了很多AI实用功能。 智能物 余承东在发布会上演示的测试食物卡路里的功能,就是智能物的一部分。 ? 测卡路里,只是这个“物”功能的一方面,当你把摄像头对准其他物体的时候,就能发现它还有很多功能。 真·智能智能物这个功能,断网是用不了的。 不过,也有很厉害的时候,比如下面的绿萝和万年青就识别的很精准。 ? 从上面的几个测评结果中可以看出,识别不同种类的对象,Mate 20 Pro会使用不同的“引擎”。 AI语音助手 华为的语音助手默认唤醒词是“小艺小艺”,从原来的小E演变而来。 在国内的发布会上,余承东专门花了一段时间介绍这项服务,而且还发布了智能音箱,看来华为这次是来真的了。 ?

    29730

    科技白震东:基于图像分析技术与边缘计算,守好最佳数据入口 | 镁客·请讲

    科技SVP高级副总裁白震东说到。 发展至今,成立了11年的臻科技在核心业务智能交通方向已经取得了骄人的成果,但是说到公司的“第一桶金”,并不在智能交通赛道。 基于这一考虑,他们凭借自身算法在字符、车辆信息、结构化特征识别的优势,再结合国情、经济越来越好,停车需求激增的市场需求,最终将自己的首个核心业务定位在智能交通。 智能交通之外在,臻科技也踏足了智能制造与智能安防。 而在踏足智能制造3年之后,臻科技也“重新”进入智能安防产业。 “我们的想法是,用场景化可以普及的AI技术去赋能行业应用升级,服务于大数据的发展趋势,做好精准、智能的数据入口,让智能真正的融入生活。”

    28920

    聊聊“全双工”

    AI时代的全双工又意味着什么呢? 我们如何更好地应用AI时代的全双工呢? 本文试图解释这些问题。 ? 什么是全双工? 全双工(Full Duplex)是通信传输的一个术语。 这里要引入一个技术概念——拒。 一般地,拒智能语音识别系统对无效输入不做特殊处理的能力,进而减少无效输入对智能系统的影响。 在DuerOS中,拒能力分布在不同的子系统中,除了语音识别的之外,同样在NLP方面提供了不同策略的拒。 关于调试和测试的更多内容可以参考《调试DuerOS的智能语音技能》。 4 注意事项 鉴于全双工中的拒限制,对于在技能中完全自行使用NLU的情况,可能暂时无法使用全双工的能力。 DuerOS 提供了ai.dueros.common.unknown_intent专门作为兜底话术意图,只要在技能中引用ai.dueros.common.unknown_intent,然后在代码中对处理该意图进行回复即可

    66150

    银河水滴“机智过人”的步态识别技术会成为生物识别的新蓝海吗?

    在剧中,AI技术“天才”Harold Finch开发了一套能够预测恐怖袭击的人工智能系统,名为“TheMachine”。 ? 不论是在刑侦、公安还是在智能交通领域,你不经意的“Freestyle”(如步态动作等)都能成为AI别的重要因素。 步态识别作为非受控性的识别方式,可以大幅度的提高特定行业中的工作效率。 作为一种新兴技术,“步态人”将逐步成为继人脸、虹膜识别后又一生物识别的新里程碑。 作为中国步态识别的“国家队”,银河水滴早已将此类技术广泛运用于安防、刑侦、轨道交通及工业识别等诸多领域,“步态人”的技术红利正在逐步突显。 人脸区域达到12x12像素银河水滴即可实现精确识别 3.生物识别的“新蓝海” 在CCTV1的人工智能节目《机智过人》中,银河水滴CEO黄永祯带领其项目成功战胜《最强大脑》记忆大师,并从10个身高体型相似的人中识别出目标

    27130

    基于信息理论的机器学习-中科院自动化所胡包钢研究员教程分享04(附pdf下载)

    ▌概述 本次tutorial的目的是,1.介绍信息学习理论与模式识别的基本概念与原理;2.揭示最新的理论研究进展;3.从机器学习与人工智能的研究中启发思索。 本次tutorial的目的是,1.介绍信息学习理论与模式识别的基本概念与原理;2.揭示最新的理论研究进展;3.从机器学习与人工智能的研究中启发思索。 在此提个“学说明”的问题:当“物以稀为贵”是一种智能准则(或学习目标)时,支撑它的背后数学理论原理(或计算层面的表达)是什么呢?是贝叶斯原理么?你怎么验证? ? 该类研究是对自然,机器,或数据等开展原理、机制、解释性的探索。 它同时包含了两个层面中的问题。本课程试图给出这方面两个原理性研究样例。我们认为目前人工智能研究更多是“工具”式研究。 该主题能够促使我们尽快地切入到机器学习以及人工智能研究中的核心问题:学习过程的基础原理或定律会是什么?科学层面解释性的统一理论框架存在否,又会是什么? ?

    62970

    从学术研究到应用落地,这 6 位计算机视觉大咖在 CV 专场上都讲了什么? | CCF-GAIR 2018

    如果要去做一些交互和感知,必须先恢复三维,所以在识别的基础上,下一个层次必须走向“三维重建”。 *臻科技联合创始人兼 CEO 任鹏 臻科技 CEO 任鹏聊了如何打造一款智能相机产品。 臻科技致力于将计算进视觉技术产业化,而智能相机作为载体,已经在诸如智能交通、智慧社区、安防等各个场景中得到应用。 云天励飞是王孝宇博士职业生涯的第三站,主要聚焦 AI+ 新警务、AI+ 新社区、AI+ 新零售。 而针对计算机视觉识别的质量提升方面,还有更多的技术可能性需要去探索。

    27270

    从学术研究到应用落地,这 6 位计算机视觉大咖在 CV 专场上都讲了什么? | CCF-GAIR 2018

    如果要去做一些交互和感知,必须先恢复三维,所以在识别的基础上,下一个层次必须走向“三维重建”。 *臻科技联合创始人兼 CEO 任鹏 臻科技 CEO 任鹏聊了如何打造一款智能相机产品。 臻科技致力于将计算进视觉技术产业化,而智能相机作为载体,已经在诸如智能交通、智慧社区、安防等各个场景中得到应用。 云天励飞是王孝宇博士职业生涯的第三站,主要聚焦 AI+ 新警务、AI+ 新社区、AI+ 新零售。 而针对计算机视觉识别的质量提升方面,还有更多的技术可能性需要去探索。

    33220

    OPPO Find X,一款(可能)被全面屏“耽搁”了的AI手机

    再利用AI技术进行智能分析,比如脸部的立体轮廓、鼻型、眼睛的深浅、下巴、颧骨等,并自动给出相关美化建议,最终呈现出更加精细化的美颜效果。 ? 可以说是完成了一场“虚拟形象”的个性化整形。 △ 自拍成像样张 由于用户人脸的3D模型已被精准识别,于是在拍照或视频的时候,结构光技术可以做到毫米级别的精度分析,来分辨人物与背景,实现自然精准的虚化。 同时,智能MIC具备声纹识别功能,更具个性化和安全性。 AI系统 更富全局性的是,OPPO Find X搭载的还是高通最新的骁龙845芯片,包含了高通面向移动AI推出的AIE神经网络处理单元。 并且会学习用户使用习惯,智能预测用户接下来可能会使用的应用,方便且降低不必要的系统资源占用。 此外,ColorOS 5.1还将更多AI能力集成于一体。 比如智慧屏,需要识别屏幕中的文字信息的时候,可以通过拇指大面积按压实现智慧屏,不管是网页、图片、文本只要是在屏幕上显示的文字都可以通过智慧屏摘取出来,轻松翻译、搜索和复制。 ?

    31620

    音乐识别探索之路|音色识别亮相IJCNN,UAE惊艳ICASSP

    这种算法作为哼唱识别的主流方法被广泛使用。我们也同时在探索一些更新的基于深度学习的哼唱识别方案,期待能进一步提升用户体验。 翻唱识别:翻唱识别可以称之为下一代听歌曲技术。 经过我们调研,业界最新的歌手识别的指标大大落后于主流说话人声纹识别的表现。 下图是我们的一些歌声声纹识别的应用案例,我们将在落地场景上继续不断探索。 ? ? INTERSPEECH 2020 IJCNN:国际神经网络联合大会(International Joint Conference on Neural Networks,简称IJCNN),是由国际神经网络协会及IEEE计算智能协会联合主办的神经网络领域的国际学术会议 网络还原时代原声 | TME音乐超分辨率亮相INTERSPEECH 多媒体研发中心隶属于腾讯音乐娱乐集团(TME)的QQ音乐业务线,位于深圳总部,面向QQ音乐和全民k歌、探歌、MOO等产品的多媒体与AI

    1.8K20

    扫码关注腾讯云开发者

    领取腾讯云代金券