本篇基于 2017 年的推荐清单做了一些改进——去除了一些不再进行维护的 API,并且更新了一些新的 API。主要覆盖如下方向:
人工智能正在成为新一代技术变革的基础技术,但从头开始为自己的应用和业务开发人工智能程序既成本高昂,且往往很难达到自己想要的性能表现,但好在我们有大量现成可用的 API 可以使用。开发者可以通过这些 API 将其它公司提供的智能识别、媒体监测和定向广告等人工智能服务集成到自己的产品中。机器之心在 2015 年底就曾经编译过一篇介绍当前优质人工智能和机器学习 API 的文章《技术 | 50 个常用的人工智能和机器学习 API》,列举了 50 个较为常用的涉及到机器学习、推理预测、文本分析及归类、人脸识别、语言翻译等多个方面的 API。一年多过去了,好用的 API 也出现了一些新旧更迭,现在是时候对这篇文章进行更新了。
API是一套用于构建应用软件程序的规范,协议和工具。在本文中,我们从2017年的清单中删除了停用的API,并利用新元素对其进行了更新。并且,所有的API被归类到以下几个领域:
该清单按照字母排序,对 API 的概述是基于对应官网所提供的信息整合而成。要是大家发现该清单中错过了某些当前流行的 API,可以在评论中告知。
大数据文摘作品 编译:大茜、Shan LIU、云舟 还在为找不到机器学习的API而烦恼吗?本篇文章将介绍一个包含50+关于人脸和图像识别,文本分析,NLP,情感分析,语言翻译,机器学习和预测的API列表,快快收藏吧~ API是一套用于构建应用软件程序的规范,协议和工具。在本文中,我们从2017年的清单中删除了停用的API,并利用新元素对其进行了更新。并且,所有的API被归类到以下几个领域: 人脸和图像识别 文本分析,NLP,情感分析 语言翻译 机器学习和预测 在每组应用中,列表中的元素按字母顺序排列。相
翻译 | Drei 编辑 | Just 出品 | 人工智能头条(公众号ID:AI_Thinker) API 是一套用于构建软件程序的协议和工具。对于应用开发者而言,有了开放的 API,就可以直接调用其他公司做好的功能为我所用,这在很大程度上提升了工作效率。 本文整理了以下四大类共 50 种 API,为你节省了寻找资源的时间。总之,你所需要的可能基本都在下面了: 人脸和图像识别(Face Image Recognition) 文本分析,自然语言处理,情感分析(Text Analysis, NLP, Senti
API 是一套用于构建软件程序的协议和工具。对于应用开发者而言,有了开放的 API,就可以直接调用其他公司做好的功能为我所用,这在很大程度上提升了工作效率。本文整理了以下四大类共 50 种 API,为你节省了寻找资源的时间。
API 是一套用于构建软件程序的协议和工具。对于应用开发者而言,有了开放的 API,就可以直接调用其他公司做好的功能为我所用,这在很大程度上提升了工作效率。
对于做工程项目和搞科研的人来说,有现成的模块或工具使用是一件多么美妙的事情啊,无需访问源码或理解内部工作机制的细节即可完成相应的任务。常用的方法是调用一些API,即一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力。本文总结对于机器学习行业者有用的50多个API,主要涉及的领域如下:
随着基于人工智能与机器学习的应用如雨后春笋般不断涌现,我们也看到有很多提供类似功能的 API 悄悄登上了舞台。 API 是用于构建软件应用的程序、协议以及工具的组合;本文是对2015 中这个列表的修正与完善,移除了部分被废弃的 API ;我们也添加了最近由 IBM、Google、Microsoft 这些大厂发布的 API 。所有的 API 可以根据应用场景进行分组: 人脸与图片识别。 文本分析,自然语言处理以及情感分析。 语言翻译。 预测以及其他的机器学习算法。 在具体的每个分组内,我们根据首字母顺序排序;
【1】 Keep it green, simple and socially fair: a choice experiment on prosumers' preferences for peer to peer electricity trading in the Netherlands 标题:保持绿色、简单和社会公平:荷兰消费者对点对点电力交易偏好的选择实验 链接:https://arxiv.org/abs/2109.02452
今天刷到了微软在 2021 年 5 月发布的文本转语音服务(TTS),试了下,真的听不出这是机器在读,而且,可以分辨出中文的多音字,如士大夫和大(dai)夫,儿化音也可以连起来,可以自动推断出语气和情感,非常智能。感觉以后的播音员要失业了。
最近在研究语音识别方向,看了很多的语音识别的资料和文章,了解了一下语音识别的前世今生,其中包含了很多算法的演变,目前来说最流行的语音识别算法主要是依赖于深度学习的神经网络算法,其中RNN扮演了非常重要的作用,深度学习的应用真正让语音识别达到了商用级别。然后我想动手自己做一个语音识别系统,从GitHub上下载了两个流行的开源项目MASR和ASRT来进行复现,发现语音识别的效果没有写的那么好,其中如果要从零来训练自己的语言模型势必会非常耗时。
【1】 Multivariate Realized Volatility Forecasting with Graph Neural Network 标题:基于图神经网络的多变量已实现波动率预测 链接:https://arxiv.org/abs/2112.09015
【1】 Correlation scenarios and correlation stress testing 标题:关联场景和关联压力测试
官网链接:Speech Studio - Microsoft Azure (https://speech.azure.cn/audiocontentcreation)
【1】 Robust Decisions for Heterogeneous Agents via Certainty Equivalents 标题:基于确定性等价的异构Agent鲁棒决策
AI 科技评论消息,第十届国际图象图形学学术会议(ICIG 2019)将于 2019 年 8 月 23-25 日在北京友谊宾馆召开,主题为「人工智能时代的图像图形前沿研究」。国际图象图形学学术会议(ICIG)是中国图象图形学学会主办的最高级别的系列国际会议,创建于 2000 年,每两年举办一届,迄今已经成功举办九届。
对于这个需求,大家的第一反应可能是 PS,但 PS 用来干这件事情我觉得太“重”了,有没有更轻便的办法来实现呢?
云音箱机身上帖有云音箱的 ID 码,每台云音箱拥有唯一永久 ID,SPEAKERID由字母、数字组成, 在生产过程中写入云音箱,云音箱出厂后不会再改变。
【1】 Temporal Analysis of Worldwide War 标题:世界大战的时序分析
【1】 Characterization of flexible electricity in power and energy markets 标题:电力和能源市场中灵活电力的特性 链接:https://arxiv.org/abs/2109.03000
【1】 Pseudo-Model-Free Hedging for Variable Annuities via Deep Reinforcement Learning 标题:基于深度强化学习的可变年金伪无模型套期保值
本文介绍一些 Python 中常用的语音能力的包,以及如何通过调用云服务商的 API 进行语音识别
INTERSPEECH 是语音科学和技术领域最大、最全面的国际学术会议。INTERSPEECH 2019 将在奥地利第二大城市格拉茨(Graz)举办。在 INTERSPEECH 会议期间,来自全球学术界和产业界的研究人员齐聚一堂,讨论语音领域的新技术,包括语音合成、语音识别、语音增强这些细分领域。在会议上展示的研究成果代表着语音相关领域的最新研究水平和未来的发展趋势。恰逢 INTERSPEECH 20 周年,主办方透露在会议日程上将会出现一些别出心裁的设计,即将参会的同行们可以期待一下。
本项目是基于VGG-Speaker-Recognition开发的,本项目主要是用于声纹识别,也有人称为说话人识别。本项目包括了自定义数据集的训练,声纹对比,和声纹识别。
自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。本文作者为NLP初学者整理了一份庞大的自然语言处理领域的概览。选取的参考文献与资料都侧重于最新的深度学习研究成果。这些资源能为想要深入钻研一个NLP任务的人们提供一个良好的开端。 指代消解 https://github.com/Kyubyong/nlp_tasks#coreference-resolution 论文自动评分 论文:Automatic Text Scoring Using Neural Net
【1】 Efficient Black-Box Importance Sampling for VaR and CVaR Estimation 标题:VaR和CVaR估计的有效黑箱重要抽样
AI 科技评论按:语音到文字的转换是语音研究领域的重要课题。自引入神经网络的方法以来,语音识别正确率有了长足的进展,也为苹果 Siri、亚马逊 Echo、科大讯飞语音输入法等等实际产品提供了生长的土壤。面对算法识别总还是比人类要差一些的现状,微软刚刚发布一篇博文公布了自己的最新成果,达到人类水平已经不是梦想。AI 科技评论编译如下。 2016年,微软语音和对话研究团队对外公布了一则里程碑性的消息,他们在 Switchboard 数据库的对话语音识别任务中达到了人类的一致性水平,这意味着他们的系统识别对话中文
本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,不排除以后会支持更多模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,使用了ArcFace Loss,ArcFace loss:Additive Angular Margin Loss(加性角度间隔损失函数),对应项目中的AAMLoss,对特征向量和权重归一化,对θ加上角度间隔m,角度间隔比余弦间隔在对角度的影响更加直接,除此之外,还支持AMLoss、ARMLoss、CELoss等多种损失函数。
来源:机器之心 作者:Kyubyong Park 本文长度为3071字,建议阅读6分钟 本文为你整理自然语言处理最新深度研究成果。 自然语言处理(NLP)是人工智能研究中极具挑战的一个分支。随着深度学习等技术的引入,NLP 领域正在以前所未有的速度向前发展。但对于初学者来说,这一领域目前有哪些研究和资源是必读的?最近我们整理了一份完整列表。 GitHub 项目链接: https://github.com/Kyubyong/nlp_tasks 本人从事自然语言处理任务(NLP)的研究已经有很长时间了,有一
选自GitHub 作者:Kyubyong Park 机器之心编译 参与:刘晓坤、李泽南 自然语言处理(NLP)是人工智能研究中极具挑战的一个分支。随着深度学习等技术的引入,NLP 领域正在以前所未有的速度向前发展。但对于初学者来说,这一领域目前有哪些研究和资源是必读的?最近,Kyubyong Park 为我们整理了一份完整列表。 GitHub 项目链接:https://github.com/Kyubyong/nlp_tasks 本人从事自然语言处理任务(NLP)的研究已经有很长时间了,有一天我想到,我需要为
选自Baidu.Research 作者:Chao Li、Ajay Kannan 和 Zhenyao Zhu 机器之心编译 参与:吴攀 对话常常涉及到多个说话人,在这样的场景中,机器需要具备识别不同说话人的能力才能发挥更大的价值。近日,百度的一篇论文提出一种新的端到端的基于神经网络的说话人识别系统 Deep Speaker,实验表明该系统显著优于之前的基于 DNN 的 i-vector 方法。今天早些时候,百度发布了一篇技术博客对这项研究进行了解读,机器之心对本文进行了编译介绍,论文原文请访问:https:/
【1】 Path Integral Method for Step Option Pricing 标题:阶梯期权定价的路径积分法 链接:https://arxiv.org/abs/2112.09534
译者 | Serene 编辑 | 明明 【AI 科技大本营导读】在本文中,作者将利用微软的 Bing Image Search API 来建立深度学习图像数据集。Bing Image Search API 是微软 Cognitive Services 的一个组成部分,主要是帮助用户在视觉、语言、文本等手机应用和软件中应用AI。相比较,利用 Google Images 来构建自己的数据集是一个乏味且需要手动的过程,主要原因是因为多年前,谷歌关停了自己的图像搜索 API ,然而,我们需要的是一个通过查询能够
【1】 La mujer a través de los personajes femeninos en el cine de temática financiera -- Women through female characters in financial topics films 标题:La Mujer a Través de Los Persajes Femeninos en el Motion de temática Financiera--从金融题材电影中的女性角色看女性 链接:https://arxiv.org/abs/2112.04366
【1】 Optimal transport for model calibration 标题:用于模型校准的最优运输
【1】 Continual self-training with bootstrapped remixing for speech enhancement 标题:用于语音增强的自举混音连续自我训练 链接:https://arxiv.org/abs/2110.10103
【1】 Pricing cryptocurrencies : Modelling the ETHBTC spot-quotient variation as a diffusion process 标题:加密货币定价:将ETHBTC现货商数变化建模为扩散过程 链接:https://arxiv.org/abs/2111.11609
他们不想被传统做法困住,开发了新方法:利用语音识别,把语言学线索和声学线索搭配食用,帮助区分。
在本文中,我们研究深度神经网络(DNNs)在小型文本相关的说话者验证任务的应用。在开发阶段,DNN经过训练,可以在帧级别对说话人进行分类。在说话人录入阶段,使用训练好的的DNN用于提取来自最后隐藏层的语音特征。这些说话人特征或平均值,d-vector,用作说话人特征模型。在评估阶段,为每个话语提取d-vector与录入的说话人模型相比较,进行验证。实验结果表明基于DNN的说话人验证与常用的i-vector相比,系统在一个小的声音文本相关的说话人验证任务实现了良好的性能表现。此外,基于DNN的系统对添加的噪声更加稳健,并且在低错误拒绝操作点上优于i-vector系统。最后,组合系统在进行安静和嘈杂的条件分别优于i-vector系统以14%和25%的相对错误率(EER)。
【1】 Intra-Household Management of Joint Resources: Evidence from Malawi 标题:联合资源的家庭内部管理:来自马拉维的证据 链接:https://arxiv.org/abs/2112.12766
整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到:
【导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到:
译者 | 廉洁 编辑 | 明明 出品 | AI科技大本营(公众号ID:rgznai100) 【AI科技大本营导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。通过本指南,你将学到: 语音识别的工作原理; PyPI 支持哪些软件包; 如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于
译者 | 廉洁 编辑 | 明明 【AI科技大本营导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到: •语音识别的工作原理; •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。
--AI科技大本营-- 整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到: •语音识别的工作原理; •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。 ▌语言识别工作原理概述 语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单
1 背景概要 随着企业实施其数字化转型愿景,由于数据消费增加而导致的技术复杂性仍然是需要解决的最大挑战之一,目前我们已经知道如何管理大量的数据,而现在的目标是管理其复杂性。如果将人工智能和机器人过程自动化(RPA)结合起来,将会推动客户参与的创新方法,扩大员工能力和探索新的商业模式方面发挥至关重要的作用。 2 理解RPA与认知技术的融合 软件机器人在具有明确规则和重复度高的流程方面做得非常出色,如果在提高准确性的同时,模拟人类行为,那么RPA将会变得更加智能,以后也可以完成认知智能和预测能力
【导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到: •语音识别的工作原理; •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。 ▌语言识别工作原理概述 语音识别源于 20 世纪
【1】 Causal Impact Of European Union Emission Trading Scheme On Firm Behaviour And Economic Performance: A Study Of German Manufacturing Firms 标题:欧盟排污权交易计划对企业行为和经济绩效的因果影响:一项对德国制造企业的研究 链接:https://arxiv.org/abs/2108.07163
领取专属 10元无门槛券
手把手带您无忧上云