前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >比起WE大会“救命的AI”,这个AI已经悄悄进入人们的学习中

比起WE大会“救命的AI”,这个AI已经悄悄进入人们的学习中

作者头像
腾讯智慧教育
修改2018-12-27 11:00:03
5.6K0
修改2018-12-27 11:00:03
举报
文章被收录于专栏:智慧教育智慧教育

上周末的腾讯WE大会上,

中国脑计划领军人物、中科院神经科学研究所所长蒲慕明说到,

“未来人工智能要进一步发展的话,就需从脑科学得到启发,包括机器学习过程,怎么从脑启发的这个概念来设计新的计算模式,新的类似人脑的神经元结构的器件、芯片,甚至是机器人”。

腾讯在“人工智能”+“医疗”领域,

打造“救命的AI”。而这个“救命的AI”,

已经开始早期筛选食管癌、糖尿病、视网膜病变、乳腺癌等病症,

对700多种疾病风险进行预测诊断。

辅助医生阅读医学影像超1亿张。

服务超百万患者。

提示高风险病变15万例。

AI能救人,亦能育人。

比起“救命的AI”,本文谈谈绝大多数人,都可能接触,甚至能够自己动手开发的AI教育应用

第一次开发英语学习的AI应用,比如口语评测

需要踩哪些坑?

1

打分的标准是什么?

查阅API接口文档,看见以下参数

参数名称

必选

类型

描述

ScoreCoeff

Float

评价苛刻指数,取值为[1.0 - 4.0]范围内的浮点数,用于平滑不同年龄段的分数,1.0为小年龄段,4.0为最高年龄段

@热心网友提问:

ScoreCoeff评价苛刻指数,年龄段划分范围是什么?

@技术支持回复@热心网友:1.0到4.0为婴幼儿到成年人的平滑划分,可以认为4.0就是一个完全具备标准发音的成年人说话的标准,1.0是可能刚刚掌握的婴幼儿水平。能够完整,标准的说清普通话则调用成人的。根据使用者的发音标准调用对应的接口,接口不会区分使用者的岁数,只会根据发音标准拍判断。

我传了个语音文件,里面有我刚刚网上搜的句子

The price of the shirt is 9 pounds and 15 pence, so you should choose B.

(衬衫的价格是9磅15便士,所以你应该选B)

程序返回了一条error

WordLengthTooLong-文本单词超过限制

评估语音对应的文本过长

2

被评估语音对应的文本过长。

 @热心网友提问:

检测文本能长一些吗?否则里面一个小段落,都要拆的支离破碎。而且因为音频大小已经有限制了,为什么检测文本还要做限制呢?

@技术支持回复@热心网友:

客户您好,您这个是段落评测,目前段落我们还没有上线,目前当前支持的是单词和句子。后面会针对段落进行优化,感谢您的反馈。

@热心网友回复@技术支持:

如果不能变长的话,如果一段语音很长(我们没办法按断句把语音再切分划片,但没有超出),我们应该怎样处理呢?

@技术支持回复@热心网友:

我们的口语评测已经更新,句子的最长长度是支持20s以上。

可能是我尾音太重,念太长?

不,这锅我不背!

还是等平台出“段落评测”功能再来耍耍

我提了提语速,在20s内念完了那句9磅15便士。

发音数据传输中……

在这个环节,

我遇到不一样的报错,

得到一样的答复,

特此祭出这3个基本都会踩到的坑

3

发音评估初始化报错

 @热心网友提问:

我是在一个接口按顺序调用[发音评估初始化]和[发音数据传输接口], 然后报错, 错误码:InternalError.CannotFindSession-评估之前没有初始化或已过期。

@技术支持回复@热心网友:

session是不是过期了?

4

调试口语评测时,数据传输接口频繁出bug

 @热心网友提问:

智聆口语评测API功能接口发音数据传输接口

InitOralProcess可以正常返回,

TransmitOralProcess这个接口总是报错,请问这个接口是可以工作的吗?我们改如何解决呢?

[TencentCloudSDKException]message:InternalError-内部错误requestId:3bc0fc4e-e09c-4ec2-bbe5-9f283ea3b35e

atcom.tencentcloudapi.common.AbstractClient.internalRequest(AbstractClient.java:172)

@技术支持回复@热心网友:

session是不是过期了?

5

调用transmitOralProcess接口报错

 @热心网友提问:

requestId:d2c718b8-9705-4719-ba56-87d71b820a9d

麻烦帮忙看下智聆口语评测接口调用的问题,报错信息如下:

com.tencentcloudapi.common.exception.TencentCloudSDKException: InternalError.InitialParameterError-初始化参数错误  

at com.tencentcloudapi.common.AbstractClient.internalRequest(AbstractClient.java:172) ~[tencentcloud-sdk-java-3.0.20.jar:na]

atcom.te ncentcloudapi.soe.v20180724.SoeClient.TransmitOralProcess(SoeClient.java:80)~[tencentcloud-sdk-java-3.0.20.jar:na]

这是调用transmitOralProcess接口报的错

@技术支持回复@热心网友:

session是不是过期了?

终于,消灭完所有bug,

我用代码完成了1次AI实践

以下是发音评估初始化的代码示例

代码语言:javascript
复制
https://soe.tencentcloudapi.com/?Action=InitOralProcess
&SessionId=stress_test_956938
&WorkMode=0
&RefText=again
&EvalMode=0
&ScoreCoeff=3.5
&<公共请求参数>

输入示例

代码语言:javascript
复制
{
  "Response": {
    "RequestId": "xxxxxx"
  }
}

输出示例

传输语音进行发音评估

代码语言:javascript
复制
https://soe.tencentcloudapi.com/?Action=TransmitOralProcess
&SessionId=stress_test_956938
&VoiceFileType=1
&SeqId=0
&VoiceEncodeType=1
&IsEnd=0
&UserVoiceData=VWtsR1JxeUpBd0JYUVZaRlptMTBJQkFBQUFBQkFBRUFnRDRBQUFCOUFBQUNBQkFBVEVsVFZCb0FBQUJKVGtaUFNWTkdWQTRBQUFCTVlYWm1OVFl1TVRrdU1UQXdBR1JoZEdGbWlRTUF5
&<公共请求参数>

输入示例

代码语言:javascript
复制
{
  "Response": {
    "PronAccuracy": 0.99,
    "PronCompletion": 0.99,
    "PronFluency": 0.99,
    "RequestId": "xxxxxxx",
    "Words": [
      {
        "MatchTag": 1,
        "MemBeginTime": 1,
        "MemEndTime": 2,
        "PhoneInfos": [
          {
            "DetectedStress": false,
            "MemBeginTime": 1,
            "MemEndTime": 2,
            "Phone": "b",
            "PronAccuracy": 52,
            "Stress": true
          }
        ],
        "PronAccuracy": 65,
        "PronFluency": 0.3,
        "Word": "xxx"
      }
    ]
  }
}

输出示例

口语评测只是AI之于教育应用的冰山一角

如果您对腾讯智慧教育感兴趣,请扫码关注公众号“腾讯智慧教育”,聊天窗口发送关键词0,我们会尽快与您联系!

腾讯智慧教育
腾讯智慧教育
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯教育云 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
智聆口语评测
智聆口语评测(Smart Oral Evaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,支持单词、句子、段落、自由说等多种模式,支持发音准确度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中文及英语口语类教学中。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档