槽位填充可以理解为一个序列标注的问题,我们训练范例{(x((n)),y((n)) ):n=1,……,N},然后我们想要识别学到一个函数f∶x→y,这个函数能够匹配输入序列x和相应的标签序列y。在槽位填充中,输入序列和标签序列长度相同,因此排列是准确的。
序列标注在SLU语义理解具有重要地位,主要用于语义槽的提取,便于机器理解用户query的语义。常见的序列标注方式有Jordan-RNN、BiLSTM-CRF等。为提高序列标注的准确度,加入用户意图的识别任务。
机器之心专栏 作者:Ouyu Lan, Su Zhu, Kai Yu 为期 5 天 ICASSP 2018,已于当地时间 4 月 20 日在加拿大卡尔加里(Calgary)正式落下帷幕。ICASSP 全称 International Conference on Acoustics, Speech and Signal Processing(国际声学、语音与信号处理会议),是由 IEEE 主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级学术会议。今年 ICASSP 的大会主题是「Signal Pro
论文名称:Adaptive Subgradient Methods for Online Learning and Stochastic Optimization
1. 概况 1.1 任务 口语理解(Spoken Language Understanding, SLU)作为语音识别与自然语言处理之间的一个新兴领域,其目的是为了让计算机从用户的讲话中理解他们的意图
物流移动机器人调度系统通过调度集群化的机器人设备,可实现仓储制造场景下物流作业的自动化高效作业。通过对昆船、旷视、国自的具体实践探索,可以让我们更好地认识物流移动机器人调度系统的特点、技术路径、挑战及未来发展趋势。
本文转自公众号哈工大SCIR,转载请联系原公众号 论文名称:A Stack-Propagation Framework with Token-Level Intent Detection for Spoken Language Understanding 下载地址:https://arxiv.org/abs/1909.02188 论文作者:覃立波,车万翔,李扬名,文灏洋,刘挺 本文作者:覃立波 编辑:唐里
论文名称:A Stack-Propagation Framework with Token-Level Intent Detection for Spoken Language Understanding 论文作者:覃立波,车万翔,李扬名,文灏洋,刘挺 原创作者:覃立波 下载链接:https://arxiv.org/abs/1909.02188 出处:哈工大SCIR
随着服务提供商热衷于部署基于NFV的服务,他们发现管理和编排(MANO)是业务部署中的痛点。关于MANO最大的问题是如何从高级架构图转变成为实现可互操作性。我们选择采取传统的电信模式,通过标准组织工作
最近工作中使用到rasa,其nlu部分有一个rasa自己提出的DIETClassifier框架组建,可用于意图分类与实体识别。今天有空,就来研究下它~
本文的重点将介绍传统算法框架中语言理解模块的意图与槽位的联合模型。
Vue2.0 全线升级,升级后的新版本 Vue3.0 凭借新特性,新工具,一经问世便在 IT 圈中引起广泛的讨论:
本文提出的方法称为language-model-based data augmentation(LAMBADA)。
1 什么是任务型机器人 任务型机器人指特定条件下提供信息或服务的机器人。通常情况下是为了满足带有明确目的的用户,例如查流量,查话费,订餐,订票,咨询等任务型场景。由于用户的需求较为复杂,通常情况下需分多轮互动,用户也可能在对话过程中不断修改与完善自己的需求,任务型机器人需要通过询问、澄清和确认来帮助用户明确目的。 2 任务型机器人的组成 任务型机器人核心模块主要包括三部分: 1. 自然语言理解模块—— Language Understanding 2. 对话管理模块——
最近,有一篇论文提出了一种基于语法的结构化CNN代码生成器,用《炉石传说》(HearthStone)基准数据集进行实验的结果表明:
本系列推文重在从算法基本原理、复杂度分析、优缺点、代码实现、算法扩展等方面科普Label Correcting Algorithm(最短路算法重要分支),同时给出了下一步学习内容建议。
对于初学NLP的人,了解NLP的各项技术非常重要;对于想进阶的人,了解各项技术的评测指标、数据集很重要;对于想做学术和研究的人,了解各项技术在对应的评测数据集上达到SOTA效果的Paper非常重要,因为了解评测数据集、评测指标和目前最好的结果是NLP研究工作的基础。因此,本文整理了常见的32项NLP任务以及对应的评测数据、评测指标、目前的SOTA结果以及对应的Paper。
大数据文摘转载自AI科技评论 作者:Keith Kirkpatrick 编译:OGAI 编辑:陈彩娴 我们正处在 5G 技术方兴未艾的时代。然而,从无线运营商、芯片制造商到元技术供应商的顶级技术公司都在朝着无线通信的下一个里程碑——6G 进军。 人们希望网络支持更复杂的、数据密集型的应用程序,连接更多的设备和数据源,并享受持久的、无延迟的数据连接,这推动了对更快、容量更大的网络的需求。 在 6G 技术被完全开发后,可以支持每秒 1 TB 的数据传输速率(理论上比 5G 提供的每秒 10GB 的最高速度快 1
提出一些类MTL框架,包含并行网络结构、串行网络结构,在 ATIS, Snips和一个自有大数据集上表现良好。
在 AI、区块链、IoT、AR 等高新技术飞速发展的当下,数据库这一宝库似乎被大家遗忘在了角落。数据库存储了大量的个人或者企业的生产运营数据,我们每天都会和数据库产生或多或少的交互。通常,查询数据库中的数据需要通过像 SQL 这样的程序式查询语言来进行交互,这就需要懂 SQL 语言的专业技术人员来执行这一操作。为了让非专业用户也可以按需查询数据库,当前流行的技术方案设计了基于条件筛选的专门界面,用户可以通过点选不同的条件来查询数据库,比如下面这个筛选汽车的界面。
站在 5G 时代,展望 6G 的曙光。 作者丨Keith Kirkpatrick 编译丨OGAI 编辑丨陈彩娴 我们正处在 5G 技术方兴未艾的时代。然而,从无线运营商、芯片制造商到元技术供应商的顶级技术公司都在朝着无线通信的下一个里程碑——6G 进军。 人们希望网络支持更复杂的、数据密集型的应用程序,连接更多的设备和数据源,并享受持久的、无延迟的数据连接,这推动了对更快、容量更大的网络的需求。 在 6G 技术被完全开发后,可以支持每秒 1 TB 的数据传输速率(理论上比 5G 提供的每秒 10GB 的最高
选自cacm.acm.org 作者:Keith Kirkpatrick 机器之心编译 编辑:赵阳 6G 时代还没来,场子先热起来了。 尽管 5G 技术仍处于相对初级的阶段,但从无线运营商到芯片组制造商再到元技术供应商等顶级技术公司都在积极致力于开发无线通信的下一个里程碑,即第六代(6G)。 众多研究者希望使用支持更复杂、数据更加密集的应用程序,这样一来就能连接更多的设备和数据源,并享受持久、无延迟的数据连接。这些愿望进一步推动了对速度更快、容量更大的网络的需求。 有朝一日当 6G 技术全面开发完成时,其可能
人机对话(Human-Machine Conversation)是指让机器理解和运用自然语言实现人机通信的技术,如图1所示。通过人机对话交互,用户可以查询信息,如示例中的第一轮对话,用户查询天气信息;用户也可以和机器进行聊天,如示例中的第二轮对话;用户还可以获取特定服务,如示例中的最后两轮对话,用户获取电影票预定服务。
下面的例子示明了使用H.262编解码器时,广播电视提供可接受性能时的传输层最低性能预期要求: 表 IV.1的假设:
“市场上提供云服务的企业那么多,但却没有具体的参考标准”是部分企业,特别是政府组织采购云服务的阻碍。 无论是出于对云计算服务提供商服务产品与服务质量的规范,还是助力云计算产业的大规模发展,业界普遍期待尽快制定并完善云计算服务的标准。 国际:全面标准化进展缓慢 事实上,国际以及国内致力于推动云计算标准化的组织并不在少数。 DMTF、SNIA、CSA、OASIS、IETF、IEEE、OGF、TMF、ISO/IEC、NIST、ODCA、ITU-T、ATIS、OCC等十多个主要国际云计算标准小组/组织,从云计算概貌
论文名称:Semantic Parsing for Task Oriented Dialog using Hierarchical Representations
AI 科技评论按:ACL、EMNLP、NAACL - HLT、COLING 是 NLP 领域的四大顶会。前三者都由 ACL(Association of Computational Linguistics)举办, 其中 NAACL - HLT(Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies,一般简称为 NAACL)虽然名义上只是 ACL 北美分会,但在 NLP 圈里也是无可争议的顶级会议,名称中的 HLT 也直接宣告了对于人类语言处理技术的关注。
【导读】专知内容组整理了最近五篇聊天机器人(Chatbot)相关文章,为大家进行介绍,欢迎查看! 1. A Deep Reinforcement Learning Chatbot (Short Version)(一种深度强化学习的聊天机器人) ---- ---- 作者:Iulian V. Serban,Chinnadhurai Sankar,Mathieu Germain,Saizheng Zhang,Zhouhan Lin,Sandeep Subramanian,Taesup Kim,Michael Pi
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2205.03521.pdf 代码地址: https://github.com/zjunlp/HVPNeT 计算机视觉研究院专栏 作者:Edison_G 多模态命名实体识别和关系提取(MNER 和 MRE)是信息提取中的一个基础和关键分支。 1 概括 多模态命名实体识别和关系提取(MNER和MRE)是信息提取中的一个基础和
无论是做研究还是解决业务问题,做数据集都是绕不开的问题。很多刚入行的同学觉得发布一个数据集是最容易灌水的了,燃鹅如果你真的做过就会发现,随意产生一个数据集很容易,但是若以解决实际问题或让大家能在上面磕盐玩耍为目的,来产生一个能用的、质量高的、难度适中的数据集一点都不容易,超级费时费脑子甚至费钱好不好(╯°□°)╯︵┻━┻
KDD,国际数据挖掘与知识发现大会,全称:ACM SIGKDD Conference on Knowledge Discovery and DataMining,是数据挖掘领域国际最高级别会议。
【导语】10月12日,追一科技主办的首届中文NL2SQL挑战赛在激烈的决赛中落下帷幕,冠军由国防科技大学学生组成的「不上90不改名字」队伍获得。此次比赛是中文NLP领域首次举办NL2SQL主题比赛,成为国内NLP技术比赛领域参赛规模最大的赛道之一。
本文提出了一种新的对话状态跟踪方法,称为 Seq2SeqDU,它将 DST 形式化为一个序列到序列问题。Seq2Seq-DU 的 独特之处 是它使用两个基于 BERT 的编码器分别对对话中的话语和模式描述进行编码,一个注意者计算话语嵌入和模式嵌入之间的注意,以及一个解码器生成表示对话当前状态的指针。
行业协会并不是公益组织,它存在的意义,就是为了协调成员之间的矛盾,制定规则和契约。
选自arXiv 机器之心编译 机器之心编辑部 近日,微软全球执行副总裁沈向洋、微软研究院首席研究员何晓东、微软(亚洲)互联网工程院副院长李迪(小冰项目负责人)共同提交了一篇论文《From Eliza
5G MEC这个表述并不精确,两者相互成就,而非相互从属。说5G MEC,是因为随着5G的演进,MEC也在焕发新生。
大数据文摘出品 3月23日的新闻发布会上,中国民航局航空安全办公室主任朱涛通报,当天16时30分左右,在事故现场主要撞击点东南方向约20米处的表层泥土中发现了两部飞行记录器(黑匣子)中的一部。 现场调查人员对记录器进行了初步检查,记录器外观破损严重,存储单元也存在一定程度的损坏,但相对比较完整。初步判定为驾驶舱话音记录器(CVR)。 朱涛通报,该黑匣子已被连夜送往北京的民航专业机构进行译码。完成译泽码后,将为分析判断事故原因提供重要证据。 东航MU5735“黑匣子”——FDR和CVR 东航MU5735航班型
本文是一篇LoRaWAN的科普介绍,你已经在朋友圈看过无数蜻蜓点水的LoRaWAN文章,是时候来一篇真正的技术干货了。本文先从横向介绍下LoRaWAN的背后势力和网络部署情况,然后纵向讲解了网络架构和具体的协议内容,帮助LoRa从业者系统地了解LoRaWAN协议。
去年来自谷歌大脑的研究团队在网络架构设计方面挖出新坑,提出 MLP-Mixer ,这是一个纯 MLP 构建的视觉架构。该架构无需卷积、注意力机制,仅需 MLP,在 ImageNet 数据集上就实现了媲美 CNN 和 ViT 的性能表现。
ACL是计算语言学和自然语言处理领域最重要的顶级国际会议,该会议由国际计算语言学协会组织,每年举办一次。据谷歌学术计算语言学刊物指标显示,ACL影响力位列第一,是CCF-A类推荐会议。美团技术团队共有7篇论文(其中6篇长文,1篇短文)被ACL 2021接收,这些论文是美团技术团队在事件抽取、实体识别、意图识别、新槽位发现、无监督句子表示、语义解析、文档检索等自然语言处理任务上的一些前沿探索及应用。
非对称加密算法与对称加密算法的主要差别在于非对称加密算法用于加密和解密的密钥不相同,非对称加密算法密钥分为公钥和私钥,公钥加密只能用私钥解密,反之私钥加密只能用公钥解密。相比对称加密算法,非对称加密算法加/解密效率低,但安全性高,这两种算法一般结合使用。常见非对称加密算法有RSA、ECC、Elgamal等。
选自EarningMyTurns 机器之心编译 参与:机器之心编辑部 近日,著名学者 Yoav Goldberg 发布的一篇批评蒙特利尔大学新论文《Adversarial Generation of Natural Language》乃至整个 arXiv 社区的不良风气的文章引起了人工智能界的轩然大波,许多研究者和从业者也纷纷长文短文地发表了自己的看法,参阅机器之心的相关报道《从 Yoav Goldberg 与 Yann LeCun 争论,看当今的深度学习、NLP 与 arXiv 风气》和《观点 | Yoa
这是一个很有意思的组织,我们通信行业内部对它几乎无人不知无人不晓,而对于行业外部的普通百姓来说,却极少有人知道它。
导语 | 2019年9月7日,腾讯技术开放日·5G多媒体专场在腾讯滨海大厦完美落幕。来自腾讯多媒体实验室的专家们给大家带来了关于5G技术和标准的精彩分享,揭开了许多关于5G的谜团。本文由腾讯多媒体标准组总监&5G专家Stephan Wenger为大家重点解释了关于5G的应用层技术特点,并深入讨论5G所带来的新兴技术领域,以及5G国际标准的生态系统和各种相关标准制定组织与专有技术之间的界限。
国际电信联盟 (ITU) 是联合国在信息和通信技术(ICT)领域的专门机构,电信标准化部门(ITU-T)则是ITU 的常设机关。ITU-T负责研究技术、操作和资费问题,同时就这些问题发行可在全球范围内实现的电信标准化建议书。 每四年一届的世界电信标准化全会(WTSA)确定 ITU-T 各研究组的研究课题,再由各研究组制定有 关这些课题的建议书。 WTSA 第 1 号决议规定了批准建议书须遵循的程序。 属 ITU-T 研究范围的某些信息技术领域的必要标准,是由国际标准化组织(ISO)和国际电工技术委员会(IEC)合作制定的。
文章系统性地回顾了自然语言处理领域中的文本增强技术在近几年的发展情况,重点列举和讨论了 18 年、19 年中人们常用的五类文本增强技术路径以及对应的代表性技术。接下来,文章以金融领域的自然语言处理任务入手,多维度地分析几类通用文本数据增强技术在实际业务问题上的重要价值。文章的结论是,文本增强技术是一类低成本的数据杠杆,可以在不引入新数据下,有效撬动模型性能。
AI 科技评论按:为期 5 天的 ICASSP 2018,已于当地时间 4 月 20 日在加拿大卡尔加里(Calgary)正式落下帷幕。ICASSP 全称 International Conference on Acoustics, Speech and Signal Processing(国际声学、语音与信号处理会议),是由 IEEE 主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级学术会议。今年 ICASSP 的大会主题是「Signal Processing and Artificial Intelligence: Challenges and Opportunities」,共收到论文投稿 2830 篇,最终接受论文 1406 篇。其中,思必驰-上海交大智能人机交互联合实验室最终发表论文 14 篇,创国内之最。
UA-DETRAC是一个具有挑战性的现实世界多目标检测和多目标跟踪基准。数据集由 Cannon EOS 550D摄像头在中国北京和天津24个不同地点拍摄的10个小时的视频组成。视频以每秒25帧的速度录制,分辨率为960540像素。在UA-DETRAC数据集中,有超过14万帧和8250辆车被人工标注,总共标记了121万物体的边界盒。我们还对目标检测和多目标跟踪方面的最新方法进行基准测试,以及本网站中详细介绍的评估指标。
Text-to-SQL(或者Text2SQL),顾名思义就是把文本转化为SQL语言,更学术一点的定义是:把数据库领域下的自然语言(Natural Language,NL)问题,转化为在关系型数据库中可以执行的结构化询语言(Structured Query Language,SQL),因此Text-to-SQL也可以被简写为NL2SQL。
领取专属 10元无门槛券
手把手带您无忧上云