前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >对话短文本语义匹配-冠军代码

对话短文本语义匹配-冠军代码

作者头像
机器学习AI算法工程
发布2021-10-14 10:11:44
9800
发布2021-10-14 10:11:44
举报

小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。本赛道要求参赛队伍根据脱敏后的短文本query-pair,预测它们是否属于同一语义。

冠军方案

源代码获取方式

关注微信公众号 datayx 然后回复 语义配匹 即可获取。

AI项目体验地址 https://loveai.tech

数据

本项目没有提供数据,如果需要数据,请到天池比赛主页下载

https://tianchi.aliyun.com/competition/entrance/531851/introduction

预训练模型准备

  • 下载预训练模型
    • nezha-base: https://drive.google.com/file/d/1HmwMG2ldojJRgMVN0ZhxqOukhuOBOKUb/view?usp=sharing
    • nezha-large: https://drive.google.com/file/d/1EtahNvdjEpugm8juFuPIN_Fs2skFmeMU/view?usp=sharing
    • uer/bert-base: https://share.weiyun.com/5QOzPqq
    • uer/bert-large: https://share.weiyun.com/5G90sMJ
    • macbert, chinese-bert-wwm-ext, chinese-roberta-wwm-ext-large https://huggingface.co/models
  • 预训练模型开源仓库
    • https://github.com/dbiir/UER-py
    • https://github.com/huawei-noah/Pretrained-Language-Model
  • 下载并解压, 解压到文件夹 data, 文件夹结构如下:
  • 预训练模型md5

环境准备

  • torch==1.7.0
  • transformers=4.3.0.rc1
  • simpletransformers==0.51.15
  • TensorRT-7.2.1.6

端到端训练脚本

代码语言:javascript
复制
cd code
bash ./run.sh

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习AI算法工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据
  • 预训练模型准备
  • 环境准备
  • 端到端训练脚本
相关产品与服务
腾讯智能对话平台
腾讯智能对话平台(Tencent Bot Platform,TBP)专注于“对话即服务”的愿景,全面开放腾讯对话系统核心技术,为大型企业客户、开发者和生态合作伙伴提供开发平台和机器人中间件能力,实现便捷、低成本构建人机对话体验和高效、多样化赋能行业。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档