算法研究员

我还不懂对话

代码在线跑，知识轻松学

Python精品学习库

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

博客搬家 | 分享价值百万资源包

往期视频·干货材料·成员作品 最新动态

技术创作特训营·精选知识专栏

新邀入驻腾讯云开发者社区，福利多多！

💡 社交互动怎样突破实时音视频卡顿与高流量消耗瓶颈？

🚀 短剧制作效率低下，AI如何辅助实现智能提效？

Uplift模型有很多介绍的文章，也有一些评估方式，例如AUUC、 十分位柱状图、累计增益曲线Qini Curve等，但是如果模型结果好或者不好，我们需要怎么进一步分析，却少有文章介绍，本问以Interpretable multiple treatment revenue uplift modeling这篇论文的方法介绍模型分析以及可解释性的方法。

【多干预多响应】Uplift模型如何做因果推断结果分析？

即在询问模型答案之前，让模型认真思考等prompt，输出结果真的就要好。 这里有一个问题点：不同的模型神奇咒语是不一样的，怎么针对一个新的模型搜索出神奇咒语呢，如果有少量样本，怎么在few-shot上效果更好呢？见还在手写Prompt，自动Prompt搜索超越人类水平

「LLM天花板」如何利用神奇咒语让语言模型超越人类

研究任务型对话系统，首先得从数据集采集说起，关于数据之前文章介绍过了，这里就不详细介绍了，参考：

【多轮对话】多轮对话状态追踪综述

当前开放域的评论生成常常产生重复且无趣的回复。作者认为原因是直接使用真实用户评论会带入大量的噪音，比如同一篇文章会有多个、且可能相互矛盾的评论，并且由于检索方法会比较刻板，最终导致生成的结果问题。因此文章提出了结合检索和生成的方法，利用已有用户评论和检索出相关评论，训练一个打分器scorer（怎么训练呢？）。然后利用这些评论和文章，作为copy机制生成模型的训练数据。

AI评论生成，如何既相关又多样？

手写prompt确实很费脑筋，但其实本身大语言模型就是一个很好的自动prompt工具，APE文章提出自动prompt工程（Automatic Prompt Engineer），利用语言模型+蒙特卡洛搜索 自动的寻找最优的Prompt样例，最终在多项任务的效果几乎达到人类水平。

「论文阅读」还在手写Prompt，自动Prompt搜索超越人类水平

chatGPT这么火，这几天一番体验之后，除了惊叹，同时也引发了作为程序员的担忧：我的工作是否会被AI取代？

「AIGC」- ChatGPT可以怎么玩？

机器学习的论文很多，怎么从Arxiv上泛滥的文章中选择论文阅读，那么我们就需要快速地了解论文内容概要，从而决定是否精读。那么怎么快速阅读呢，作者提出只需要阅读过程中只需要回答出以下5个简单问题即可：

【论文阅读】- 怎么快速阅读ML论文？

对话机器人如果能够检测到服务失败的case，再强一点，最好还能够自动纠正，就和人一样，在学习中成长，在成长中学习，越来越强。理想和美好，那么怎么做呢？怎么学习呢？

【自学习】- 怎么让对话机器人越来越强？

问答是对话的重要任务之一，封闭的垂直领域可以构建问题库，通过检索召回、排序的方式回答，然而到了开放域，怎么既利用外部知识，又能够应对多样的问题，前有kbqa，利用结构化的知识库和语义链接，然而这是最优的么？而最近流行的大模型，如GPT-3也在开放域问答上有一定的能力，那么如何在大的语言模型基础上融合知识呢，其实主要面临两个问题，1）检索什么知识，怎么检索。2）怎么讲检索知识加入。

【问答对话】kbqa？开放域问答怎么有知识地生成

【评论生成】AI生成评论，如何既相关又多样？

Fine-tuning范式大家肯定都再熟悉不过，微调所有语言模型参数，而从gpt3出现之后提出的in-context learning，还是越来越火的prompt，fine-tuning 已经out of state了。而这篇文章就提出prefix-tuning的nlg训练方法。

Fine-tuning过时啦，NLG生成任务如何Tuning？

MULTI-VIEW-DNN联合了多个域做的丰富特征，使用multi-view DNN模型构建推荐，包括app、新闻、电影和TV，相比于最好的算法，老用户提升49%，新用户提升110%。并且可以轻松的涵盖大量用户，解决冷启动问题。

『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems


 
 看了LightGBM的论文之后，在从头看XGBoost论文，之前虽然看过，现在对比看的时候又有不同。 

『 论文阅读』XGBoost原理-XGBoost A Scalable Tree Boosting System

任务型对话中，一般包含ASR、语义理解、多轮状态追踪、会话策略、自然语言生成（NLG）模块，那么任务型对话中都有哪些生成的方法呢？

【任务型对话】任务型对话中的自然语言生成

研究任务型对话系统，首先得从数据集采集说起，关于数据之前文章介绍过了，这里就不详细介绍了，参考：任务型多轮对话数据集和采集方法

【多轮对话】多轮对话状态追踪技术综述

命名实体识别（NER, Named Entity Recognition），是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。

NER的过去、现在和未来综述-未来

来源于李宏毅老师机器学习课程，笔记是其中meta learning部分，few-shot learning学习也可以观看此部分课程。

学习让机器学会学习-Meta Learning课程笔记-2

图像中可以通过旋转、翻转变换、rgb转灰度、加入白噪声等方式增强数据，其语义不会发生改变，但是NLP中却往往发生语义改变，针对NLP的一些数据增强方法进行了探索。

NLP数据增强方法-动手实践

如何将知识(knowledge)信息融入到模型训练中，一种方式是将知识信息作为输入，成本是其他人使用的时候也要构建知识库，并且fine-tune和pre-train的知识库分布不一致，fine-tune也会出现问题。

BERT+实体-百度ERNIE优化了啥

问题：对于每个句子，短句相比于长句，吸收同样的n个词噪音，更可能导致类别标签发生变化。

NLP数据增强方法-(一)

文章

问答

视频

学习中心

腾讯云实验室

直播

竞赛

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋 

腾讯云代码助手

CODING DevOps

Cloud Studio

SDK中心

API中心

命令行工具

腾讯云开发者社区推出了我还不懂对话专栏，为你提供了我还不懂对话的相关文章，致力于帮助开发者快速成长与发展。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐