腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
程序生活
专栏作者
举报
436
文章
463330
阅读量
57
订阅数
订阅专栏
申请加入专栏
全部文章
编程算法
python
https
其他
神经网络
模型
机器学习
深度学习
网络安全
数据
NLP 服务
人工智能
数据结构
腾讯云测试服务
函数
github
LLM
开源
pytorch
性能
git
tensorflow
php
爬虫
二叉树
论文
ajax
qt
卷积神经网络
opencv
线性回归
大数据
特征工程
data
对象
工具
node.js
html
图像处理
网站
nlp
测试
系统
javascript
数据库
linux
http
keras
image
model
script
text
编码
教程
搜索
优化
数据挖掘
css
sql
中文分词
文字识别
存储
hadoop
hive
numpy
监督学习
腾讯云开发者社区
学习方法
var
工作
基础
框架
排序
设计
事件
数组
索引
字符串
语音识别
bash
r 语言
jquery
bash 指令
mapreduce
批量计算
文件存储
金融风控
容器
分布式
spark
强化学习
markdown
数据分析
数据处理
分类算法
验证码
chatgpt
code
connect
dataset
dom
glm
gpt
href
match
models
prompt
scaling
self
title
ui
遍历
部署
程序
动态规划
服务器
集合
脚本
开发
连接
配置
算法
统计
图片上传
学习笔记
云镜(主机安全)
人脸识别
java
c++
.net
angularjs
vue.js
xml
json
arm
access
打包
ide
api
搜索引擎
centos
apache
容器镜像服务
laravel
访问管理
机器翻译
知识图谱
企业
codeigniter
svg
yarn
serverless
游戏
shell
图像识别
jvm
正则表达式
gui
面向对象编程
决策树
unity
tcp/ip
无监督学习
迁移学习
anaconda
安全
小程序
机器人
nat
processing
机器学习平台
智能推荐平台
智能客服机器人
aigc
anchor
auto
backbone
block
border
chat
ci
class
config
copy
distance
double
edit
event
file
function
google
gpu
graph
height
history
import
input
io
knn
lan
layer
leetcode
line
lstm
microsoft
min
modeling
multilingual
mysql
mysqli
nav
numbers
output
pandas
pdf
pip
png
precision
python3
root
schedule
series
server
setinterval
sh
similarity
size
split
strip
tail
target
task
torch
url
web
x86
xmlhttprequest
yii2
百度
编程语言
变量
博客
代理
递归
定时器
动画
翻译
服务
技巧
计算机
架构
可视化
蓝牙
链表
浏览器
内存
入门
通信
网络
效率
语法
自然语言处理
LoRa
搜索文章
搜索
搜索
关闭
RLHF 和 DPO:简化和增强语言模型的微调
人工智能
强化学习
模型
数据
优化
人类反馈强化学习 (RLHF) 是人工智能领域的一种前沿方法,它利用人类偏好和指导来训练和改进机器学习模型。 RLHF的核心是一种机器学习范式,它结合了强化学习和监督学习的元素,使人工智能系统能够以更加人性化的方式学习和做出决策。 RLHF的重要性在于它有可能解决人工智能中的一些基本挑战,例如需要模型来理解和尊重人类的价值观和偏好。传统的强化学习模型通过与环境交互产生的奖励来学习,而 RLHF 则不同,它引入了人类反馈作为宝贵的指导来源。这种反馈可以帮助人工智能系统导航复杂的决策空间,与人类价值观保持一致,并做出更明智和道德的选择。RLHF 已经在从自然语言处理和推荐系统到机器人和自动驾驶汽车的广泛领域中找到了应用。通过将人类反馈纳入训练过程,RLHF有能力提高模型性能,增强用户体验,并为人工智能技术的负责任发展做出贡献。
致Great
2024-01-18
1.3K
0
生成式AI的一小步,AGI的一大步:AIGC时代ChatGPT全盘调查
人工智能
aigc
chatgpt
工作
统计
OpenAI 最近发布了 GPT-4(又名 ChatGPT plus),这被证明是生成式 AI (GAI) 的一小步,但是通用人工智能 (AGI)的巨大飞跃。 自 2022 年 11 月正式发布以来,ChatGPT 迅速吸引了众多具有广泛媒体报道的用户。 如此空前的关注度也激发了众多研究人员对 ChatGPT 进行研究从各个方面。 根据 Google scholar 统计,有超过 500 篇文章在标题中或在他们的摘要中提到了 ChatGPT。 考虑到这一点,迫切需要进行复盘,而本文的工作填补了这一空白。 总的来说,这项工作是第一个调查ChatGPT 全面回顾了其基础技术、应用程序和挑战。 此外,我们对 ChatGPT 如何发展以实现通用 AIGC(又名 AI 生成的内容)提出了展望,这将是一个重要的里程碑AGI的发展。
致Great
2023-08-25
165
0
Python人工智能之图片识别,Python3一行代码实现图片文字识别
python
文字识别
人工智能
python3
配置
自学Python3第5天,今天突发奇想,想用Python识别图片里的文字。没想到Python实现图片文字识别这么简单,只需要一行代码就能搞定
致Great
2023-08-25
956
0
中文文本纠错工具推荐:pycorrector
人工智能
工具
脚本
模型
数据
中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3开发。
致Great
2023-08-25
741
0
ERNIE 3.0 Titan:最强中文预训练模型
NLP 服务
神经网络
深度学习
人工智能
本文介绍了一个中文大语言模型。作者提出了名为ERNIE 3.0的统一框架,用于预训练大规模知识增强模型,并训练了一个具有 100 亿个参数的模型。 ERNIE 3.0 在各种 NLP 任务上的表现优于最先进的模型。为了探索扩展 ERNIE 3.0 的性能,作者在PaddlePaddle平台上训练了具有多达2600亿个参数的百亿参数模型 ERNIE 3.0 Titan。此外,作者设计了一个自监督的对抗损失和一个可控的语言建模损失,使ERNIE 3.0 Titan 生成可信且可控的文本。为了减少计算开销和碳排放,作者为 ERNIE 3.0 Titan 提出了一个在线蒸馏框架,其中教师模型将同时教授学生和自我训练。ERNIE 3.0 Titan是迄今为止最大的中文密集预训练模型。实证结果表明,ERNIE 3.0 Titan在 68 个NLP数据集上的表现优于最先进的模型。
致Great
2022-01-06
889
0
给Bert加速吧!NLP中的知识蒸馏论文 Distilled BiLSTM解读
机器学习
深度学习
人工智能
神经网络
论文题目:Distilling Task-Specific Knowledge from BERT into Simple Neural Networks 论文链接:https://arxiv.org/pdf/1903.12136.pdf
致Great
2021-11-24
629
0
图神经网络必读论文-Must-read papers on GNN
数据结构
机器学习
linux
神经网络
人工智能
GNN: graph neural network Contributed by Jie Zhou, Ganqu Cui, Zhengyan Zhang and Yushi Bai. 来源:THU
致Great
2021-05-11
1.5K
0
Multi-Scale Convolutional Neural Networks for Time Series Classification
机器学习
神经网络
深度学习
人工智能
腾讯云测试服务
通过降采样的变换,实现在不同时间尺度的序列上的特征提取。 通过滑动平均的变换,实现对噪音的抵抗性。
致Great
2021-03-03
561
0
Kaggle系列-IEEE-CIS Fraud Detection第一名复现
机器学习
神经网络
深度学习
人工智能
想象一下,站在杂货店的收银台,身后排着长队,收银员没有那么安静地宣布您的信用卡被拒绝了。在这一刻,你可能没有想到决定你命运的数据科学。 非常尴尬有木有?当然你肯定有足够的资金为50个最亲密的朋友办一场盛大的纳乔派对,然后你又试了一次,但是还是同样的结果。此时你只能站在另外一边,让收银员为下一个客户服务时,你收到了银行的短信。“如果你真的想花500美元买切达干酪,请按1。” 虽然现在可能很麻烦(而且常常很尴尬),但这种防欺诈系统实际上每年为消费者节省数百万美元。来自ieee计算智能协会(ieee-cis)的研究人员希望在改善客户体验的同时,提升这个数字。有了更高准确度的欺诈检测率,您就可以在没有麻烦的情况下继续使用您的芯片。 ieee-cis在各种人工智能和机器学习领域,包括深层神经网络、模糊系统、演化计算和群智能等等。今天,他们正与世界领先的支付服务公司Vesta Corporation合作,为防欺诈行业寻求最佳解决方案,现在邀请您也加入此次挑战。 在本次竞赛中,您将在一个具有挑战性的大型数据集上对你的机器学习模型进行基准测试。这些数据来自Vesta的真实电子商务交易,并且包含了从设备类型到产品功能的各种特征。您还可以创建新的特征来改善结果。 如果成功,您将提高全球数百万人的欺诈交易警报的有效性,帮助数十万企业减少欺诈损失并增加收入。当然,你也可以为你自己减少误报的麻烦。
致Great
2021-01-21
547
0
教程:如何直接从可视化CNN layers中的特征
深度学习
机器学习
人工智能
神经网络
注意:在这里,我们只关心构建CNN模型并观察其特征图(feature map),我们不关心模型的准确性。
致Great
2021-01-06
865
0
转 Target Encoding之Smoothing
编程算法
机器学习
神经网络
深度学习
人工智能
原文:https://www.cnblogs.com/bjwu/p/9087071.html
致Great
2020-12-16
1K
0
Datawhale 零基础入门CV赛事-Task5 模型集成
机器学习
深度学习
神经网络
人工智能
学习方法
在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。
致Great
2020-06-03
273
0
Datawhale 零基础入门CV赛事-Task4 模型训练与验证
腾讯云测试服务
深度学习
机器学习
神经网络
人工智能
为此本章将从构建验证集、模型训练和验证、模型保存与加载和模型调参几个部分讲解,在部分小节中将会结合Pytorch代码进行讲解。
致Great
2020-06-03
583
0
Datawhale 零基础入门CV赛事-Task3 字符识别模型
机器学习
神经网络
深度学习
人工智能
pytorch
本章将会讲解卷积神经网络(Convolutional Neural Network, CNN)的常见层,并从头搭建一个字符识别模型。
致Great
2020-05-29
376
0
动手学深度学习(十四) NLP注意力机制和Seq2seq模型
机器学习
神经网络
深度学习
人工智能
在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量(context vector)来获取输⼊序列信息。当编码器为循环神经⽹络时,背景变量来⾃它最终时间步的隐藏状态。将源序列输入信息以循环单位状态编码,然后将其传递给解码器以生成目标序列。然而这种结构存在着问题,尤其是RNN机制实际中存在长程梯度消失的问题,对于较长的句子,我们很难寄希望于将输入的序列转化为定长的向量而保存所有的有效信息,所以随着所需翻译句子的长度的增加,这种结构的效果会显著下降。
致Great
2020-02-25
445
0
动手学深度学习(十二) NLP循环神经网络进阶
深度学习
机器学习
人工智能
神经网络
RNN存在的问题:梯度较容易出现衰减或爆炸(BPTT) ⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系 RNN:
致Great
2020-02-25
399
0
动手学深度学习(十一) NLP循环神经网络
NLP 服务
神经网络
机器学习
深度学习
人工智能
本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量
致Great
2020-02-25
707
0
GAN对抗网络入门教程
机器学习
深度学习
人工智能
编程算法
https
译:A Beginner's Guide to Generative Adversarial Networks (GANs) https://skymind.ai/wiki/generative-adversarial-network-gan
致Great
2019-09-18
1.5K
0
机器学习(十七)Microsoft的InterpretM可解释性 机器学习模型
机器学习
决策树
神经网络
深度学习
人工智能
InterpretML是一个开源软件包,用于训练可解释的模型并解释黑盒系统。可解释性主要表现在以下几点:
致Great
2019-05-22
1.8K
0
斯坦福tensorflow教程(八) 计算机视觉和卷积网络简介
机器学习
深度学习
人工智能
卷积神经网络
神经网络
卷积不是一个新的概念,在很早以前的索贝算子就应用到,在影像处理及电脑视觉领域中常被用来做边缘检测
致Great
2019-04-17
349
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档