腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据派THU
专栏作者
举报
2138
文章
1923218
阅读量
188
订阅数
订阅专栏
申请加入专栏
全部文章
神经网络
机器学习
深度学习
人工智能
数据
编程算法
大数据
模型
https
网络安全
python
NLP 服务
数据分析
算法
其他
开源
论文
安全
函数
强化学习
数据处理
数据库
github
工作
系统
图像处理
网络
监督学习
腾讯云测试服务
企业
机器人
设计
sql
优化
git
变量
pytorch
开发
http
基础
框架
统计
数据安全
数据结构
翻译
tensorflow
数据可视化
学习方法
存储
chatgpt
软件
卷积神经网络
工具
性能
数据挖掘
线性回归
tcp/ip
测试
数据科学
自动化
实践
网站
游戏
腾讯云开发者社区
架构
视频
连接
决策树
可视化
知识图谱
图像识别
服务
区块链
html
api
linux
医疗
推荐系统
物联网
搜索
自动驾驶
numpy
特征工程
行业
云计算
对象
无人驾驶
opencv
gpt
管理
计算机
数学
原理
css
分布式
keras
迁移学习
事件
人脸识别
编码
代理
c++
硬件开发
matlab
apache
机器翻译
微信
5g
产品
解决方案
ide
批量计算
程序
集合
教程
量化
java
javascript
go
r 语言
文件存储
缓存
微服务
汽车
编程
科技
内存
渲染
scikit-learn
聚类算法
pandas
研发
异常
.net
SSL 证书
容器
爬虫
无监督学习
data
创业
技巧
计算机视觉
数据类型
图表
信息安全
LLM
ios
bash
android
金融
工业物联
spark
hadoop
正则表达式
架构设计
教育
互联网
计算机科学
脚本
开发者
索引
通信
效率
语音识别
数字货币
php
nosql
访问管理
运维
黑客
markdown
nat
jupyter notebook
分类算法
迁移
com
model
表格
部署
内核
压缩
语法
原型
c 语言
node.js
ajax
typescript
搜索引擎
日志服务
erp
单元测试
kernel
模式识别
uml
小程序
windows
系统架构
信息流
安全治理
联邦学习
隐私计算
app
atomic
function
gpu
graph
nlp
patch
png
precision
prompt
token
编程语言
插件
程序员
递归
二维码
工程师
监控
排序
配置
日志
硬件
字符串
最佳实践
对象存储
iphone
bootstrap
xml
unix
bash 指令
mapreduce
TDSQL MySQL 版
文字识别
DevOps 解决方案
电商
hive
面向对象编程
unity
asp
自动化测试
anaconda
kafka
虚拟化
性能测试
数据库管理
智能网联
abstract
apply
entity
google
max
point
predict
scale
series
target
time
vi
百度
编译
布局
低代码
地图
动态规划
公众号
工作流
规范化
接口
量子计算
入门
手机
数据仓库
数组
芯片
音频
隐私
语音
云平台
数据流
ICP备案
费用中心
云镜(主机安全)
官方文档
比特币
scala
jquery
opengl
qt
单片机
arm
嵌入式
composer
云数据库 SQL Server
oracle
django
打包
全文检索
windows server
容器镜像服务
spring
短视频
消息队列 CMQ 版
检测工具
人脸支付
高性能计算
政务云专区
智能交通
出行
智能硬件
yarn
云联网
serverless
devops
shell
jdbc
二叉树
flash
scrapy
敏捷开发
canvas
processing
云数据库 postgresql
云数据仓库套件 sparkling
flutter
app安全
腾讯会议
sdk
rust
模型测试
验证码
数据集成
图像搜索
图像分析
数据湖
智慧交通
智能制造
小程序·云开发
大模型视频创作引擎
项目管理
腾讯云
acm
add
agent
aigc
alpha
auto
aws
bit
block
byte
chatbot
chrome
convolution
cto
cut
cv2
database
dbpedia
debug
dt
epoch
etl
eval
facebook
file
im
image
implicit
jupyter
kaggle
lag
layer
lift
lstm
matplotlib
min
mips
mnist
models
mysql
network
nodes
nvidia
oceanbase
ode
partial
pdf
persistence
pipeline
probability
pycharm
range
report
reset
scaling
seaborn
self
sequence
show
simulation
size
state
statistics
structure
summary
task
text
torch
twitter
wav
word
worker
wsdl
yaml
yolo
youtube
zero
百度地图
版本控制
备份
闭包
笔记
编译器
登录
动画
队列
二进制
反射
服务器
高性能
工程化
后端
后台
计算机图形学
架构师
加密
金融科技
镜像
客户端
跨域
蓝牙
链表
浏览器
流量
漏洞
密码学
敏捷
苹果
前端
全栈
软件工程
设计模式
摄像头
事务
数据管理
数据中心
图数据库
推送
微信公众号
系统设计
线程
小游戏
性能分析
音视频
域名
源码
元宇宙
云原生
指针
重构
装饰器
作用域
城市交通
自然语言处理
数据清洗
搜索文章
搜索
搜索
关闭
归一化技术比较研究:Batch Norm, Layer Norm, Group Norm
规范化
模型
数据
神经网络
layer
归一化层是深度神经网络体系结构中的关键,在训练过程中确保各层的输入分布一致,这对于高效和稳定的学习至关重要。归一化技术的选择(Batch, Layer, GroupNormalization)会显著影响训练动态和最终的模型性能。每种技术的相对优势并不总是明确的,随着网络体系结构、批处理大小和特定任务的不同而变化。
数据派THU
2024-04-18
59
0
CVPR 2024 | 多模态大模型幻觉原因找到了!
统计
token
部署
论文
模型
OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation
数据派THU
2024-04-16
194
0
港中文提出CLongEval中文基准测试集,准确评估大模型长上下文能力
表格
测试
论文
模型
数据
ClongEval: A Chinese Benchmark for Evaluating Long-Context Large Language Models
数据派THU
2024-04-16
165
0
独家 | 探秘全栈数据科学家
模型
全栈
数据科学
系统
机器学习
作者:Kelvin Lu 翻译:陈之炎校对:赵茹萱本文约4300字,建议阅读9分钟本文介绍了作者对于“全栈数据科学家”的一些见解。
数据派THU
2024-04-01
100
0
独家 | 生成式AI的设计模式:一份全面的指南
设计模式
数据
代理
工具
模型
在创建新事物的时候,我们都会依赖经过尝试检验的方法、途经和模式。这个说法适用于软件工程领域,但对于生成式AI和人工智能来说可能并非如此。对于像生成式AI等新兴技术,我们缺乏充分记录的模式来支持我们的解决办法。
数据派THU
2024-04-01
167
0
独家 | 80%的时间中,数据科学家使用的20%探索数据的图——您需要了解的探索性数据分析(EDA)
数据
数据科学
数据分析
变量
可视化
据IBM的介绍,探索性数据分析(EDA)是数据科学家用来分析和研究数据集并总结其主要特征的一种方法,通常采用数据可视化技术。因此可以说,EDA 是通过创建可视化和摘要来研究和理解数据集的过程。
数据派THU
2024-03-01
103
0
独家 | 2024,AI即将面临什么?
模型
视频
数据
机器人
工具
《麻省理工科技评论》的“接下来是什么”一期环顾了行业,趋势和技术以求为您提供最新的未来视角。阅读我们该期的剩余内容(https://www.technologyreview.com/tag/whats-next-in-tech/)。
数据派THU
2024-01-26
144
0
原创 | 基于Python的强化学习库
python
强化学习
开发
数据
算法
OpenAI Gym是一个用于开发和比较强化学习算法的Python库。它提供了一个标准化的环境,使得研究人员可以轻松地测试和比较他们的算法。Gym库中的环境可以是简单的数学问题,也可以是复杂的机器人控制问题。它还提供了多种预定义的环境,如CartPole、MountainCar等,这些环境都可以用于测试和比较强化学习算法。
数据派THU
2024-01-24
157
0
原创 | 一个简单的推导:从相关性走向因果性
公众号
基础
框架
数据
统计
其实关于“因果推断”的疑惑在我的本科阶段就埋下了种子。我相信几乎所有上过计量或者统计的同学,上课的课件里一定会有一句:Correlation is not causation(相关性不是因果性),仿佛先给你打好预防针:我给你讲的是“相关”,你别当“因果”。其实我当时是困惑的:“那因果性是个啥?因果性和相关性这俩又是啥关系?”但我没有深究为什么,只想着做做题应付考试就好,但自那时起这些疑问似乎成为了一个心结,被封存在长时记忆里,却经常蠢蠢欲动。直到六七年后,我开始重新认真思考这个问题。一次偶然,我在“因果推断”的书籍里发现了一个简单的而又绝妙的推导,我不禁拍案叫绝(是真的拍,拍掉了我的煎饼果子),因为它恰好回答了这个问题。我想通过这篇文章分享这个推导过程,希望能让各位读者也感受到“因果推断”这个领域的奇思妙想。
数据派THU
2024-01-23
172
0
【AAAI2024】公平感知的Transformer模型结构剪枝
编程
大型语言模型(LLMs)的不断增大引入了在它们的训练和推断中面临的挑战。移除模型组件被认为是解决大型模型尺寸问题的一种方法,然而,现有的剪枝方法仅关注性能,而没有考虑到对LLMs的负责任使用的一个重要方面:模型的公平性。对于多样化群体,如女性、黑人、LGBTQ+、犹太社区等,重要的是要关注LLMs的公平性,因为它们正在被部署并面向广泛的受众。在这项工作中,首先,我们研究了在基于预训练Transformer的语言模型中,注意力头(attention heads)如何影响公平性和性能。然后,我们提出了一种新的方法,用于剪枝那些对公平性产生负面影响但对性能至关重要的注意力头,即语言建模能力的关键头部。我们的方法在时间和资源方面具有实用性,因为它不需要对最终剪枝后的更公平模型进行微调。我们的研究结果表明,与有偏见的模型相比,DistilGPT-2、GPT2、两种不同尺寸的GPT-Neo、GPT-J和Llama 2模型的性别偏见分别减少了19%、19.5%、39.5%、34.7%、23%和8%,而性能只略有下降。警告:本研究使用了具有冒犯性质的语言。
数据派THU
2024-01-07
116
0
独家 | 在一个4GBGPU上运行70B大模型推理的新技术
缓存
模型
内存
数据
优化
大语言模型通常需要较大的GPU内存。那能不能在单个GPU上运行推理?如果可以,那么所需的最小GPU内存又是多少?
数据派THU
2024-01-07
455
0
独家 | 机器学习中的损失函数解释
机器学习
函数
模型
数据
异常
机器学习为计算模型提供了基于数据进行预测、分类和决策的能力。作为一个研究领域,机器学习是人工智能领域的一个子集,它封装了构建具有模仿人类智能甚至在某些情况下超越人类智能的能力的计算模型所涉及的过程。
数据派THU
2023-12-26
233
0
论文 | 一切皆可连接:图神经网络 | 大牛GAT作者Petar Velickovic最新综述
神经网络
连接
论文
模型
网络
在许多方面,图是我们从自然界接收数据的主要形式。这是因为我们看到的大多数模式,无论是在自然系统还是人工系统中,都可以使用图结构语言来优雅地表示。突出的例子包括分子(表示为原子和键的图)、社交网络和运输网络。这种潜力已经被主要的科学和工业团体看到,其已经受到影响的应用领域包括流量预测、药物发现、社交网络分析和推荐系统。此外,前几年机器学习最成功的一些应用领域——图像、文本和语音处理——可以被视为图表示学习的特例,因此这些领域之间存在大量的信息交换。这项简短调查的主要目的是使读者能够吸收该领域的关键概念,并在相关领域的适当背景下定位图表示学习。
数据派THU
2023-12-19
402
0
原创 | 数据的确权、流通、入表与监管研究(二)数据与流通
服务
基础
模型
数据
通信
2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。
数据派THU
2023-12-11
190
0
原创 | 有趣的等待时间悖论
程序
事件
统计
系统
以上场景发生时,我们通常不得不选择等一会,那关于这个等待时间的平均值,其实有一个有趣的悖论,本文中作者会对其做一个通俗且深入的介绍。
数据派THU
2023-12-11
145
0
原创 | 数据的确权、流通、入表与监管研究(一):数据与确权
网站
对象
基础
模型
数据
2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。
数据派THU
2023-12-11
180
0
独家 | 每个数据科学家都必学的统计学概念
变量
模型
数据
数据科学
统计
在数据科学领域,有一些重要的思想帮助人们提高了工作流程的效率,并且也成为了强大的工具。这些思想帮助数据科学家们理解他们所处理的所有信息。
数据派THU
2023-12-11
144
0
原创 | 大模型扫盲系列——初识大模型
模型
数据
算法
性能
优化
近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析,帮助读者初步了解大模型。
数据派THU
2023-11-22
7.2K
0
独家 | 这种新的数据投毒工具可以让艺术家反击生成式人工智能
人工智能
工具
科技
模型
数据
作者:Melissa Heikkilä 翻译:付雯欣校对:赵茹萱 本文约2500字,建议阅读5分钟工具名为 Nightshade,它会扰乱训练数据,从而可能对图像生成人工智能模型造成严重损害。
数据派THU
2023-11-20
209
0
独家 | 提示工程的进化:定义新程序仿真提示框架
程序
翻译
框架
模型
配置
在我最近的文章《新ChatGPT提示工程技术:程序仿真》中,提出了一种新的提示工程技术,旨在使ChatGPT-4表现得像一个程序。在开发它时,让我印象最为深刻的是ChatGPT-4根据程序规格实现自我配置的能力。在原始的程序仿真提示中,严格定义一组功能,并期望使用ChatGPT-4来使得程序状态与功能保持一致。结果令人难忘,许多读者分享了如何成功地将这种方法应用于多种用例。
数据派THU
2023-11-19
133
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档