腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据派THU
专栏作者
举报
2139
文章
1933433
阅读量
188
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
神经网络(472)
机器学习(454)
深度学习(452)
人工智能(369)
数据(345)
编程算法(327)
大数据(282)
模型(280)
https(258)
网络安全(249)
python(154)
NLP 服务(126)
数据分析(121)
算法(82)
其他(78)
开源(75)
论文(66)
安全(65)
函数(65)
强化学习(63)
数据处理(62)
数据库(61)
github(61)
工作(57)
系统(56)
图像处理(53)
网络(52)
监督学习(48)
腾讯云测试服务(47)
企业(45)
机器人(45)
设计(44)
sql(41)
优化(41)
git(39)
变量(36)
pytorch(35)
开发(34)
http(33)
基础(33)
框架(33)
统计(31)
数据安全(30)
数据结构(30)
翻译(30)
tensorflow(29)
数据可视化(29)
学习方法(29)
存储(28)
chatgpt(28)
软件(28)
卷积神经网络(27)
工具(27)
性能(26)
数据科学(25)
数据挖掘(24)
线性回归(24)
tcp/ip(24)
测试(24)
自动化(22)
实践(22)
网站(21)
游戏(21)
腾讯云开发者社区(21)
架构(21)
视频(21)
连接(20)
决策树(19)
可视化(19)
知识图谱(18)
图像识别(18)
服务(18)
区块链(17)
html(17)
api(16)
linux(16)
医疗(16)
推荐系统(16)
物联网(16)
搜索(16)
自动驾驶(15)
numpy(15)
特征工程(15)
行业(15)
云计算(14)
对象(14)
无人驾驶(13)
opencv(13)
gpt(13)
管理(13)
计算机(13)
数学(13)
原理(13)
css(12)
分布式(12)
keras(12)
迁移学习(12)
事件(12)
人脸识别(11)
编码(11)
代理(11)
c++(10)
硬件开发(10)
matlab(10)
apache(10)
机器翻译(10)
微信(10)
5g(10)
产品(10)
解决方案(10)
ide(9)
批量计算(9)
程序(9)
集合(9)
教程(9)
量化(9)
java(8)
javascript(8)
go(8)
r 语言(8)
文件存储(8)
缓存(8)
微服务(8)
汽车(8)
编程(8)
科技(8)
内存(8)
渲染(7)
scikit-learn(7)
聚类算法(7)
pandas(7)
研发(7)
异常(7)
.net(6)
SSL 证书(6)
容器(6)
爬虫(6)
无监督学习(6)
data(6)
创业(6)
技巧(6)
计算机视觉(6)
数据类型(6)
图表(6)
信息安全(6)
LLM(6)
ios(5)
bash(5)
android(5)
金融(5)
工业物联(5)
spark(5)
hadoop(5)
正则表达式(5)
架构设计(5)
教育(5)
互联网(5)
计算机科学(5)
脚本(5)
开发者(5)
索引(5)
通信(5)
效率(5)
语音识别(4)
数字货币(4)
php(4)
nosql(4)
访问管理(4)
运维(4)
黑客(4)
markdown(4)
nat(4)
jupyter notebook(4)
分类算法(4)
迁移(4)
com(4)
model(4)
表格(4)
部署(4)
内核(4)
压缩(4)
语法(4)
原型(4)
c 语言(3)
node.js(3)
ajax(3)
typescript(3)
搜索引擎(3)
日志服务(3)
erp(3)
单元测试(3)
kernel(3)
模式识别(3)
uml(3)
小程序(3)
windows(3)
系统架构(3)
信息流(3)
安全治理(3)
联邦学习(3)
隐私计算(3)
app(3)
atomic(3)
function(3)
gpu(3)
graph(3)
nlp(3)
patch(3)
png(3)
precision(3)
prompt(3)
token(3)
编程语言(3)
插件(3)
程序员(3)
递归(3)
二维码(3)
工程师(3)
监控(3)
排序(3)
配置(3)
日志(3)
硬件(3)
字符串(3)
最佳实践(3)
对象存储(2)
iphone(2)
bootstrap(2)
xml(2)
unix(2)
bash 指令(2)
mapreduce(2)
TDSQL MySQL 版(2)
文字识别(2)
DevOps 解决方案(2)
电商(2)
hive(2)
面向对象编程(2)
unity(2)
asp(2)
自动化测试(2)
anaconda(2)
kafka(2)
虚拟化(2)
性能测试(2)
数据库管理(2)
智能网联(2)
abstract(2)
apply(2)
entity(2)
google(2)
max(2)
point(2)
predict(2)
scale(2)
series(2)
target(2)
time(2)
vi(2)
百度(2)
编译(2)
布局(2)
低代码(2)
地图(2)
动态规划(2)
公众号(2)
工作流(2)
规范化(2)
接口(2)
量子计算(2)
入门(2)
手机(2)
数据仓库(2)
数组(2)
芯片(2)
音频(2)
隐私(2)
语音(2)
云平台(2)
数据流(2)
ICP备案(1)
费用中心(1)
云镜(主机安全)(1)
官方文档(1)
比特币(1)
scala(1)
jquery(1)
opengl(1)
qt(1)
单片机(1)
arm(1)
嵌入式(1)
composer(1)
云数据库 SQL Server(1)
oracle(1)
django(1)
打包(1)
全文检索(1)
windows server(1)
容器镜像服务(1)
spring(1)
短视频(1)
消息队列 CMQ 版(1)
检测工具(1)
人脸支付(1)
高性能计算(1)
政务云专区(1)
智能交通(1)
出行(1)
智能硬件(1)
yarn(1)
云联网(1)
serverless(1)
devops(1)
shell(1)
jdbc(1)
二叉树(1)
flash(1)
scrapy(1)
敏捷开发(1)
canvas(1)
processing(1)
云数据库 postgresql(1)
云数据仓库套件 sparkling(1)
flutter(1)
app安全(1)
腾讯会议(1)
sdk(1)
rust(1)
模型测试(1)
验证码(1)
数据集成(1)
图像搜索(1)
图像分析(1)
数据湖(1)
智慧交通(1)
智能制造(1)
小程序·云开发(1)
大模型视频创作引擎(1)
项目管理(1)
腾讯云(1)
acm(1)
add(1)
agent(1)
aigc(1)
alpha(1)
auto(1)
aws(1)
bit(1)
block(1)
byte(1)
chatbot(1)
chrome(1)
convolution(1)
cto(1)
cut(1)
cv2(1)
database(1)
dbpedia(1)
debug(1)
dt(1)
epoch(1)
etl(1)
eval(1)
facebook(1)
file(1)
im(1)
image(1)
implicit(1)
jupyter(1)
kaggle(1)
lag(1)
layer(1)
lift(1)
lstm(1)
matplotlib(1)
min(1)
mips(1)
mnist(1)
models(1)
mysql(1)
network(1)
nodes(1)
nvidia(1)
oceanbase(1)
ode(1)
partial(1)
pdf(1)
persistence(1)
pipeline(1)
probability(1)
pycharm(1)
range(1)
report(1)
reset(1)
scaling(1)
seaborn(1)
self(1)
sequence(1)
show(1)
simulation(1)
size(1)
state(1)
statistics(1)
structure(1)
summary(1)
task(1)
text(1)
torch(1)
twitter(1)
wav(1)
word(1)
worker(1)
wsdl(1)
yaml(1)
yolo(1)
youtube(1)
zero(1)
百度地图(1)
版本控制(1)
备份(1)
闭包(1)
笔记(1)
编译器(1)
登录(1)
动画(1)
队列(1)
二进制(1)
反射(1)
服务器(1)
高性能(1)
工程化(1)
后端(1)
后台(1)
计算机图形学(1)
架构师(1)
加密(1)
金融科技(1)
镜像(1)
客户端(1)
跨域(1)
蓝牙(1)
链表(1)
浏览器(1)
流量(1)
漏洞(1)
密码学(1)
敏捷(1)
苹果(1)
前端(1)
全栈(1)
软件工程(1)
设计模式(1)
摄像头(1)
事务(1)
数据管理(1)
数据中心(1)
图数据库(1)
推送(1)
微信公众号(1)
系统设计(1)
线程(1)
小游戏(1)
性能分析(1)
音视频(1)
域名(1)
源码(1)
元宇宙(1)
云原生(1)
指针(1)
重构(1)
装饰器(1)
作用域(1)
城市交通(1)
自然语言处理(1)
数据清洗(1)
搜索文章
搜索
搜索
关闭
独家 | 数据科学家应该了解的5个 Python库(附链接)
模型
数据
数据科学
机器学习
python
作者:Artem Shelamanov 翻译:陈之炎校对:赵茹萱本文约2800字,建议阅读5分钟本文介绍了机器学习库,并掌握了模型架构之后,便可以训练模型解决现实问题。
数据派THU
2024-04-25
25
0
归一化技术比较研究:Batch Norm, Layer Norm, Group Norm
规范化
模型
数据
神经网络
layer
归一化层是深度神经网络体系结构中的关键,在训练过程中确保各层的输入分布一致,这对于高效和稳定的学习至关重要。归一化技术的选择(Batch, Layer, GroupNormalization)会显著影响训练动态和最终的模型性能。每种技术的相对优势并不总是明确的,随着网络体系结构、批处理大小和特定任务的不同而变化。
数据派THU
2024-04-18
84
0
CVPR 2024 | 多模态大模型幻觉原因找到了!
统计
token
部署
论文
模型
OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation
数据派THU
2024-04-16
235
0
港中文提出CLongEval中文基准测试集,准确评估大模型长上下文能力
表格
测试
论文
模型
数据
ClongEval: A Chinese Benchmark for Evaluating Long-Context Large Language Models
数据派THU
2024-04-16
174
0
独家 | 探秘全栈数据科学家
模型
全栈
数据科学
系统
机器学习
作者:Kelvin Lu 翻译:陈之炎校对:赵茹萱本文约4300字,建议阅读9分钟本文介绍了作者对于“全栈数据科学家”的一些见解。
数据派THU
2024-04-01
103
0
独家 | 生成式AI的设计模式:一份全面的指南
设计模式
数据
代理
工具
模型
在创建新事物的时候,我们都会依赖经过尝试检验的方法、途经和模式。这个说法适用于软件工程领域,但对于生成式AI和人工智能来说可能并非如此。对于像生成式AI等新兴技术,我们缺乏充分记录的模式来支持我们的解决办法。
数据派THU
2024-04-01
171
0
独家 | 80%的时间中,数据科学家使用的20%探索数据的图——您需要了解的探索性数据分析(EDA)
数据
数据科学
数据分析
变量
可视化
据IBM的介绍,探索性数据分析(EDA)是数据科学家用来分析和研究数据集并总结其主要特征的一种方法,通常采用数据可视化技术。因此可以说,EDA 是通过创建可视化和摘要来研究和理解数据集的过程。
数据派THU
2024-03-01
104
0
独家 | 2024,AI即将面临什么?
模型
视频
数据
机器人
工具
《麻省理工科技评论》的“接下来是什么”一期环顾了行业,趋势和技术以求为您提供最新的未来视角。阅读我们该期的剩余内容(https://www.technologyreview.com/tag/whats-next-in-tech/)。
数据派THU
2024-01-26
144
0
原创 | 基于Python的强化学习库
python
强化学习
开发
数据
算法
OpenAI Gym是一个用于开发和比较强化学习算法的Python库。它提供了一个标准化的环境,使得研究人员可以轻松地测试和比较他们的算法。Gym库中的环境可以是简单的数学问题,也可以是复杂的机器人控制问题。它还提供了多种预定义的环境,如CartPole、MountainCar等,这些环境都可以用于测试和比较强化学习算法。
数据派THU
2024-01-24
166
0
原创 | 一个简单的推导:从相关性走向因果性
公众号
基础
框架
数据
统计
其实关于“因果推断”的疑惑在我的本科阶段就埋下了种子。我相信几乎所有上过计量或者统计的同学,上课的课件里一定会有一句:Correlation is not causation(相关性不是因果性),仿佛先给你打好预防针:我给你讲的是“相关”,你别当“因果”。其实我当时是困惑的:“那因果性是个啥?因果性和相关性这俩又是啥关系?”但我没有深究为什么,只想着做做题应付考试就好,但自那时起这些疑问似乎成为了一个心结,被封存在长时记忆里,却经常蠢蠢欲动。直到六七年后,我开始重新认真思考这个问题。一次偶然,我在“因果推断”的书籍里发现了一个简单的而又绝妙的推导,我不禁拍案叫绝(是真的拍,拍掉了我的煎饼果子),因为它恰好回答了这个问题。我想通过这篇文章分享这个推导过程,希望能让各位读者也感受到“因果推断”这个领域的奇思妙想。
数据派THU
2024-01-23
176
0
【AAAI2024】公平感知的Transformer模型结构剪枝
编程
大型语言模型(LLMs)的不断增大引入了在它们的训练和推断中面临的挑战。移除模型组件被认为是解决大型模型尺寸问题的一种方法,然而,现有的剪枝方法仅关注性能,而没有考虑到对LLMs的负责任使用的一个重要方面:模型的公平性。对于多样化群体,如女性、黑人、LGBTQ+、犹太社区等,重要的是要关注LLMs的公平性,因为它们正在被部署并面向广泛的受众。在这项工作中,首先,我们研究了在基于预训练Transformer的语言模型中,注意力头(attention heads)如何影响公平性和性能。然后,我们提出了一种新的方法,用于剪枝那些对公平性产生负面影响但对性能至关重要的注意力头,即语言建模能力的关键头部。我们的方法在时间和资源方面具有实用性,因为它不需要对最终剪枝后的更公平模型进行微调。我们的研究结果表明,与有偏见的模型相比,DistilGPT-2、GPT2、两种不同尺寸的GPT-Neo、GPT-J和Llama 2模型的性别偏见分别减少了19%、19.5%、39.5%、34.7%、23%和8%,而性能只略有下降。警告:本研究使用了具有冒犯性质的语言。
数据派THU
2024-01-07
120
0
独家 | 在一个4GBGPU上运行70B大模型推理的新技术
缓存
模型
内存
数据
优化
大语言模型通常需要较大的GPU内存。那能不能在单个GPU上运行推理?如果可以,那么所需的最小GPU内存又是多少?
数据派THU
2024-01-07
592
0
独家 | 机器学习中的损失函数解释
机器学习
函数
模型
数据
异常
机器学习为计算模型提供了基于数据进行预测、分类和决策的能力。作为一个研究领域,机器学习是人工智能领域的一个子集,它封装了构建具有模仿人类智能甚至在某些情况下超越人类智能的能力的计算模型所涉及的过程。
数据派THU
2023-12-26
240
0
论文 | 一切皆可连接:图神经网络 | 大牛GAT作者Petar Velickovic最新综述
神经网络
连接
论文
模型
网络
在许多方面,图是我们从自然界接收数据的主要形式。这是因为我们看到的大多数模式,无论是在自然系统还是人工系统中,都可以使用图结构语言来优雅地表示。突出的例子包括分子(表示为原子和键的图)、社交网络和运输网络。这种潜力已经被主要的科学和工业团体看到,其已经受到影响的应用领域包括流量预测、药物发现、社交网络分析和推荐系统。此外,前几年机器学习最成功的一些应用领域——图像、文本和语音处理——可以被视为图表示学习的特例,因此这些领域之间存在大量的信息交换。这项简短调查的主要目的是使读者能够吸收该领域的关键概念,并在相关领域的适当背景下定位图表示学习。
数据派THU
2023-12-19
411
0
原创 | 数据的确权、流通、入表与监管研究(二)数据与流通
服务
基础
模型
数据
通信
2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。
数据派THU
2023-12-11
192
0
原创 | 有趣的等待时间悖论
程序
事件
统计
系统
以上场景发生时,我们通常不得不选择等一会,那关于这个等待时间的平均值,其实有一个有趣的悖论,本文中作者会对其做一个通俗且深入的介绍。
数据派THU
2023-12-11
149
0
原创 | 数据的确权、流通、入表与监管研究(一):数据与确权
网站
对象
基础
模型
数据
2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。
数据派THU
2023-12-11
184
0
独家 | 每个数据科学家都必学的统计学概念
变量
模型
数据
数据科学
统计
在数据科学领域,有一些重要的思想帮助人们提高了工作流程的效率,并且也成为了强大的工具。这些思想帮助数据科学家们理解他们所处理的所有信息。
数据派THU
2023-12-11
145
0
原创 | 大模型扫盲系列——初识大模型
模型
数据
算法
性能
优化
近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析,帮助读者初步了解大模型。
数据派THU
2023-11-22
7.8K
0
独家 | 这种新的数据投毒工具可以让艺术家反击生成式人工智能
人工智能
工具
科技
模型
数据
作者:Melissa Heikkilä 翻译:付雯欣校对:赵茹萱 本文约2500字,建议阅读5分钟工具名为 Nightshade,它会扰乱训练数据,从而可能对图像生成人工智能模型造成严重损害。
数据派THU
2023-11-20
213
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档