首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1933225
阅读量
188
订阅数
讲座预告 | 数智安全监管机制研究与思考
blocks|key|144768|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|144772|144775|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://developer.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|htt
数据派THU
2023-05-18
1220
讲座预告 | 清华软件论坛:子图匹配的历史
blocks|key|71045|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|71049|71052|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://developer.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|https:
数据派THU
2023-05-11
2840
讲座预告 | 大模型、AI经济与AI基础设施
blocks|key|2175393|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|2175397|2175400|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://developer.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|
数据派THU
2023-04-25
2100
讲座预告 | 网络安全保护
blocks|key|772752|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|772756|772760|772764|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://ask.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|ht
数据派THU
2022-09-27
2480
讲座预告 | 数智安全风险管理
blocks|key|1806846|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|1806850|1806854|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://ask.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|https:
数据派THU
2022-09-20
2320
讲座预告 | 中美网络安全标准追根溯源
blocks|key|1196782|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|1196786|1196790|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://ask.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|https:
数据派THU
2022-09-14
1700
50个最佳机器学习公共数据集(附链接)
来源:机器学习算法那些事本文约3000字,建议阅读6分钟本文整理一张50个醉驾机器学习公共数据集的榜单。 外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,为大家分享一下~ 提前说下须知: 一、寻找数据集的意义 根据CMU的说法,寻找一个好用的数据集需要注意一下几点: 数据集不混乱,否则要花费大量时间来清理数据。 数据集不应包含太多行或列,否则会难以使用。 数据越干净越好,清理大型数据集可能非常耗时。 应该预设一个有趣的问题,而这个问题又
数据派THU
2022-09-07
7780
报名 | 清华大学数据安全与数据要素治理研讨会
blocks|key|542876|text|type|header-one|depth|inlineStyleRanges|entityRanges|data|542877||atomic|offset|length|542881|542885|542891|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://ask.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b91
数据派THU
2022-08-29
1690
NLP预训练范式大一统,不再纠结下游任务类型,谷歌这个新框架刷新50个SOTA
来源:机器之心本文约4100字,建议阅读5分钟本文中,来自谷歌的研究者提出了一种统一各种预训练范式的预训练策略,这种策略不受模型架构以及下游任务类型影响,在 50 项 NLP 任务中实现了 SOTA 结果。 当前,NLP 研究人员和从业者有大量的预训练模型可以选择。在回答应该使用什么模型的问题时,答案通常取决于需要完成什么任务。 这个问题并不容易回答,因为涉及许多更细节的问题,例如使用什么样的架构?span corruption 还是语言模型?答案似乎取决于目标下游任务。 来自谷歌的研究者重新思考了这一问
数据派THU
2022-06-16
3100
清华大学大数据能力提升项目证书申请流程
【办理须知】 1.请再次确认报名大数据能力提升项目年份,并以此查找对应的证书项目要求。 (2019年及之前参照《 2019年培养方案》: https://mp.weixin.qq.com/s/2OdPtKl_Wuj8zEbd0uNTMw   2020年至今参照  《 2020年培养方案》: https://mp.weixin.qq.com/s/LkoOxxdA93C2sOaShB7Y6A) 注:其中,2019年及之前报名项目、2020年夏季学期以中国高校计算机大赛·华为云认定大数据实践课的同学,需要提交附加
数据派THU
2022-06-13
2940
CNN调优总结
来源:Charlotte数据挖掘、深度学习爱好者本文约11000字,建议阅读15+分钟本文详细对比了各种超参数对CNN模型性能的影响。 针对CNN优化的总结 Systematic evaluation of CNN advances on the ImageNet 使用没有 batchnorm 的 ELU 非线性或者有 batchnorm 的 ReLU。 用类似1*1的网络结构预训练RGB数据,能得到更好的效果。 使用线性学习率衰退策略。 使用平均和最大池化层的和。 使用大约 128(0.005) 到 2
数据派THU
2022-06-07
2550
【干货书】图神经网络导论,清华大学刘知远老师著作
来源:专知本文为书籍分享,建议阅读5分钟本书全面介绍了图神经网络的基本概念,模型和应用。 地址: http://nlp.csai.tsinghua.edu.cn/~lzy/books/gnn_2020.html 内容概要: 在复杂的实际应用中,图是有用的数据结构,例如对物理系统进行建模,学习分子指纹,控制交通网络以及在社交网络中推荐朋友。但是,这些任务需要处理包含元素之间的丰富关系信息且无法通过传统深度学习模型(例如卷积神经网络(CNN)或递归神经网络(RNN))妥善处理的非欧氏图数据。图中的节点通常包
数据派THU
2022-06-02
4070
多任务学习模型ESMM原理与实现(附代码)
来源:DataFunTalk本文约2500字,建议阅读5分钟文章基于 Multi-Task Learning (MTL) 的思路,提出一种名为ESMM的CVR预估模型。 [ 导读 ] 本文介绍的是阿里巴巴团队发表在 SIGIR’2018 的论文《Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate》。文章基于 Multi-Task Learning (MTL) 的思路,提出一
数据派THU
2022-05-18
9130
收藏 | 90+深度学习开源数据集整理:包括目标检测、工业缺陷、图像分割等多个方向(附下载)
来源:极市平台本文多干货,建议收藏本文整理汇总了90+深度学习各方向的开源数据集,包含了小目标检测、目标检测、工业缺陷检测、人脸识别、姿态估计、图像分割、图像识别等方向。附下载链接。  小目标检测 1. AI-TOD航空图像数据集 数据集下载地址:http://m6z.cn/5MjlYk AI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比,AI-TOD 中目标的平均大小约为 12.8 像素,远小于其他数据集。 2. iSAI
数据派THU
2022-05-05
4.7K0
通知 | 清华大学大数据能力提升项目证书可申请办理啦
【办理须知】  1.请再次确认报名大数据能力提升项目年份,并以此查找对应的证书项目要求。  2019年及之前参照《 2019年培养方案》:https://mp.weixin.qq.com/s/2OdPtKl_Wuj8zEbd0uNTMw2020年至今参照 《 2020年培养方案》:https://mp.weixin.qq.com/s/LkoOxxdA93C2sOaShB7Y6A 注:其中,2019年及之前报名项目、2020年夏季学期以中国高校计算机大赛·华为云认定大数据实践课的同学,需要提交附加材料;201
数据派THU
2022-03-08
4060
独家 | 提升API设计技能的22个最佳实践(附链接)
作者:Mohammad Faisal翻译:张一然校对:和中华 本文约2000字,建议阅读7分钟本文介绍了有关设计REST api的一些实用建议。
数据派THU
2021-07-16
5210
中国高校首个Apache开源项目 清华数为物联网时序数据库IoTDB 及可自由组装的大数据软件栈系列组件发布
4月25日,清华软件学院师生校友相约云端,共贺清华大学109周年校庆,软件学院建院19周年。
数据派THU
2020-05-07
1.5K0
独家 | 拓扑机器学习的神圣三件套:Gudhi,Scikit-Learn和Tensorflow(附链接&代码)
本文简要介绍了机器学习中拓扑数据分析的力量并展示如何配合三个Python库:Gudhi,Scikit-Learn和Tensorflow进行实践。
数据派THU
2020-03-26
9270
深度学习被高频引用的41篇论文下载(附下载)
1 ImageNet Classification with Deep Convolutional Neural Networks
数据派THU
2020-02-20
6060
关于NLP和机器学习之文本处理
https://github.com/kavgan/nlp-text-mining-working-examples/tree/master/text-pre-processing
数据派THU
2019-05-28
1.3K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档