首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2138
文章
1931703
阅读量
188
订阅数
干货 | 数字经济创新创业——DWF和Apache IOTDB研究项目介绍
下文整理自清华大学大数据能力提升项目能力提升模块课程“Innovation & Entrepreneurship for Digital Economy”(数字经济创新创业课程)的精彩内容。 主讲嘉宾: Kris Singh: CEO at SRII, Palo Alto, California Visiting Professor of Tsinghua University Yingbo Liu, Associate Research Fellow of School of Software, Tsin
数据派THU
2023-03-29
3110
“科创中国”开源产业科技服务团荣获2022年度中国科协优秀科技服务团
2月20日,中国科协召开2023“科创中国”年度会议。会议深入贯彻党的二十大精神和中央经济工作会议精神,以“创新提振发展信心 科技激发产业活力”为主题,总结2022年“科创中国”建设成效,对全面完成“科创中国”三年行动计划进行再动员再部署再落实。 由中国通信学会、清华软件学院和大数据系统软件国家工程研究中心申报组建的“科创中国”开源产业科技服务团获得2022年优秀科技服务团。 中国通信学会副理事长兼秘书长张延川应邀参会,欧阳武副秘书长(正局级)参加2022年度优秀科技服务团授牌仪式。 中国通信学会副理事长
数据派THU
2023-02-28
4300
直播预告 | 百度技术沙龙——百度大数据系统探索研究及应用实践
8月25日,数据派THU联合百度技术沙龙将为大家带来“百度大数据系统探索研究及应用实践“的专题分享。 百度多年来积累了非常丰富的大数据系统研究开发、应用实践的经验:为Apache 基金会贡献的Doris数据库项目,以极速易用的特点被人们所熟知;基于流式计算的系统,正在支撑着百度智能云的关键业务;时空大数据技术帮助决策者洞察和理解城市。学术界,来自清华大学的吴及教授,也将为大家带来医疗大数据方面的探索与研究。 敬请关注和期待。 直播时间:2022/08/25 14:00-17:00 欢迎扫码预约直播 特邀
数据派THU
2022-08-29
4880
5分钟NLP:Python文本生成的Beam Search解码
来源:Deephub Imba本文约800字,建议阅读5分钟本文介绍了Python文本生成的Beam Search的解码。 贪婪搜索是在每个时间步中选择概率最高的单词,也是我们最常用的一种方法,Beam Search不取每个标记本身的绝对概率,而是考虑每个标记的所有可能扩展。然后根据其对数概率选择最合适的标记序列。 例如令牌的概率如下所示: 例如,Pancakes + looks时间段1的概率等效于: Pancakes looks so = log(0.2) + log(0.7)= -1.9Pancak
数据派THU
2022-08-29
1860
李飞飞团队提出零样本泛化的技术,性能超越SOTA!
来源:迈微AI研习社本文约2700字,建议阅读15分钟本文介绍了李飞飞团队的最新研究发现。 没错!又是李飞飞! 走在队伍前面的,是来自斯坦福大学的博士,李飞飞的门生! 先来看看李飞飞团队这次在arXiv上发表了的论文题目: SECANT:用于视觉策略零样本泛化的自专家克隆 废话少说,给大家介绍一下这篇论文的大致内容。 论文介绍 简要介绍 强化学习中的泛化(generalization),是指通过不断跟环境交互,产生出一种网络的记忆性。 这个网络能够根据环境中特定的信号完成相应的动作,经过训练的agent能
数据派THU
2022-06-07
2780
比拼 Kafka , 大数据分析新秀 Pulsar 到底好在哪
来源:大数据与机器学习文摘本文约4000字,建议阅读10+分钟本文介绍了大数据分析Pulsar的好用之处。  本文内容节选自InfoQ: https://www.infoq.cn/article/1UaxFKWUhUKTY1t_5gPq 在用户选择一个消息系统时,消息模型是用户首先考虑的事情。消息模型应涵盖以下 3 个方面: 消息消费——如何发送和消费消息; 消息确认(ack)——如何确认消息; 消息保存——消息保留多长时间,触发消息删除的原因以及怎样删除; 消息消费模型 在实时流式架构中,消息传递可以分为
数据派THU
2022-03-04
5810
中国高校首个Apache开源项目 清华数为物联网时序数据库IoTDB 及可自由组装的大数据软件栈系列组件发布
4月25日,清华软件学院师生校友相约云端,共贺清华大学109周年校庆,软件学院建院19周年。
数据派THU
2020-05-07
1.5K0
独家 | 2019 ICCV 收录论文:基于弱监督学习的病理影像分析框架
恶性肿瘤是全球第二大死因,每年导致近千万人死亡。病理报告是肿瘤临床诊断和治疗的“金标准”,是癌症确诊和治疗的基本依据。为了缓解世界范围内病理医生短缺的现状,人工智能病理诊断成为当今学术研究和工程落地的热点。数字病理切片的体积通常都在500MB至2GB,像素数超过百亿,有监督的病理诊断模型需要进行繁琐的像素级切片标注,对这一领域的快速发展带来了挑战。
数据派THU
2019-10-24
1.6K0
独家 | 一文读懂Apache Flink技术
本文来自9月1日在成都举行的Apache Flink China Meetup,分享来自于云邪。
数据派THU
2018-12-04
9080
独家 | 一文读懂Apache Kudu
前言 Apache Kudu是由Cloudera开源的存储引擎,可以同时提供低延迟的随机读写和高效的数据分析能力。Kudu支持水平扩展,使用Raft协议进行一致性保证,并且与Cloudera Impala和Apache Spark等当前流行的大数据查询和分析工具结 合紧密。本文将为您介绍Kudu的一些基本概念和架构以及在企业中的应用,使您对Kudu有一个较为全面的了解。 一、为什么需要Kudu Kudu这个名字听起来可能有些奇怪,实际上,Kudu是一种非洲的大羚羊,中文名叫“捻角羚”,就是下图这个样
数据派THU
2018-01-30
2.8K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档