腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据派THU

专栏作者

2138

文章

1931703

阅读量

188

订阅数

干货 | 数字经济创新创业——DWF和Apache IOTDB研究项目介绍

apache 大数据创业模型数据

下文整理自清华大学大数据能力提升项目能力提升模块课程“Innovation & Entrepreneurship for Digital Economy”（数字经济创新创业课程)的精彩内容。主讲嘉宾： Kris Singh: CEO at SRII, Palo Alto, California Visiting Professor of Tsinghua University Yingbo Liu, Associate Research Fellow of School of Software, Tsin

2023-03-29

3110

“科创中国”开源产业科技服务团荣获2022年度中国科协优秀科技服务团

开源物联网 apache 企业工业物联

2月20日，中国科协召开2023“科创中国”年度会议。会议深入贯彻党的二十大精神和中央经济工作会议精神，以“创新提振发展信心科技激发产业活力”为主题，总结2022年“科创中国”建设成效，对全面完成“科创中国”三年行动计划进行再动员再部署再落实。由中国通信学会、清华软件学院和大数据系统软件国家工程研究中心申报组建的“科创中国”开源产业科技服务团获得2022年优秀科技服务团。中国通信学会副理事长兼秘书长张延川应邀参会，欧阳武副秘书长（正局级）参加2022年度优秀科技服务团授牌仪式。中国通信学会副理事长

2023-02-28

4300

直播预告 | 百度技术沙龙——百度大数据系统探索研究及应用实践

大数据 apache 机器学习神经网络深度学习

8月25日，数据派THU联合百度技术沙龙将为大家带来“百度大数据系统探索研究及应用实践“的专题分享。百度多年来积累了非常丰富的大数据系统研究开发、应用实践的经验：为Apache 基金会贡献的Doris数据库项目，以极速易用的特点被人们所熟知；基于流式计算的系统，正在支撑着百度智能云的关键业务；时空大数据技术帮助决策者洞察和理解城市。学术界，来自清华大学的吴及教授，也将为大家带来医疗大数据方面的探索与研究。敬请关注和期待。直播时间：2022/08/25 14:00-17:00 欢迎扫码预约直播特邀

2022-08-29

4880

5分钟NLP：Python文本生成的Beam Search解码

来源：Deephub Imba本文约800字，建议阅读5分钟本文介绍了Python文本生成的Beam Search的解码。贪婪搜索是在每个时间步中选择概率最高的单词，也是我们最常用的一种方法，Beam Search不取每个标记本身的绝对概率，而是考虑每个标记的所有可能扩展。然后根据其对数概率选择最合适的标记序列。例如令牌的概率如下所示：例如，Pancakes + looks时间段1的概率等效于： Pancakes looks so = log（0.2） + log（0.7）= -1.9Pancak

2022-08-29

1860

李飞飞团队提出零样本泛化的技术，性能超越SOTA！

数据分析 apache 腾讯云测试服务机器人强化学习

来源：迈微AI研习社本文约2700字，建议阅读15分钟本文介绍了李飞飞团队的最新研究发现。没错！又是李飞飞！走在队伍前面的，是来自斯坦福大学的博士，李飞飞的门生！先来看看李飞飞团队这次在arXiv上发表了的论文题目： SECANT：用于视觉策略零样本泛化的自专家克隆废话少说，给大家介绍一下这篇论文的大致内容。论文介绍简要介绍强化学习中的泛化（generalization），是指通过不断跟环境交互，产生出一种网络的记忆性。这个网络能够根据环境中特定的信号完成相应的动作，经过训练的agent能

2022-06-07

2780

比拼 Kafka , 大数据分析新秀 Pulsar 到底好在哪

kafka apache api 消息队列 CMQ 版

来源：大数据与机器学习文摘本文约4000字，建议阅读10+分钟本文介绍了大数据分析Pulsar的好用之处。本文内容节选自InfoQ： https://www.infoq.cn/article/1UaxFKWUhUKTY1t_5gPq 在用户选择一个消息系统时，消息模型是用户首先考虑的事情。消息模型应涵盖以下 3 个方面：消息消费——如何发送和消费消息；消息确认（ack）——如何确认消息；消息保存——消息保留多长时间，触发消息删除的原因以及怎样删除；消息消费模型在实时流式架构中，消息传递可以分为

2022-03-04

5810

中国高校首个Apache开源项目清华数为物联网时序数据库IoTDB 及可自由组装的大数据软件栈系列组件发布

大数据开源物联网 http apache

4月25日，清华软件学院师生校友相约云端，共贺清华大学109周年校庆，软件学院建院19周年。

2020-05-07

1.5K0

独家 | 2019 ICCV 收录论文：基于弱监督学习的病理影像分析框架

监督学习编程算法 apache 访问管理数据分析

恶性肿瘤是全球第二大死因，每年导致近千万人死亡。病理报告是肿瘤临床诊断和治疗的“金标准”，是癌症确诊和治疗的基本依据。为了缓解世界范围内病理医生短缺的现状，人工智能病理诊断成为当今学术研究和工程落地的热点。数字病理切片的体积通常都在500MB至2GB，像素数超过百亿，有监督的病理诊断模型需要进行繁琐的像素级切片标注，对这一领域的快速发展带来了挑战。

2019-10-24

1.6K0

独家 | 一文读懂Apache Flink技术

apache 大数据分布式网站

本文来自9月1日在成都举行的Apache Flink China Meetup，分享来自于云邪。

2018-12-04

9080

独家 | 一文读懂Apache Kudu

前言 Apache Kudu是由Cloudera开源的存储引擎，可以同时提供低延迟的随机读写和高效的数据分析能力。Kudu支持水平扩展，使用Raft协议进行一致性保证，并且与Cloudera Impala和Apache Spark等当前流行的大数据查询和分析工具结合紧密。本文将为您介绍Kudu的一些基本概念和架构以及在企业中的应用，使您对Kudu有一个较为全面的了解。一、为什么需要Kudu Kudu这个名字听起来可能有些奇怪，实际上，Kudu是一种非洲的大羚羊，中文名叫“捻角羚”，就是下图这个样

2018-01-30

2.8K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态