首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1934739
阅读量
188
订阅数
GPT-3 vs Bert vs GloVe vs Word2vec 文本嵌入技术的性能对比测试
来源:DeepHub IMBA本文约3000字,建议阅读6分钟随着NLP(自然语言处理)的最新进展,OpenAI的GPT-3已经成为市场上最强大的语言模型之一。 2022年1月25日,OpenAI公布了一个embedding endpoint(Neelakantan et al., 2022)。该神经网络模型将文本和代码转换为向量表示,将它们嵌入到高维空间中。这些模型可以捕获文本的语义相似性,并且在某些用例中似乎实现了最先进的性能。 由于chatgpt的大火,GPT-3又进入到了人们的视野中,本文将通过使
数据派THU
2023-02-23
1.2K0
2023年,无代码、低代码8大技术趋势
来源:LowCode低代码时代本文约1800字,建议阅读8分钟本文结合全球多家权威调查机构数据和知名厂商调研,对技术、市场、场景化落地等进行了解读。 在数字化转型、新冠疫情、全球经济环境动荡等多因素驱动下,使得组织改变了对低代码、无代码的看法,市场规模和场景化落地实现快速增长。根据Gartner预测,到2025年,70%的应用程序将由低代码和无代码开发平台构建,其中 80%的应用程序由非IT工作者开发而成。 没有编程背景的业务人员通过低代码、无代码可视化拖拽开发平台,也能创建安全、稳定、扩展性强的应用程序,
数据派THU
2023-02-23
4680
干货 | 何延哲:App个人信息安全治理的规则、案例与思考
谈到个人信息安全的话题,尤其是App个人信息收集处理,占比高达百分之八九十,所以我们把App个人信息安全治理作为个人信息保护实践重要的方向来探讨。App个人信息安全治理在我们国家个人信息保护的监管上是最受关注且力度最大的一个方面。
数据派THU
2022-12-16
4480
原创 | 谷歌JAX 助力科学计算
作者:王可汗 审校:陈之炎 本文约3500字,建议阅读9分钟 本文为你介绍使用谷歌JAX助力科学计算。 谷歌最新推出的JAX,官方定义为CPU、GPU和TPU上的NumPy。它具有出色的自动微分(differentiation)功能,是可用于高性能机器学习研究的python库。Numpy在科学计算领域十分普及,但是在深度学习领域,由于它不支持自动微分和GPU加速,所以更多的是使用Tensorflow或Pytorch这样的深度学习框架。然而谷歌之前推出的Tensorflow API有一些比较混乱的情况,在1.
数据派THU
2022-09-19
1.1K0
图形学人物简史:两位图灵奖与奥斯卡得主的图形学研究往事
来源:AI科技评论本文约12000字,建议阅读15+分钟很难预测最终我们会走到何处,但我们还需要继续努力。 近日,计算机图形学国际顶级会议 SIGGRAPH 在加拿大温哥华举办。2019 年图灵奖和多次奥斯卡奖「双料得主」Pat Hanrahan 和 Ed Catmull 在大会上亮相,作了一场题为“Shading Languages and the Emergence of Programmable Graphics Systems”(着色语言与可编程图形系统的出现)的报告。 Pat Hanrahan,
数据派THU
2022-09-14
2720
语言模型如何产品落地?《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操
来源:专知本文为书籍推荐,建议阅读5分钟这本书是为那些想要了解GPT-3的范围和性质的人准备的。 GPT-3:带大型语言模型的NLP是一种独特的、实用的生成式预训练Transformer 3,这是OpenAI在2020年推出的著名的AI语言模型。这个模型能够处理各种各样的任务,比如对话、文本完成,甚至编码,性能非常好。自发布以来,API已经为数量惊人的应用程序提供了动力,这些应用程序现在已经成长为成熟的初创公司,产生了商业价值。这本书将深入探讨GPT-3是什么,为什么它很重要,它能做什么,已经用它做了什
数据派THU
2022-08-29
4300
比拼 Kafka , 大数据分析新秀 Pulsar 到底好在哪
来源:大数据与机器学习文摘本文约4000字,建议阅读10+分钟本文介绍了大数据分析Pulsar的好用之处。  本文内容节选自InfoQ: https://www.infoq.cn/article/1UaxFKWUhUKTY1t_5gPq 在用户选择一个消息系统时,消息模型是用户首先考虑的事情。消息模型应涵盖以下 3 个方面: 消息消费——如何发送和消费消息; 消息确认(ack)——如何确认消息; 消息保存——消息保留多长时间,触发消息删除的原因以及怎样删除; 消息消费模型 在实时流式架构中,消息传递可以分为
数据派THU
2022-03-04
5810
可信工业数据空间系统架构1.0白皮书
来源:专知本文约1300字,建议阅读5分钟工业数据的流通共享受到广泛关注。 随着新一代信息技术与制造业的深度融合发展,全球工业数据应用已经进入纵深发展的新阶段,数据作为新型生产要素和重要战略资源,正在制造业数字化转型过程中发挥出更大的作用。在这一进程中,工业数据的流通共享受到广泛关注。顺应新发展形势我国积极营造多方主体参与的数据共享流通生态,国务院先后发布《关于构建更加完善的要素市场化配置体制机制的意见》《要素市场化配置综合改革试点总体方案》,明确提出在确保数据安全的前提下,分级分类、分步有序推动部分领域数
数据派THU
2022-03-04
6830
Github上的10个数据科学和机器学习知识库
来源:DeepHub IMBA 本文共1200字,建议阅读5分钟在本文中将介绍一些对数据科学和机器学习爱好者最有用的 Github 代码库。(排名顺序不分先后) 1、The Algorithm 数据结构是计算机科学中最流行的词,可能紧随其后的是数据科学。但是每个计算机科学专业的学生都必须了解数据结构,如果你打算在该领域从事长期职业,那么它是最重要的学习之一。无论您是 ML 工程师、Web 开发人员、移动开发人员还是本科生,这都是应该在书签收藏中拥有的一个repo。他们还有一个网站,用于查看和运行 10
数据派THU
2022-03-04
2800
独家 | 如何跳出编程这个坑
作者:Justin McClain 翻译:陈之炎校对:王可汗 本文约1000字,建议阅读5分钟本文介绍了程序员职业发展中常见的“坑”。
数据派THU
2021-10-19
3200
独家 | 提升API设计技能的22个最佳实践(附链接)
作者:Mohammad Faisal翻译:张一然校对:和中华 本文约2000字,建议阅读7分钟本文介绍了有关设计REST api的一些实用建议。
数据派THU
2021-07-16
5210
修改代码150万行!Apache Flink 1.9.0做了这些重大修改!(附链接)
[ 导读 ] 8月22日,Apache Flink 1.9.0 正式发布。早在今年1月,阿里便宣布将内部过去几年打磨的大数据处理引擎Blink进行开源并向 Apache Flink 贡献代码。此次版本在结构上有重大变更,修改代码达150万行,接下来,我们一起梳理 Flink 1.9.0 中非常值得关注的重要功能与特性。
数据派THU
2019-08-28
7910
GitHub火热!程序员小哥不得不知的所有定律法则(附项目链接)
当谈到开发问题时,人们总会谈论各种定律。但对于大多数人来说,总有一些是你不了解的,这个问题就需要使用程序员最喜欢的方法解决了:最近 GitHub 上的一个“定律合集”项目突然登上了趋势榜第二位,Star 数上千,该项目对一些最常见的定律进行了概括,详情见下文。
数据派THU
2019-05-21
4400
独家 | 手把手教你创建聊天机器人来协助网络运营(附代码)
在本教程中,我们将了解如何利用聊天机器人来协助网络运营。随着我们向智能化运营迈进,另一个需要关注的领域是移动性。用一个脚本来进行配置,修复甚至故障检修是很好的,但它仍然需要有人在场来监督,启动甚至执行这些程序或脚本。
数据派THU
2019-05-09
1.9K0
独家|盘点5个TensorFlow和机器学习课程,程序员福利(附资源)
本文为你介绍5个有关TensorFlow的机器学习课程,来帮助你进一步了解数据科学和人工智能。
数据派THU
2018-10-25
6980
基于问题导向与成果产出的教学模式:《大数据与城市规划》特色课程
[ 编者按 ]2015年12月,清华大学推出“大数据能力提升项目”,旨在促进大数据人才培养,服务国家大数据发展战略。项目由清华-青岛数据科学研究院(以下简称:数据院)和研究生院共同设计组织实施,为了构建大数据思维与技能、跨界学习、应用实操相结合的人才培养体系,培养具有数据思维和应用创新能力“π”型人才。项目推出以来,开设了一系列大数据特色课程,我们将为大家逐一介绍这些课程。
数据派THU
2018-09-17
5970
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档