首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2133
文章
1881891
阅读量
187
订阅数
独家 | GPT-3“知道”我什么?
作者:Melissa Heikkilä  翻译:顾伟嵩校对:欧阳锦 本文约5800字,建议阅读10+分钟本文详细介绍了大型语言网络的隐私安全问题。 大型语言模型是根据从互联网上收集的大量个人数据进行训练的。所以我想知道:它对我有什么影响? 对于一位报道AI的记者来说,今年最大的新闻之一是大型语言模型的兴起。这些人工智能模型生成了本是人类才能写出的文本,有时非常令人信服,他们欺骗了人们,让他们认为自己是有意识的。 这些模型的力量来自于从互联网上收集的大量公开的人造文本。这不禁让我思考:这些模型拥有关于我的什
数据派THU
2022-09-20
3290
50个最佳机器学习公共数据集(附链接)
来源:机器学习算法那些事本文约3000字,建议阅读6分钟本文整理一张50个醉驾机器学习公共数据集的榜单。 外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,为大家分享一下~ 提前说下须知: 一、寻找数据集的意义 根据CMU的说法,寻找一个好用的数据集需要注意一下几点: 数据集不混乱,否则要花费大量时间来清理数据。 数据集不应包含太多行或列,否则会难以使用。 数据越干净越好,清理大型数据集可能非常耗时。 应该预设一个有趣的问题,而这个问题又
数据派THU
2022-09-07
7080
LeCun领导下的Meta AI,押注自监督
来源:机器之心本文约1500字,建议阅读5分钟Meta 的 MAE 建立在一种名为 Transformer 的神经网络架构基础之上。 自监督学习真的是通往 AGI 的关键一步? Meta 的 AI 首席科学家 Yann LeCun 在谈到「此时此刻要采取的具体措施」时,也没有忘记远期的目标。他在一次采访时说:「我们想要构建像动物和人类一样学习的智能机器。」 近几年,Meta 发表了一系列关于 AI 系统自监督学习(SSL)的论文。LeCun 坚定地认为,SSL 是 AI 系统的必要前提,它可以帮助 AI 系
数据派THU
2022-07-25
1630
2022全球科技企业裁员形势图,大厂仍是赢家!
来源:新智元、极市平台本文约2600字,建议阅读5分钟本文为你分享2022全球科技企业裁员形势图。 有句话怎么说的来着,人生就像坐过山车。 生活由起起伏伏交织不停,缓慢前行。 这话拿来形容很多初创公司的发展真是再合适不过了。从一开始高到天上去的估值,雄伟的招聘计划,野心勃勃的扩张蓝图,到如今迫于现实压力,不得不放缓招聘,甚至还要大规模裁员的境地,可太像坐过山车了。 互联网的泡沫再次爆发了。而这一次,没有什么灵丹妙药能救我们于水深火热。各大公司只能在疫情的环境下被裹挟着后退。 公司的创始人和投资人都在为即将
数据派THU
2022-06-16
3020
Nature子刊 | NUS、字节首次将AI元学习引入脑成像领域
来源:量子位(公众号id:qbitai)本文约2600字,建议阅读9分钟脑成像技术是神经科学发展的一个重要领域,能够直接观察大脑在信息处理和应对刺激时的神经化学变化、从而对疾病的诊断和治疗提供重要参照。 近期,新加坡国立大学、字节跳动智能创作新加坡团队等机构合作的一项技术成果被全球顶级学术期刊Nature的子刊Nature Neuroscience收录。这项研究首次将人工智能领域的元学习方法引入到神经科学及医疗领域,能在有限的医疗数据上训练可靠的AI模型,提升基于脑成像的精准医疗效果。 研究背景 脑
数据派THU
2022-06-13
1640
Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」
来源:机器之心本文约4000字,建议阅读8分钟本文为你介绍一种叫做分层 JEPA(联合嵌入预测架构)的架构。 LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构。该架构可以通过堆叠的方式进行更抽象、更长期的预测。LeCun 和 Meta AI 希望分层 JEPA 可以通过观看视频和与环境交互来了解世界是如何运行的。 深度学习大规模应用之后,人们一直期待真正的通用人工智能出现,能够带来进一步的技术突破。 对此,
数据派THU
2022-04-01
4570
独家 | Meta的新学习算法可以教AI进行多任务处理
作者:Will Douglas Heaven翻译:顾伟嵩 校对:欧阳锦 本文约1200字,建议阅读5分钟教会神经网络多重技能的技术是通往多功能AI的一步。 如果你能通过视觉认出一只狗,那么当你用语言描述它时,你可能就能认出它。对于今天的人工智能来说,情况并非如此。深度神经网络已经非常擅长识别照片中的物体和用自然语言进行对话,但不是同时进行:有的AI模型擅长其中一种,但不是两者都擅长。部分问题在于,这些模型使用不同的技术学习不同的技能。这是开发可以执行多任务并适应环境的多功能AI机器的一个主要障碍。这也意味
数据派THU
2022-03-04
2010
独家 | 几个Jupyter笔记本的使用技巧
作者:Zolzaya Luvsandorj翻译:陈之炎校对:赵茹萱 本文约2400字,建议阅读5分钟本文为你介绍助力工作流文档化的几个实用技巧。
数据派THU
2021-12-31
1.4K0
独家 | 教你使用torchlayers 来构建PyTorch 模型(附链接)
本文介绍了torchlayers。torchlayers 旨在做Keras为TensorFlow所做的事情,它提供了更高级的模型构建的API和一些方便的默认值以及附加功能,这些功能对构建PyTorch神经网络很有用。
数据派THU
2020-05-08
6190
独家 | 秘籍:10个Python字符串处理技巧(附代码)
在探寻文本分析途径时却不知从何下手,该怎么办?那么可以通过这个字符串处理入门教程,来了解一下利用Python处理字符串的一些基本操作。
数据派THU
2020-03-04
7830
独家 | 脑洞大开!机器学习与AI突破(附链接)
本文介绍了近期在机器学习/人工智能领域一些非常有创意的突破,每一个都脑洞大开,不管是否是相关从业人员都值得一读。
数据派THU
2019-05-15
3490
独家 | 用于数据清理的顶级R包(附资源)
每天有数百万或数十亿的数据元素进入您的企业,其中不可避免的存在一些缺乏建立高效业务模型的必要质量的数据元素。然而,确保数据干净整洁应该始终是数据科学工作流程中首要也是最重要的部分。因为没有它,您将很难看到重要的内容,并可能由于数据重复,数据异常或缺少信息等原因做出错误的决策。
数据派THU
2019-05-14
1.3K0
独家 |如何创造性地应用深度学习视觉模型于非视觉任务(附代码)
众所周知,目前深度学习在计算机视觉领域已经有很好的应用落地,再加上迁移学习,可以很容易的训练出一个用于视觉任务的模型。但是现实中还有很多任务的原始数据是非视觉类型的,面对这样的问题,我们还可以借用强大的深度学习视觉模型吗,本文作者将用3个具体案例来展示这一切都是可能的。
数据派THU
2019-03-08
6900
独家 | Tableau中的Z-Order了解一下!
本文将通过三个简单的例子,讲解如何在Tableau中通过颜色图例、字母顺序和国家来控制Z-Order。
数据派THU
2018-12-18
2.4K0
独家 | 手把手教你用Python进行Web抓取(附代码)
作为一名数据科学家,我在工作中所做的第一件事就是网络数据采集。使用代码从网站收集数据,当时对我来说是一个完全陌生的概念,但它是最合理、最容易获取的数据来源之一。经过几次尝试,网络抓取已经成为我的第二天性,也是我几乎每天使用的技能之一。
数据派THU
2018-12-18
4.6K0
独家 | Tableau使用窍门:轻松学会设计仪表板
如果你参加过仪表板大全(Big Book of Dashboards)的专题会、发表会、或网络研讨会,那么你肯定已经听作者们(包括我自己)谈论到网格设计的重要性。这个功能我一直在期待,并且期待了很久,现在终于等到了。Tableau为仪表板布局增加了这个新的网格选项。在菜单中选择“仪表板”(“Dashboard”),然后再选择“显示网格”(“Show Grid”)。就是这么简单。
数据派THU
2018-12-04
2.2K0
ICLR2018 | 深度学习顶会见闻,干货资源都在这里(附源码、论文链接)
虽然仅仅举办过六届,ICLR已经是深度学习领域的顶级会议,得到了业界的广泛认可。第六届ICLR于2018.4.30~2018.5.03在温哥华会展中心召开,笔者署名的一篇文章有幸被workshop接收且受邀参会,下面聊一聊个人在ICLR2018上的见闻。
数据派THU
2018-07-30
4540
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档