首页
学习
活动
专区
工具
TVP
发布

AI研习社

专栏成员
1755
文章
2198350
阅读量
197
订阅数
GPT-2没什么神奇的,PyTorch 就可以复现代码
我读过的最精彩、解释最清楚的文章之一是「The Annotated Transformer」https://nlp.seas.harvard.edu/2018/04/03/attention.html 。它引起了前所未有的关注,一个简单的想法就是用一个文件注释你所需要的代码。
AI研习社
2020-02-27
3.2K0
谷歌公布GSoC 2020 暑期代码项目名单,200个开源项目30个新增
谷歌(Google)本周宣布了进入GSoC 2020的200个开源项目。谷歌的GSoC(Google Summer of Code,暑期代码计划)已经走到第16年,该计划旨在让学生在暑假的几个月中参与开源开发。录取的学生将在活动中获得3000至6600美元之间的津贴。
AI研习社
2020-02-26
8360
手把手教你用 Transformers 和 Tokenizers 从头训练新语言模型
在过去的几周里,我们对 transformers 和 tokenizers 库进行了一些改进,目的是让从头开始训练新的语言模型变得更加容易。
AI研习社
2020-02-25
5.7K0
四步组建高效机器学习团队
在过去的几年里,机器学习得到了巨大的发展。但是,机器学习作为一门年轻的学科,其团队的管理方式却更加年轻。今天,许多机器学习经理被推到管理岗位是出于需求,或者是因为他们是最好的个人贡献者,而且其中许多人来自纯学术背景。在一些公司,工程或产品负责人被指派在没有任何机器学习实战经验的情况下构建新的机器学习功能。
AI研习社
2020-02-24
7580
专栏 | 【综述】Pytorch YOLO项目推荐 建议收藏学习
以下文章来源于GiantPandaCV ,作者BBuf本文来自 @BBuf 的社区专栏 GiantPandaCV
AI研习社
2020-02-24
1.3K0
谷歌开源文本生成新方法 LaserTagger,直击 seq2seq 效率低、推理慢、控制差三大缺陷!
因此,Google 提出了一种新型的文本生成模型 LaserTagger,该模型旨在解决 seq2seq 模型运行过程中的上述缺陷,可以预测将将源文本转换为目标文本的一系列生成操作。Google 发布了相关文章介绍了这一开源文本生成模型,我们将内容整理编译如下。
AI研习社
2020-02-24
9120
如何用 GPT2 和 BERT 建立一个可信的 reddit 自动回复机器人?
在讨论细节之前,我想对整个过程做一个概述。这个流程图显示了我需要训练的 3 个模型,以及将模型连接在一起以生成输出的过程。
AI研习社
2020-02-21
3.3K0
影史第一片《火车进站》秒变 4K 高清,AI 预测+插值,黑白也能变“彩电”
《火车进站》是人类历史上的第一部电影,由路易·卢米埃和奥古斯特·卢米埃于 1895 年拍摄于法国一沿海城市,整部电影只有45秒。
AI研习社
2020-02-21
1.4K0
人工检查,11 个类、97942 个标签,Roboflow 开源自动驾驶数据集可以使用啦
机器学习是通过举例来教计算机算法以执行新任务的过程,但是,ML 模型只能在和它们所训练的数据一样的情况下表现良好。
AI研习社
2020-02-21
1.5K0
图像识别之美食挑战赛 Ⅱ:由二分类到多分类,增加的不止是一点复杂度......
相较第一场美食识别挑战赛,这次推出的比赛 2.0 难度略有增加。除了食材种类的成倍增加之外,四种食材的图片辨识度也有所降低。这对于专注于图像识别的开发者而言,相信是非常值得尝试的一次挑战!
AI研习社
2020-02-21
4560
数据科学工具包:手把手用YOLO做目标检测
YOLO 是我最喜欢的计算机视觉算法之一,在很长一段时间里,我计划着专为它写一篇博文。然而,我不希望它成为另一篇详细解释 YOLO 背后工作原理的文章,网上有很多文章都很好地涵盖了它理论方面的知识。除此之外,如果你想加深对这个架构的理解,直接从源代码获取信息并阅读源文件(https://arxiv.org/abs/1506.02640)也是一个好主意。
AI研习社
2020-02-21
1.4K0
2020 年最具潜力 44 个顶级开源项目,涵盖 11 类 AI 学习框架、平台(值得收藏)
就在最近,一个基于 javascript 的可视化库 D3js(treemap 可视化)对 json 文件生成的技术图,给开发者提供了详细的各领域工具清单,内容涵盖了 11 种极具潜力的 AI 工具类型,我们将其整理如下,强烈建议大家收藏~
AI研习社
2020-02-21
1.3K0
Facebook开源最大规模并行语料,45亿语料,覆盖576种语言对,或成为NMT评估标准
当前自然语言处理中的大多数方法都是数据驱动的,大多数多语言模型(特别是神经机器翻译系统)都需要并行语料库进行训练。大多数的并行文本都只是适用于几个主要语言(例如英语、汉语),且限制于特定的领域。
AI研习社
2020-02-21
1.2K0
如何使 Python 程序快如闪电?这里有妙招
所以,让我们来证明那些人是错的——让我们看看如何提高 Python 程序的性能并使它们变得非常快!
AI研习社
2020-02-21
5730
2020 年,图机器学习的趋势有哪些
本文的目的不是介绍 GML 的基本概念,如图神经网络(GNNs),而是揭示我们可以在顶级科学会议上看到的前沿研究。首先,我将资料提交给 ICLR2020,这是一个在 GML 领域最负盛名的会议。在前面的文章(https://medium.com/@sergei.ivanov_24894/iclr-2020-graph-papers-9bc2e90e56b0 )中,我已经描述了关于这个域的一些简单的信息,但是这里有一个简短的版本:
AI研习社
2020-02-21
9090
用 NVIDIA DALI 加速PyTorch:训练速度提升 4 倍
本文展示了一些提高 DALI 资源使用率以及创建一个完全基于 CPU 的管道的技术。这些技术长期稳定内存使用率,将 CPU & GPU 管道的 batch 大小提高 50%。用特斯拉 V100 加速器显示 PyTorch+DALI 可以达到接近 4000 个图像/秒的处理速度,比原生 PyTorch 快了大约 4 倍。
AI研习社
2020-02-21
3K0
深度学习的光环背后,都有哪些机器学习的新进展被忽视了?
从神经网络被学术界排挤,到计算机科学界三句话不离人工智能、各种建模和预测任务被深度学习大包大揽,只不过短短十年时间。这十年里我们目睹了 dropout、SGD+动量、残差连接、预训练等等深度学习技术的大爆发,见证了学术研究全面拥抱深度学习,也听到了对深度学习不足之处的质疑之声、感受到了很多人对非深度学习方法「复兴」的期盼。
AI研习社
2020-02-21
6980
春节对联哪家强,人工智能对得狂!
春联传统源远流长,一幅写春联的需要极高的文学素养,不仅要求平仄齐整、意境对称,还要表达辟邪除灾、迎祥纳福的美好愿望。
AI研习社
2020-02-21
3.3K0
无需编写代码,利用GitHub搭建全免费个人博客
fast.ai 的联合创始人 Rachel Thomas 在她的文章《Why you (yes, you) should blog》中说过:
AI研习社
2020-02-21
9670
TinyBERT 搜索:比BERT快10倍,小20倍
最近,谷歌推出了一种新的方法来进行搜索并决定你看到的结果。这种方法基于流行的开源 transformer BERT,使用语言理解来获取搜索背后的含义,而传统的关键字方法无法做到这一点。
AI研习社
2020-02-21
5280
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档