首页
学习
活动
专区
工具
TVP
发布

AI科技大本营的专栏

专栏作者
3088
文章
3120979
阅读量
201
订阅数
炙手可热的 AI 大模型,这次你也用得上
论起当今AI领域最热的话题,大模型绝对榜上有名,如同拥有了更多神经元的大脑,AI大模型使得AI更加聪明的同时,也助力着更多创意想法实现落地应用。 由于需要相当大的投入,AI大模型似乎专属于巨头玩家,在普通人眼里,TA只是个遥远的专业名词。 但这个大模型,为“普通玩家”创造了全新体验️️️️⬇️⬇️⬇️ 百度ERNIE 3.0 从2019年起,百度就一直用海量的通识知识在培养ERNIE。今年,百度ERNIE升级到3.0,成为了知识增强的百亿参数大模型,一口气刷新54个中文NLP任务基准,还登顶了国际权威的复杂
AI科技大本营
2023-04-14
3780
万字长文解读:从Transformer到ChatGPT,通用人工智能曙光初现
ChatGPT掀起的NLP大语言模型热浪,不仅将各家科技巨头和独角兽们推向风口浪尖,在它背后的神经网络也被纷纷热议。但实际上,除了神经网络之外,知识图谱在AI的发展历程中也被寄予厚望。自然语言处理是如何伴随人工智能各个流派不断发展、沉淀,直至爆发的?本文作者将带来他的思考。 作者 | 王文广 出品 | 新程序员 自ChatGPT推出以来,不仅业内津津乐道并纷纷赞叹自然语言处理(Natural Language Processing, NLP)大模型的魔力,更有探讨通用人工智能(Artificial gene
AI科技大本营
2023-04-14
3910
MarioGPT自动生成“超级玛丽”;周鸿祎:ChatGPT可能产生意识;国内版ChatGPT复旦首发,但“非常不成熟”
本周,AI业界又有哪些新鲜事? ChatGPT 国内版ChatGPT首发被复旦“抢注”,但非常不成熟? 虽然各大厂如火如荼地备战国内版“GPT”,但谁也没抢到这个“首发”:2 月 20 日晚,复旦大学自然语言处理实验室发布了国内首个类 ChatGPT 模型 MOSS,并邀请公众参与内测(https://moss.fastnlp.top/#/)。 从 MOSS 项目主页来看,其定位是“一个类似 ChatGPT 的对话式语言模型”,能按照用户指示执行各种自然语言任务,包括回答问题、生成文本、总结文本和生
AI科技大本营
2023-02-27
2890
MarioGPT自动生成“超级玛丽”;周鸿祎:ChatGPT可能产生意识;国内版ChatGPT复旦首发,但“非常不成熟”
本周,AI业界又有哪些新鲜事? ChatGPT 国内版ChatGPT首发被复旦“抢注”,但非常不成熟? 虽然各大厂如火如荼地备战国内版“GPT”,但谁也没抢到这个“首发”:2 月 20 日晚,复旦大学自然语言处理实验室发布了国内首个类 ChatGPT 模型 MOSS,并邀请公众参与内测(https://moss.fastnlp.top/#/)。 从 MOSS 项目主页来看,其定位是“一个类似 ChatGPT 的对话式语言模型”,能按照用户指示执行各种自然语言任务,包括回答问题、生成文本、总结文本和生
AI科技大本营
2023-02-27
2890
如何高效训练 Transformer?微软亚研院开源TorchScale工具包
近期,微软亚洲研究院从深度学习基础理论出发,研发并推出了 TorchScale 开源工具包。TorchScale 工具包通过采用 DeepNet、Magneto 和 X-MoE 等最先进的建模技术,可以帮助研究和开发人员提高建模的通用性和整体性能,确保训练模型的稳定性及效率,并允许以不同的模型大小扩展 Transformer 网络。 如今,在包括语音、自然语言处理(NLP)、计算机视觉(CV)、多模态模型和 AI for Science 等领域的研究中,Transformer 已经成为一种通用网络结构,加速
AI科技大本营
2023-02-23
4300
如何高效训练 Transformer?微软亚研院开源TorchScale工具包
近期,微软亚洲研究院从深度学习基础理论出发,研发并推出了 TorchScale 开源工具包。TorchScale 工具包通过采用 DeepNet、Magneto 和 X-MoE 等最先进的建模技术,可以帮助研究和开发人员提高建模的通用性和整体性能,确保训练模型的稳定性及效率,并允许以不同的模型大小扩展 Transformer 网络。 如今,在包括语音、自然语言处理(NLP)、计算机视觉(CV)、多模态模型和 AI for Science 等领域的研究中,Transformer 已经成为一种通用网络结构,加速
AI科技大本营
2023-02-23
4300
新版Bing,翻车了?国内版ChatGPT首发战,打响;L5级仍是梦,特斯拉因自动驾驶市值蒸发2600亿
本周AI产业界又有哪些新鲜事? ChatGPT 引入ChatGPT的的新版Bing,翻车了? 在微软将引入ChatGPT的新版Bing发布之后,不到48小时便有超过100万人申请使用,全球下载量一夜之间暴增10倍。不得不说,微软此举确实达到了趁着ChatGPT热度高涨,拉动一直以来耿耿于怀的浏览器业务增长的目的。 但此举也有相当的风险,就像谷歌匆忙推出Bard,因为测试出现事实性错误导致市值暴跌一千多亿美元,Bing如果出现任何闪失,可能也会让ChatGPT积累起来的好口碑崩坏,反而得不偿失。 然而,
AI科技大本营
2023-02-23
3210
万字长文解释 ChatGPT 在做什么,以及为什么它能发挥作用?
ChatGPT 是由 OpenAI 开发的顶尖 AI 模型,旨在基于人们输入的内容生成类似的人类语言,凭借其强大的语言理解和文本生成能力,一经发布就引爆全球技术圈。Wolfram 语言之父 Stephen Wolfram 更是在博客发布万字长文(上百张配图)来解释 ChatGPT 强大功能的背后。 本文借助 DeepL 对原文进行了编译,感兴趣的小伙伴也可以移步到原文:https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and
AI科技大本营
2023-02-23
9410
获新轮10亿融资,“诗人小冰”又get哪些超强新技能?
五年前,人工智能诗人小冰首次出版了独立创作诗集《阳光失了玻璃窗》。通过对百年来519位中国现代诗人上千首诗歌的1万次迭代学习,小冰开始具备“创作”现代诗的能力。这在当时引发了网络、媒体和诗歌界的持续关注。
AI科技大本营
2022-12-10
4410
获新轮10亿融资,“诗人小冰”又get哪些超强新技能?
五年前,人工智能诗人小冰首次出版了独立创作诗集《阳光失了玻璃窗》。通过对百年来519位中国现代诗人上千首诗歌的1万次迭代学习,小冰开始具备“创作”现代诗的能力。这在当时引发了网络、媒体和诗歌界的持续关注。
AI科技大本营
2022-12-10
4410
微信自研NLP大规模语言模型WeLM:零/少样本即可完成多种NLP任务
近日,微信AI推出自研NLP大规模语言模型WeLM ,该模型是一个尺寸合理的中文模型,能够在零样本以及少样本的情境下完成包多语言任务在内的多种NLP任务。
AI科技大本营
2022-12-10
7790
微信自研NLP大规模语言模型WeLM:零/少样本即可完成多种NLP任务
近日,微信AI推出自研NLP大规模语言模型WeLM ,该模型是一个尺寸合理的中文模型,能够在零样本以及少样本的情境下完成包多语言任务在内的多种NLP任务。
AI科技大本营
2022-12-10
7790
卷到自己?继 Imagen 之后,推出200 亿文本生成的图像模型惊呆网友!
在 Google 研究院科学家和工程师一直在探索使用各种 AI 技术进行文本到图像的生成。经过大量测试,最近宣布了两种新的文本到图像模型 - Imagen 和 Parti。两者都能够生成逼真的图像,但使用不同的方法。
AI科技大本营
2022-12-09
2900
NLP 类问题建模方案探索实践
NLP全称Neuro Linguistic Programming,一般翻译为自然语言处理,是一门研究计算机处理人类语言的技术,简单的说就是帮助计算机理解人类语言。常见的NLP类问题包括命名实体识别、文本分类、机器翻译、信息检索、语音识别、问答系统等等,种类繁多,应用领域也很广泛,是近些年来非常火的研究领域。
AI科技大本营
2022-09-04
4360
让预训练语言模型读懂数字:超对称技术发布 10 亿参数 BigBang Transformer [乾元]金融大规模预训练语言模型
4.创新的预训练方法可大幅提高语言模型准确度:Similarity Sampling 和Source Prompt
AI科技大本营
2022-09-04
8620
2022,人工智能开启未来新密码
购买大型电器、汽车,你是否会询问有没有智能语音功能?是的,潜移默化中人们已经不再将人工智能当作魔术,而是习以为常的东西。从AlphaGo以四比一战胜棋王李世石,让人们第一次意识到人工智能真的可以超越人类,也让人们对AI的未来前景充满期待。
AI科技大本营
2022-04-05
5950
AIphaCode 并不能取代程序员,而是开发者的工具
DeepMind 是 AI 研究实验室,它引入了一种深度学习模型,可以生成具有显著效果的软件源代码。该模型名为 AIphaCode,是基于 Transformers,OpenAI 在其代码生成模型中使用的架构相同。
AI科技大本营
2022-04-05
2700
GPT-3 不够 Open,BigScience 构建开放语言模型,规模小 16 倍
大约一年前,总部位于纽约布鲁克林的自然语言处理初创公司 Hugging Face 推出了 BigScience。这是一个拥有 900 多名研究人员的国际项目,旨在更好地理解自然语言模型原理和提高大型语言模型的质量。大型语言模型(LLM)能够实现基于文本的数据集识别、预测和生成语言的算法,已经吸引了商业和技术爱好者的广泛关注。但是,它们背后没有像 OpenAI 和 DeepMind 这样的资源,开发 LLM 所需要的昂贵硬件成本仍然是研究人员的困难。
AI科技大本营
2022-02-10
8140
AI 语言模型真的是越大越好吗?这个模型优于 Gopher
DeepMind 正在质疑这个理由,并表示给 AI 一个记忆可以帮助与它 25倍大小的模型竞争。
AI科技大本营
2021-12-27
7410
深度学习发展下的“摩尔困境”,人工智能又将如何破局?| 文末送书福利
前不久,微软和英伟达推出包含5300亿参数的语言模型MT-NLG,这是一款基于 Transformer 的模型被誉为“世界上最大、最强的生成语言模型”。
AI科技大本营
2021-11-09
3230
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档