暂无搜索历史
LLaMA-2 相较于 LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步激发了开源社区的繁荣,拓展了大型模型的应用想象空间。...
今年六月,来自加州大学伯克利分校等机构的一个研究团队开源了 vLLM(目前已有 6700 多个 star),其使用了一种新设计的注意力算法 PagedAtten...
近几年来,Text-to-Image 领域取得了巨大的进展,特别是在 AIGC(Artificial Intelligence Generated Conten...
地球科学是一门古老的学科,不仅研究岩石、矿物和土地的性质,还探讨地球的气候、海洋、大气、生态系统等多个方面现象和原理。地学与我们的日常生活息息相关,帮助我们预测...
沉寂了几个月的特斯拉人形机器人擎天柱(Optimus)终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时 Optimus 展示了自由行走、灵活抓取放...
数学推理是现代大型语言模型(LLM)的一项关键能力。尽管这一领域近来进展不错,但闭源和开源 LLM 之间仍然存在明显的差距——GPT-4、PaLM-2 和 Cl...
龙与地下城 (D&D)(Gygax 和 Arneson 于1974 年制作)是一款桌面角色扮演游戏 (TTRPG),还是一款多人协作类的故事游戏。一群玩家各自创...
众所周知,大模型的训练成本很高,但其实对预训练后的模型进行微调也需要一定的成本,还好我们已经有了 (IA)³ 或 LORA 等一些参数高效型微调(PEFT)方法...
大型语言模型(LLM),尤其是生成式预训练 Transformer(GPT)模型在许多复杂的语言任务上表现出了出色的性能。这一突破使人们希望在移动设备上本地运行...
给你一份包含成绩单的 Excel 文件,要求「成绩 <60 显示不及格,成绩在 60-80 间显示良好,成绩> 80 显示优秀」,你会怎么操作?通常来讲,这种问...
近几年,有一种编程语言无处不在,它的大名无人不晓,网络上甚至鼓吹过学会它就能成为编程高手。它就是 Python。
终于,OpenAI 的文生图 AI 工具 DALL-E 系列迎来了最新版本 DALL・E 3,而上个版本 DALL・E 2 还是在去年 4 月推出的。
Phone 15/Pro 系列发售在即,但一个有趣的现象是,在 iPhone 成为一种象征的同时——想想过去半年来你听过多少次「iPhone 时刻」—— iPh...
在开发机器人学习方法时,如果能整合大型多样化数据集,再组合使用强大的富有表现力的模型(如 Transformer),那么就有望开发出具备泛化能力且广泛适用的策略...
文本摘要,作为自然语言生成(NLG)中的一项任务,主要用来将一大段长文本压缩为简短的摘要,例如新闻文章、源代码和跨语言文本等多种内容都能用到。
近一年来,随着大模型突飞猛进的发展,基于大模型的推理泛化能力的语言智能体 (Language Agents) 展示了通向 AGI 的巨大潜力。科研和开发者社区也...
Transformer 架构已经在现代机器学习领域得到了广泛的应用。注意力是 transformer 的一大核心组件,其中包含了一个 softmax,作用是产生...
本月初,OpenAI 官宣了其首届开发者大会「OpenAI DevDay」将于两个月后召开,引发热议。很多网友猜测 OpenAI 将在大会上发布多模态大模型,比...
早在 2021 年,知名爆料者 kopite7kimi 就称英伟达将推出代号为「Blackwell」的 GPU 架构。
当前,大型语言模型 (LLM) 在处理 NLP 领域的各种下游任务方面已经表现出卓越的能力。特别是,GPT-4、ChatGPT 等开创性模型已经接受了大量文本数...
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市