暂无搜索历史
[超大视频推理套件](https://arxiv.org/abs/2602.20159)
[少即是多:在大语言模型的特征空间中合成多样化数据](https://arxiv.org/abs/2602.10388)
[OPUS:迈向大语言模型每次迭代预训练中高效且原则性的数据选择](https://arxiv.org/abs/2602.05400)
[ERNIE 5.0 技术报告](https://arxiv.org/abs/2602.04705)
[大语言模型能否处理混乱数据?面向应用的 LLM 数据准备技术综述](https://arxiv.org/abs/2601.17058)
如今大模型已经火热了两三年,发展得也越来越快,已经不仅仅停留在聊天机器人和文本生成工具上。虽然你输入问题,它给出答案。这种交互模式已经很有用了,但也仅此而已,现...
[面向大语言模型的智能体推理](https://arxiv.org/abs/2601.12538)
[观看、推理与搜索:面向智能体视频推理的开放网络视频深度研究基准](https://arxiv.org/abs/2601.06943)
最近又开发了一款新的app:Creative Util,这次是只针对 Mac 平台开发的,因为平时不管是工作还是生活中,会需要用到很多小工具,包括什么markd...
[GDPO: 面向多奖励RL优化的组奖励解耦归一化策略优化](https://arxiv.org/abs/2601.05242)
[mHC: 流形约束的超连接](https://arxiv.org/abs/2512.24880)
DataFlow: 面向以数据为中心 AI 时代的统一数据准备与工作流自动化 LLM 驱动框架
我们提出了 Kling-Omni,一个通用的生成式框架,旨在直接从多模态视觉语言输入合成高保真视频。基于端到端的设计理念,Kling-Omni 打破了多样化视频...
我们提出了 Wan-Move,一个简单且可扩展的框架,旨在为视频生成模型引入运动控制能力。现有的运动可控方法通常面临控制粒度粗糙和可扩展性有限的问题,使其输出难...
我把这计划发给了我使用了快三年的ChatGPT,我预想过它会谈论我的时间管理,或者建议我多运动。但我没预料到,这几段回复扎得太准了,生生撕开了我平时用来武装自己...
大语言模型 (LLM) 的优化仍面临关键挑战,尤其随着模型规模扩大,其对算法不精确性与训练不稳定性的敏感度日益加剧。近期优化器研究通过动量正交化提升了收敛效率,...
还记得 ChatGPT3.5 问世之前,各位还记得当时在学着哪些技能,用着什么样的方式去学习,以及工作中是如何去通过搜索引擎解决问题的呢。
大语言模型 (LLMs) 从根本上改变了自动化软件开发,实现了将自然语言描述直接转换为功能代码,并通过诸如 GitHub Copilot (Microsoft)...
本报告介绍了 Kandinsky 5.0,这是一个面向高分辨率图像和 10 秒视频合成的尖端基础模型系列。该框架包含三大核心模型:Kandinsky 5.0 I...
我们推出Lumine,这是首个用于开发通用AI智能体的开放方案,能够在挑战性3D开放世界环境中实时完成长达数小时的复杂任务。Lumine采用类人交互范式,以视觉...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市