暂无搜索历史
近期,围绕 AI 有声读物和 AI 播客的产品不断涌现,值得注意的是,其生成的语音效果均强调较高的自然度与接近真人的表现力,这一现象的背后,是语音合成(TTS)...
AGI-Eval 社区重磅发布 8 月全球大模型评测榜单!其中 GPT-5-Thinking 以绝对优势登顶,其综合性能全面领先。纵观整个榜单,OpenAI 家...
近期,以 OpenAI o系列模型、Claude 3.5 Sonnet 和 DeepSeek-R1 等各类大模型为代表的AI技术快速发展,其知识与推理能力得到了...
当前,基于大语言模型的 Agent 系统正迎来前所未有的发展热潮。全球科技公司纷纷推出自己的 Agent 产品,试图打造能够自主完成复杂任务的 AI 助手。这一...
想象一下,你给 AI 播放一段医生做手术的视频,然后问它:“如果此时电刀功率调高 20% 会发生什么?”
当下,文生图 AI 正处于"能用"与"好用"的过渡地带。指令遵循能力与画质表现,将是其向工业化应用迈进过程中的两大核心命题。然而,一个更为关键的问题正逐渐浮出水...
近两年,大语言模型的编程能力发展飞快,例如 DeepMind 的 AlphaCode 曾宣称达到人类竞技编程选手的水平;OpenAI 的顶尖模型屡屡被报道能通过...
当前,大语言模型(LLMs)在编程领域的能力受到广泛关注,相关论断在市场中普遍存在,例如 DeepMind 的 AlphaCode 曾宣称达到人类竞技编程选手的...
近两年,AI 模型的文生图能力发展迅猛,早已从实验室走向大众,成为设计师的 “灵感加速器”、普通用户的 “作图神器”。当 “ AI 画图” 从 “新鲜玩意儿” ...
一张静态的老照片竟能“活”过来!梵高笔下的星空也开始流转!手机里孩子三岁时的照片,也能眨着眼睛爬向镜头!这些场景因多模态图生视频技术的发展,正在一步步变成现实。...
在当前大语言模型(LLMs)的评估领域,一个引人深思的“榜单逆序”现象正在显现。例如,AGI-Eval 与同济大学合作构建的 Arena 显示,国内开源模型零一...
去年 5 月,OpenAI 发布全模态 AI 模型 GPT-4o,凭借实时处理文本、图像、音频输入的强大功能,以及像电影《Her》中一样媲美人类对话的响应速度、...
近期,DeepSeek 发布其旗舰推理模型 R1 的最新迭代版本——DeepSeek-R1-0528。尽管官方将此次更新界定为“小幅试验性升级”,但该版本已在全...
今年3月,号称全球第一款通用 Agent 产品的 Manus 爆火出圈,当时整个互联网圈子一"码"难求的场面让人印象深刻,在其演示视频中 ,Agent一步步逐级...
近日,Claude 4 系列模型正式推出, Anthropic 宣称,Claude Opus 4 是全球最佳编码模型,在复杂、长期运行的任务和代理工作流中表现持...
数学推理能力作为衡量模型智能水平的关键指标,需对其进行全面公平的评估。然而,现有的 GSM8K、MATH 数学基准因覆盖不足和易被数据污染饱受诟病,要么缺乏对本...
di腾讯几天前发布混元图像 2.0 模型,创新性地实现了“边说话边出图”、“边打字边出图”的功能,为我们带来了前所未有的交互新体验,那么它的实际能力表现又如何了...
2024年7月,OpenAI 公司提出了通用人工智能(AGI)的五层框架理论,将 AGI 的发展分为5个阶段:聊天机器人(Chatbots)、推理者(Reaso...
① o3 毫无悬念的登顶,在交互能力、推理能力、指令遵循和初等数学四个方面全面领先;
北京时间4月17日凌晨一点,OpenAI 开启了20分钟线上直播,上线了满血版 o3,还有下一代推理模型 o4-mini,官方称是 OpenAI 迄今为止最智能...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市