首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Agentic AI 每日精选 · 2026-01-17|ChatGPT上线广告,谷歌开源translategemma模型,百度开源LoonFlow通用专家级Agent框架

Agentic AI 每日精选 · 2026-01-17|ChatGPT上线广告,谷歌开源translategemma模型,百度开源LoonFlow通用专家级Agent框架

作者头像
AgenticAI
发布2026-01-22 13:35:51
发布2026-01-22 13:35:51
990
举报
文章被收录于专栏:AgenticAIAgenticAI

Daily · Paramind AI

每日5分钟速览AI,甄选 GitHub 趋势、HuggingFace模型动向、行业观察、社区热文与精选论文。

今日速览

OpenAI ChatGPT 将上线广告,谷歌发布translategemma开源模型,百度Baige团队革新OpenEvolve进化代理LoongFlow,Zilliz发布双语语义高亮模型,RAG系统Token成本大减

01 / GITHUB TRENDING

google/langextract:LLM精准提取,可视化定位

LangExtract是一个Python库,利用LLM从非结构化文本中提取结构化信息,支持精确的源定位和交互式可视化。它旨在为研究者、应用开发者提供高效的数据提取工具,通过优化长文档处理和灵活的LLM支持,解决数据提取中的难题。

eigent-ai/eigent:多智能体协作,智能工作流自动化

Eigent是一个开源的协作桌面应用程序,旨在通过多智能体工作力和本地部署,为用户提供高效的生产力工具。它填补了LLM生态中自动化复杂工作流程的空白,为开发者、企业和普通用户提供了一个强大的平台,以实现工作流程的自动化和智能化。

02 / TRENDING MODELS

black-forest-labs/FLUX.2-klein-9B

FLUX.2-klein-9B是black-forest-labs开发的一款多模态模型,定位为通用大模型。该模型采用Transformer架构,具有9B参数,支持图像到图像的转换。在性能上,该模型在Hugging Face...

black-forest-labs/FLUX.2-klein-4B

FLUX.2-klein-4B是black-forest-labs推出的快速图像生成模型,定位为多模态模型。该模型具有4亿参数,支持文本到图像和图像编辑功能,特别适合交互式工作流程和实时图像生成。其核心技术包括Transformer架构和diffusers库,性能表现在同类模型中具有竞争力。该模型适用于需要快速图像生成的场景,如本地...

google/translategemma-27b-it

🔥google/translategemma-27b-it是一款专注于图像到文本翻译的热门模型,定位为多模态模型。其核心技术为Transformer变体,支持长达27B的上下文长度,采用safetensors和gemma3技术。在性能上,该模型在权威基准测试中表现优异,尤其在图像到文本翻译任务上具有显著优势。模型开源,兼容主流推理框...

google/translategemma-12b-it

🔥google/translategemma-12b-it是一款专注于图像到文本翻译的多模态模型,具有12B参数量,上下文长度可达200K。该模型采用Gemma3架构,结合了图像识别和文本翻译能力,在Hugging Face...

google/translategemma-4b-it

🔥google/translategemma-4b-it是一款专注于图像到文本翻译的热门模型,定位为多模态模型。其核心技术为Transformer变体,支持长达200K的上下文长度,参数量适中。在权威基准测试中表现优异,尤其在图像到文本翻译任务上具有显著优势。该模型开源,适用于需要高效图像到文本转换的场景,如内容审核、信息提取等。

03 / DAILY PAPERS

#01揭秘注意力机制中的斜杠模式:RoPE的作用

这篇论文通过实证和理论分析,揭示了大型语言模型(LLMs)中常见的斜杠注意力模式(Slash Pattern)的成因,并证明了这种模式在信息传递中的关键作用。研究通过分析LLMs的查询、键和旋转位置嵌入(RoPE),揭示了斜杠主导头(SDHs)的出现条件,并通过理论证明这些条件足以确保SDHs的出现。

#02RigMo:融合骨骼与动作学习,创新生成动画

这篇论文提出了一种名为RigMo的统一生成框架,该框架能够从原始网格序列中联合学习骨骼和运动,无需人工标注。RigMo将顶点变形编码为两个紧凑的潜在空间:一个用于解码为显式高斯骨骼和皮肤权重,另一个产生时间变化的SE(3)变换。实验表明,RigMo能够学习到平滑、可解释且物理上合理的骨骼,并在重建和类别级泛化方面优于现有的自动骨骼和变形基线。

#03PACEvolve:长周期感知一致进化赋能

这篇论文提出了PACEvolve,一个用于长周期进化的框架,旨在解决大型语言模型在进化搜索中的效率问题。它通过结合分层上下文管理、动量回溯和自适应采样策略来提高搜索的效率和效果,实现了在LLM-SR和KernelBench上的最先进结果。

#04临床文本转SQL中的患者相似度群体推理

这篇论文提出了一种名为CLINSQL的基准,用于评估临床文本到SQL的转换能力。CLINSQL要求模型在处理异构EHR表、时间窗口和患者相似性群体时进行推理,以生成可执行的查询。论文评估了多种模型在CLINSQL上的表现,并指出尽管有进展,但性能仍远未达到临床可靠性。

#05四维视频重建:动态点图技术

这篇论文提出了一种名为V-DPM的4D视频重建方法,通过动态点图(DPMs)来表示动态3D场景中的运动,从而扩展了3D重建技术。论文通过在VGGT上实现DPMs,展示了如何利用少量合成数据将静态场景的3D重建模型转换为动态场景的有效预测器,实现了动态场景的3D和4D重建,并在性能上达到了新的高度。

04 / COMMUNITY BLOG

LoongFlow:百度Baige团队革新OpenEvolve进化代理

LoongFlow,一款由百度百度的Baige团队开发的进化代理框架,被宣传为OpenEvolve的“思考性”进化。它通过引入PES(计划-执行-总结)范式,从随机变异转向结构化方法,旨在提高代码进化的效率和稳定性,特别适用于机器学习工程领域。

Hugging Face发布VLM-OCR GPU部署教程

Hugging Face博客发布了一篇关于如何在GPU基础设施上运行VLM-OCR的教程,介绍了如何使用DeepSeek-OCR进行高吞吐量文档处理,并提供了在Hugging Face Jobs、AWS SageMaker或Google Cloud Run上部署批处理推理作业的指南。

Zilliz发布双语语义高亮模型,RAG系统Token成本大减

Zilliz发布了一款名为'zilliz/semantic-highlight-bilingual-v1'的双语语义高亮模型,旨在减少RAG系统中查询的token成本,同时提高答案质量。该模型基于BGE-M3 Reranker v2架构,支持英语和中文,并采用LLM标注和推理过程来提高数据质量。

Hugging Face发布BERT Hash Embeddings,小体积大效能

Hugging Face发布了BERT Hash Embeddings模型系列,这些模型基于BERT Hash模型系列,生成固定维度的向量,用于语义文本相似度、语义搜索、释义挖掘、文本分类、聚类等。这些模型参数量小,性能优异,适用于边缘和低资源计算环境。

ParagEkbote优化SmolLM速度突破

Pruna社区成员Parag Ekbote通过使用Pruna库和PyTorch的torch.compile功能,对SmolLM模型进行了量化压缩和编译优化,显著提升了模型的速度和效率,同时保持了较高的准确度,使得模型在资源受限的硬件上也能高效运行。

05 / INDUSTRY WATCH

ChatGPT Go全球上线

OpenAI宣布ChatGPT Go全球发布,提供对GPT-5.2 Instant的更广泛访问,更高的使用限制和更长的内存,使高级AI在全球范围内更加经济实惠。

广告策略与ChatGPT普及拓展

OpenAI宣布将通过在美国测试ChatGPT免费和Go级别的广告来扩大全球范围内对AI的平价访问,同时保护隐私、信任和答案质量。

06 / SCIENTIFIC RESEARCH

#01长时域LLM智能体连续内存架构

这篇论文提出了一个名为Continuum Memory Architecture(CMA)的内存架构,旨在解决现有检索增强生成(RAG)在长期语言模型(LLM)代理中处理记忆时的局限性,如信息持久性、读取只读和缺乏时间连续性。CMA通过持久存储、选择性保留、关联路由、时间链和高级抽象的整合来维护和更新内部状态,从而在长期任务中展现出优于RAG的行为优势。

#02基于世界模型的离策略Bootstrap方法

这篇论文提出了BOOM(Bootstrap Off-policy with World Model)框架,通过结合规划与离策略学习,解决强化学习中数据收集与策略行为之间的偏差问题。BOOM使用联合学习的世界模型来模拟未来轨迹,并通过非参数动作分布和无参数对齐损失来优化策略。

#03深度学习数学理论

这篇论文深入探讨了深度学习的数学理论,涵盖了逼近理论、优化理论和统计学习理论,旨在为学生和研究人员提供深度学习数学基础,强调简洁性并呈现严谨且易于理解的结果。

#04AI推理语言模型在ALD工艺优化任务中表现卓越

这篇论文研究了基于推理语言模型的AI代理在原子层沉积(ALD)过程优化任务中的性能和行为。论文提出了一种代理,该代理能够在没有关于ALD过程先验知识的情况下,通过迭代与ALD反应器交互,以无监督的方式找到ALD前驱体和核心反应物的最佳剂量时间。实验结果表明,基于推理模型的代理能够成功完成优化任务,但存在显著的运行间可变性。代理通过两步过程来理解推理模型的逻辑,首先生成一个详细的推理过程的开放...

#05SageAttention3:微尺度FP4注意力推理与8位训练探索

这篇论文提出了SageAttention3,一种基于FP4 Tensor Cores的微缩FP4注意力机制,用于加速模型推理,并首次探索了低比特注意力在训练中的应用。通过8比特注意力机制,论文实现了在微缩精度下对模型进行前向和反向传播,从而在推理任务中实现了无损失性能,同时在预训练任务中表现出较慢的收敛速度。

PARAMIND AI · INTELLIGENCE

覆盖 GitHub、Hugging Face 与行业研报核心信息 · 今日更新 保持好奇,持续进化

注:以上各榜单仅展示Top5,若需完整的榜单请点击原文查看。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • google/langextract:LLM精准提取,可视化定位
  • eigent-ai/eigent:多智能体协作,智能工作流自动化
    • #01揭秘注意力机制中的斜杠模式:RoPE的作用
    • #02RigMo:融合骨骼与动作学习,创新生成动画
    • #03PACEvolve:长周期感知一致进化赋能
    • #04临床文本转SQL中的患者相似度群体推理
    • #05四维视频重建:动态点图技术
  • LoongFlow:百度Baige团队革新OpenEvolve进化代理
  • Hugging Face发布VLM-OCR GPU部署教程
  • Zilliz发布双语语义高亮模型,RAG系统Token成本大减
  • Hugging Face发布BERT Hash Embeddings,小体积大效能
  • ParagEkbote优化SmolLM速度突破
    • ChatGPT Go全球上线
    • 广告策略与ChatGPT普及拓展
    • #01长时域LLM智能体连续内存架构
    • #02基于世界模型的离策略Bootstrap方法
    • #03深度学习数学理论
    • #04AI推理语言模型在ALD工艺优化任务中表现卓越
    • #05SageAttention3:微尺度FP4注意力推理与8位训练探索
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档