首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI领域新动态:人才需求、技术进展与出口限制

优秀的AI产品经理需求量大

随着软件编写成本降低,人工智能使软件构建更快更便宜,这增加了对能决定构建内容的人员的需求,而产品经理在其中起着关键作用。

许多公司原本工程师与产品经理有一定比例(如 6:1,4:1 到 10:1 较为典型),编码效率提高后,团队可能需要更多产品管理工作。

并且 AI 产品管理有其独特的技能要求,包括技术熟练度、迭代开发能力、数据熟练度、管理模糊性的技能、持续学习能力以及确保 AI 负责任实施和快速收集反馈的能力等。

目前既懂产品开发又懂 AI 的人才短缺,所以对优秀 AI 产品经理的需求量会很大。

DeepSeek-V3 低训练成本实现出色的性能

低训练成本

• 含 6710 亿参数,随时有 370 亿参数处于活动状态。

• 训练仅用 279 万个 GPU 小时(计量单位;279万 个 GPU 运行 1 小时的计算资源),成本 560 万美元,远低于训练 Llama 3.1 405B 的时间与成本,且性能远超后者。

• 其训练数据约 15 万亿 token。

出色的性能

DeepSeek-V3 在测试中全面优于 Llama 3.1 405B 和 Qwen 2.5 72B,与 GPT-4o 相比也表现良好

• 其在编码和数学任务上表现突出,编码的七项基准测试中五项领先,但在 Polyglot 测试中输给 o1,不过仍击败了 Claude Sonnet 3.5。

• 在语言任务方面,与 Claude 3.5 Sonnet 表现相近,各任务得分有高有低。

美国将扩大人工智能出口限制

美国在新闻曝光后不久宣布人工智能出口限制措施(时间2025年1月13日),设有 120 天公众意见征询期,规则预计一年内生效。

新等级制度将各国分为三类,对使用美设计及用美技术制造的人工智能芯片与专有人工智能模型有不同限制:

第一级:澳大利亚、日本等国家和地区几乎不受限,但需将 75% 人工智能计算能力保留在盟国境内,向组外单个国家转移不超 10%。

第二级:以色列等传统盟友和贸易伙伴,2025 年第一季度初始上限 5.07 亿总处理能力,2027 年升至 10.2 亿,在当地运营的美企可申请更高限额。

第三级:中国、俄罗斯等约二十多国被禁获取先进人工智能芯片、模型权重及相关专业知识。

• 美商务部出口管制机构需批准特定封闭模型权重的出口或转让,美企须将至少 50% 人工智能计算能力留在美国,跟踪模型分布、实施安全措施并接受定期审计。

体积超小的AI超级计算机

Nvidia 的新款台式计算机专为运行大型 AI 模型而打造(Project Digits )。

Project Digits 是一款体积小巧、可一手握住的个人超级计算机,将于 5 月上市,起价 3000 美元,主要功能是帮助开发人员在本地微调和运行大型 AI 模型。

模型处理能力:在模型量化为 4 位精度的前提下,能运行多达 2000 亿个参数的模型,约为典型消费硬件可容纳模型大小的五倍,还可连接两个单元运行 Meta 的 Llama 3.1 405B 等模型。

系统架构:运行 Nvidia 的 DGX 操作系统,基于 GB10 片上系统,结合了 Nvidia Blackwell GPU 架构和 Grace CPU 架构,并通过高带宽 NVLink 互连连接。

硬件配置:配备 128GB 的统一内存和 4TB 的固态存储。

云连接功能:可连接到 Nvidia 的 DGX Cloud 服务,方便开发人员将模型从本地机器部署到云基础设施。

从非黑即白到灰度世界:X-CLR 如何用相似度分数改进对比学习

X-Sample 对比损失 (X-CLR):对比损失函数使得无需标记数据即可生成良好的嵌入成为可能。

对这个想法进行改进可以生成更有用的嵌入。

对比传统对比损失函数(如 SimCLR):如果把 SimCLR 和 X-CLR 比作两种‘交朋友’的方式:SimCLR 是更简单直接的,它只关注谁是朋友(比如同一只猫的两张照片),谁是陌生人(比如猫和卡车),而且完全不用人来标注谁是谁。

就像是给图片戴上不同的帽子,让模型自己认出戴同样帽子的是朋友。

相反,X-CLR 更像是一个‘友谊打分系统’,它不会简单地分‘朋友’和‘陌生人’,而是给每对关系分配一个分数,比如猫和狗可能是50分(有点像),而猫和卡车只有10分(完全不像)。

这种方式让 X-CLR 能够更细腻地描述图片之间的关系,而不是一刀切地分成“相似”或“不相似”。

结果:在 ImageNet 分类任务中,X - CLR 训练的系统表现优于竞争对手,尤其在训练数据少的情况。

如在 CC - 3M 数据集训练后,X - CLR 准确率 58.2%,SimCLR 为 57.0%,CLIP 为 41.0%;CC - 12M 数据集训练后,X - CLR 准确率 59.4%,SimCLR 为 58.9%,CLIP 为 58.8%。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OnZVCOJnBJIFLxcANWkp92VQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券