产业资讯
谷歌升级搜索生成体验
谷歌正在推出其搜索生成体验的几项新更新,这是该公司基于 AI 的搜索功能。这些更新包括自动术语定义、编程辅助和 AI 生成的摘要。
Kneron将在今年发布AI芯片
AI边缘公司Kneron宣布将在年底前发布其新的神经处理单元芯片。KL730芯片专门设计用于机器学习和 AI 应用,据说比以前的芯片节能3到4倍。
IBM与NASA在Hugging Face上开源最大的地理空间AI基础模型
IBM与Hugging Face正在向公众发布IBM的地理空间基础模型,该模型使用了NASA的卫星数据进行构建。通过与NASA的合作,该模型旨在使 AI 在气候科学和地球研究中的作用民主化,以应对处理大型环境数据集的挑战。该模型在卫星数据分析方面已经显示出15%的改进,并且可以用于各种任务,如追踪森林砍伐和监测温室气体排放。
ChatGPT能成为内容审核员吗?
ChatGPT的创建者OpenAI一直在使用其最先进的大型语言模型来执行公司的内容政策。
介绍DoctorGPT,一个开源的 AI 医生
DoctorGPT是一个可以通过美国医疗执照考试的LLM。它可以离线工作,跨平台运行,并保护健康数据的隐私。
工程研究
AI 与内存瓶颈
LLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook只比强大的A100慢一点点就能运行最先进的模型?答案是,当你只进行单批处理,每次只处理一个标记时,内存带宽是瓶颈,而M2的内存带宽与A100的差距并不大。
贝叶斯流网络
统一建模离散或连续数据是一项挑战,尤其是在试图保持输出的概率似然解释时。这篇新论文展示了一种新的生成模型类别,具有许多有趣的属性,如无前向传递,用于离散数据的基于梯度的样本引导,以及有竞争力的语言建模似然。
调整大型代码模型的指令
大多数代码模型是在GPT-4蒸馏数据上进行指令调整的。这项新工作展示了如何避免这种情况,引入了一个扩展的人工评估数据集,并在原始的人工评估中获得了46.7分。尽管这令人印象深刻,但它显示了封闭和开放代码模型之间的巨大差距。
扩展扩散模型的增强虚拟试衣
虚拟试衣任务,其中将一张图片中的服装转移到另一张图片中,是具有挑战性的,尤其是在更高分辨率下。许多方法使用生成对抗网络。本文介绍的解决方案DCI-VTON使用扩散模型结合示范基于修复和扭曲模块。这种组合确保保留服装细节并产生逼真的虚拟试衣图像。
高级食物图像分割
虽然Segment Anything Model(SAM)在各种数据集上的分割任务中表现出色,但对于掩模的特定类细节存在缺失。FoodSAM克服了这一问题。它将SAM的优势与新功能相结合,以更有效地分割食物图像,甚至识别场景中的单个食物和其他物体。
教计算机写"Ghoti"
简要阅读为什么 AI 即将引发混乱。还有一点点俏皮。
效率资源
设计和发布AI开发人员工具指南
本文概述了有效的AI开发人员工具的十个关键设计原则,借鉴了GitHub设计、发布和扩展Copilot的经验。这些原则包括利用自然语言、解决开发人员的痛点、收集有意义的反馈、认识偏见,并在AI模型中优先考虑定制、可访问性、性能和持续改进。
OpenDream
OpenDream为你的稳定扩散工作流引入了分层、非破坏性编辑、可移植性和易于编写的扩展功能。
ChartPixel
ChartPixel将你的数据转化为配备有 AI 辅助洞察力的图表。
领取专属 10元无门槛券
私享最新 技术干货