微软尝试AI应用内置Windows；前谷歌大脑团队成立ideogram；Midjourney推图像修复功能；AI需求正在减少么？

文章来源：企鹅号 - 有新Newin

产业资讯

微软正在尝试将 AI 应用于Bedrock版Windows中

微软正在早期阶段尝试为内置的Windows应用程序（如照片、截图工具，甚至绘图工具）添加新的 AI 功能。

前Google Brain生成图像团队成立 ideogram

几位来自Google的顶尖文本到图像研究人员创建了一家新的 AI 艺术公司。他们很可能将自己的研究（Imagen）的思想与一些新颖的想法结合起来使用。

MidJourney新增图像修复功能

MidJourney宣布推出其最新功能，名为"Vary (Region)"的新功能允许用户进行图像修复，即编辑图像画布中的元素。

ChatGPT如何将生成式 AI 变成“万能工具”

GPT-3.5和GPT-4等AI模型已从专门的工具转变为多功能的通用处理器。它们现在可以执行文本分析、机器人技术和半导体设计等任务。

工程研究

自训练调查

半监督和自监督学习是机器学习模型生成训练信号的方式，与标准的监督、无监督和强化学习不同。目标函数通常是数据特定的，例如遮蔽单词或旋转图像。这是对该领域常用技术和存在的问题进行研究的一份好资料。

使用CLIP和描述改进图像搜索

该项目介绍了一种方法，通过描述中的变化搜索与给定图片相似但有所改变的图片。它使用了CLIP模型，并添加了特殊的技术。该方法在像FashionIQ和CIRR这样的流行图像搜索数据集上效果更好。

OneDiffusion

在生产环境中部署扩散模型具有挑战性，它们笨重且计算成本高。OneDiffusion旨在使部署和微调更易管理、可扩展和可靠。

更好的文本到3D模型

科学家们发现了一种使用特殊技术将文本转换为3D的新方法，但有时结果并不完美。IT3D引入了一种智能策略，利用多个视角和特殊的训练系统，使3D创作看起来更加逼真。

视频中更好的目标跟踪

研究人员开发了一个名为TOPIC的新系统，可以使用运动和外观线索有效地跟踪视频中的多个对象。他们还创建了一个名为BEE23的新数据集，专注于复杂的运动。

‍

效率资源

‍

Kypso

利用AI副驾驶来管理和扩展团队在日常工具上的操作，提供更好的产品交付。

支持更多模型的新GGML格式

Llama.cpp是一种运行本地语言模型的简便方法。目前它受到底层GGML格式的限制。该PR提议一种新的格式并开始集成。

相关快讯