首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

微软尝试AI应用内置Windows;前谷歌大脑团队成立ideogram;Midjourney推图像修复功能;AI需求正在减少么?

产业资讯

微软正在尝试将 AI 应用于Bedrock版Windows中

微软正在早期阶段尝试为内置的Windows应用程序(如照片、截图工具,甚至绘图工具)添加新的 AI 功能。

前Google Brain生成图像团队成立 ideogram

几位来自Google的顶尖文本到图像研究人员创建了一家新的 AI 艺术公司。他们很可能将自己的研究(Imagen)的思想与一些新颖的想法结合起来使用。

MidJourney新增图像修复功能

MidJourney宣布推出其最新功能,名为"Vary (Region)"的新功能允许用户进行图像修复,即编辑图像画布中的元素。

ChatGPT如何将生成式 AI 变成“万能工具”

GPT-3.5和GPT-4等AI模型已从专门的工具转变为多功能的通用处理器。它们现在可以执行文本分析、机器人技术和半导体设计等任务。

工程研究

自训练调查

半监督和自监督学习是机器学习模型生成训练信号的方式,与标准的监督、无监督和强化学习不同。目标函数通常是数据特定的,例如遮蔽单词或旋转图像。这是对该领域常用技术和存在的问题进行研究的一份好资料。

使用CLIP和描述改进图像搜索

该项目介绍了一种方法,通过描述中的变化搜索与给定图片相似但有所改变的图片。它使用了CLIP模型,并添加了特殊的技术。该方法在像FashionIQ和CIRR这样的流行图像搜索数据集上效果更好。

OneDiffusion

在生产环境中部署扩散模型具有挑战性,它们笨重且计算成本高。OneDiffusion旨在使部署和微调更易管理、可扩展和可靠。

更好的文本到3D模型

科学家们发现了一种使用特殊技术将文本转换为3D的新方法,但有时结果并不完美。IT3D引入了一种智能策略,利用多个视角和特殊的训练系统,使3D创作看起来更加逼真。

视频中更好的目标跟踪

研究人员开发了一个名为TOPIC的新系统,可以使用运动和外观线索有效地跟踪视频中的多个对象。他们还创建了一个名为BEE23的新数据集,专注于复杂的运动。

效率资源

Kypso

利用AI副驾驶来管理和扩展团队在日常工具上的操作,提供更好的产品交付。

支持更多模型的新GGML格式

Llama.cpp是一种运行本地语言模型的简便方法。目前它受到底层GGML格式的限制。该PR提议一种新的格式并开始集成。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O0wsfxWKDLFMkUunGG2j2q-A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券