首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

StabilityAI发布DeepFloyd IF!AI教父离开谷歌;微软Edge结合BingAI|Daily Summary

▌Stability AI发布DeepFloyd IF

Stability AI发布了DeepFloyd IF,这是一种创新的文本到图像模型,利用人工智能将文本描述转换为详细而生动的图像,为数字艺术和设计开辟了新的可能性。

▌AI 教父 Hinton 离开谷歌

AI 教父 Hinton 博士离开谷歌的事实是值得注意的。他在Twitter上声称,他的目标是远离谷歌,这样他就可以更加公开地讨论人工智能的潜在危害。他声称,他之前的雇主在AI产品发布方面表现得很负责任。

▌Microsoft Edge现在具有Bing AI

Microsoft Edge在其右键上下文菜单中引入了一项基于人工智能的功能。这个功能由Bing提供支持,可以为用户在浏览时提供AI生成的查询建议。它旨在帮助用户快速找到相关信息,而无需打开新标签页或执行其他搜索。

▌Open GPT模型针对医疗数据进行调整

Llama是Meta的一种语言模型,采用了大多数开放式许可证进行发布。它的训练时间比GPT-3长得多,甚至比Deepmind的Chinchilla建议的最佳训练时间还要长。它在医疗任务上表现良好,但是当进行更多的调整后,分数提高了30%以上。很多人一直在谈论参数高效微调,它只更新底层模型的一小部分。这篇论文表明,虽然使用PEFT更便宜,但有时性能会显著降低。

▌带有约束的扩散模型

扩散模型是一类机器学习模型,它们学习从数据中慢慢去除噪声以产生高质量的输出。稳定扩散文本到图像模型就是这样一个例子。这些模型的一个挑战是对输出设置约束(想象一下只想使用蓝色像素的应用程序)。本文在输出上引入不等式约束,以便您可以为批准区域内的任何内容生成扩散路径。他们展示了扩散模型在约束非常严格的生物医学应用程序中的示例。

▌扩散模型合成数据提高ImageNet分类

这篇论文探讨了利用大规模文本到图像扩散模型进行生成性数据增强以改善具有挑战性的判别任务的潜力。研究表明,这些模型生成的经过精细调整的类别条件模型具有最先进的FID、Inception得分和分类准确度得分。通过从生成的模型中添加样本来增强ImageNet训练集,可以显著提高ImageNet分类准确度,超过强大的ResNet和Vision Transformer基线。

▌NeutralSpeech2

Natural Speech 2 项目旨在通过开发新的算法和模型来推进语音识别技术的发展,使其更好地处理人类语音的内在复杂性和微妙性,从而提高基于语音的人工智能系统的性能和可用性。

▌Godot-Dodo

godot-dodo项目提供了一种管道,可以在GitHub上检索到人类创建的特定语言代码上对开源语言模型进行微调。

▌Whisper Jax

现在在Jax中运行,这个版本的whisper可以在短短几秒钟内转录1小时的音频。底层模型已经是最强大的语音识别系统之一,现在几乎毫不费力地实现了快速转录。

▌H20GPT

GPT的开源版本。

▌生成AI的未来是专业化的,而不是通用的

麻省理工科技评论指出,生成AI的未来可能会是专业化的,而不是通用的,这表明人们越来越需要定制的AI解决方案,以满足特定行业或应用程序的需求,而当前一刀切的AI模型在解决独特和多样化需求方面存在限制。

▌可能会让我们与AI同归于尽的想法

这篇《时代》杂志的文章探讨了某些心态和假设,这些心态和假设可能会导致与AI相关的灾难性后果,强调了负责任的AI开发和使用的重要性,以及对思考深入的监管和伦理考虑的需求。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230503A013IQ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券