首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
1
20 行代码!带你快速构建基础文本搜索引擎 ⛵
2
AI听曲识歌!哼曲、口哨吹,都能秒识! ⛵
3
边缘计算 | 在移动设备上部署深度学习模型的思路与注意点 ⛵
4
推荐系统!基于tensorflow搭建混合神经网络精准推荐! ⛵
5
毫秒级!千万人脸库快速比对,上亿商品图片检索,背后的极速检索用了什么神器? ⛵
6
AI+医疗:使用神经网络进行医学影像识别分析 ⛵
7
AI识万物:从0搭建和部署手语识别系统 ⛵
8
听音识情绪 | 程序员手把手教你搭建神经网络,更快get女朋友情绪,求生欲max!⛵
9
爆肝万字,终于搞定这篇⛵神经网络搭建全全全流程!学不会你来找我~
10
股市预测,销量预测,病毒传播...一个时间序列建模套路搞定全部!⛵
11
Hugging Face发布diffuser模型AI绘画库初尝鲜!
12
你给文字描述,AI艺术作画,精美无比!附源码,快来试试!
13
只能用于文本与图像数据?No!看TabTransformer对结构化业务数据精准建模
14
实际应用效果不佳?来看看提升深度神经网络泛化能力的核心技术(附代码)
15
TensorFlow?PyTorch?Paddle?AI工具库生态之争:ONNX将一统天下
16
从头训练一个神经网络!教它学会莫奈风格作画!⛵
17
2022极端高温!机器学习如何预测森林火灾?⛵ 万物AI
18
TensorFlow深度学习!构建神经网络预测股票价格!⛵
19
AI医疗高精尖!基于AI的新药研发!⛵
20
超精准!AI 结合邮件内容与附件的意图理解与分类!⛵
21
AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵
22
图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵
23
NLP实践!文本语法纠错模型实战,搭建你的贴身语法修改小助手 ⛵
24
全都会!预测蛋白质标注!创建讲义!解释数学公式!最懂科学的智能NLP模型Galactica尝鲜 ⛵
25
真实世界的人工智能应用落地——OpenAI篇 ⛵

真实世界的人工智能应用落地——OpenAI篇 ⛵

本文介绍大名鼎鼎的 OpenAI!概述其发展历程,并介绍几款已经实际落地的 AI 应用:GPT3、CLIP、DALL·E 2、Whisper、Codex、ChatGPT。

💡 作者:韩信子@ShowMeAI 📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42 📘 本文地址:https://www.showmeai.tech/article-detail/414 📢 声明:版权所有,转载请联系平台与作者并注明出处 📢 收藏ShowMeAI查看更多精彩内容

💡 简介

AI 以迅速的发展,不仅仅在研究界带来了革新,在生活的方方面面也提供智能化,使我们更便利。在本篇内容中,ShowMeAI将介绍 OpenAI 的主要发展以及它们实际落地的 AI 产品应用。

💡 OpenAI vs DeepMind,两大人工智能巨头应对不同挑战

OpenAI 的使命侧重于以安全的方式为全人类实现人工智能的可用性。OpenAI 的模型为数据提取、文本生成、语音识别、图像生成或编辑等日常任务带来了高效的解决方案。尽管它们的任务和目标不同,但它们在开发大型模型方面有着共同的努力,这些模型在当今的大多数应用中都发挥着关键的作用。

DeepMind 的使命是解决智能问题,推动科学发展并造福人类。因此,它强调通用智能,即 AI 在任何情况下都能够自行学习。这也解释了为什么 DeepMind 所有的突破都依赖于深度强化学习,即 AI 只有一个目标和一组可能的行动,需要找出实现该目标的最佳方法。

💡 GPT3,超智能化的内容生成助手

💦 GPT3介绍

📘GPT-3 是一种深度学习模型,该模型经过训练后可以预测序列中的下一个标记,并能生成流畅逼真的文本,覆盖文本分析和摘要、文案撰写、代码生成等应用场景。GPT-3 在发布后不久就掀起了全球的热潮,促进了大量应用程序和初创公司的诞生。下图为用户使用 “Grammar Correction” 开始编程的操作示例。

💦 现实生活中的应用

OpenAI 官方表示,OpenAI API是公司第一个商业产品,自推出九个月以来,超过 300 个应用在使用 GPT-3,成千上万的开发人员在使用平台。目前平均每天生成 45 亿个单词,且生产流量继续扩大中。

如果你需要在线的文本解决方案,那可以阅读更多相关信息并自己把模型玩起来:https://beta.openai.com/playground。OpenAI 为所有新帐户提供 18 美元的信用额度。

💡 CLIP,文本和图像的天然融合艺术

💦 CLIP介绍

📘CLIP 是 OpenAI 开发的一种大型预训练语言模型,将输入的文本映射到一个连续的向量空间,并通过计算两个文本之间的距离来进行文本分类和相似度计算。与传统的语言模型不同,CLIP可以通过学习数据库中的大量文本数据来实现端到端的文本分类,而不需要任何人工标注。因此,它可以用于许多不同的文本分类任务,包括情感分析、知识图谱构建和图像标注。下图表明 CLIP 极大地改进了图像分类的结果!

💦 现实生活中的应用

CLIP可以完成零样本图像分类、图像描述、内容审核、图像生成等。值得注意的是,CLIP 是 DALLE 的构建块之一。

💡 DALL·E 2,优秀的艺术家

💦 DALL·E 2介绍

📘DALL·E 2 是 OpenAI 公司研发的一款新的人工智能系统,不仅可以根据文本描述生成对应的逼真图像,还可以根据文本提示修改图像内容,以及根据给定的图像拓展生成多种主题风格一致的“变体”。目前公开可用,可以直接访问 OpenAI 网站,也可以调用 API(2022 年 11 月已经发布!)。

💦 现实生活中的应用

DALL·E 2 的影响力可与 GPT3 媲美,应用场景也非常丰富,包括插图、图像摄影、NFT 生成、图像编辑等。微软已经宣布 DALL·E 2 将为其 Designer App 提供支持;Shutterstock 还宣布与 OpenAI 建立合作关系,允许用户在平台上使用 DALL·E 2 进行创作!

💡 Whisper,听懂所有语言的智者

💦 Whisper介绍

📘Whisper 是一个自动语音识别 (ASR) 系统。它使用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练。使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及将这些语言翻译成英语。

💦 现实生活中的应用

Whisper 是免费和可编程的,使用体验令人兴奋!这也使其成为现有商业语音识别服务的有力竞争者。它也可能直接挑战了当前主流的“基于云的 ASR 服务”。

由于 Whisper 模型较小,便于本地运行的移动 App 使用,从而可以避免转录前数据上传云端导致的隐私问题(已经有人行动起来了 📘例如下方推文)

💡 Codex,完美代码生成助手

💦 Codex介绍

📘OpenAI Codex 是一种基于 GPT-3 的自然语言到代码系统,有助于将 自然语言指令转换为十几种流行的编码语言。Codex 于去年 8 月通过 OpenAI 的 API 发布,是 GitHub Copilot 的主要构建块。

其实,可以要求 GPT3 解释一段简单的文本代码,从代码到解释性文本这个过程GPT3也可以做得很好,理解和生成代码的能力已经编码在 GPT3 中。而 Codex 专注于生成可执行代码,使其成为开发人员的绝佳助手。由于它已经集成到 Visual Studio 中,根据经验,将它无缝集成到开发周期中。

💦 现实生活中的应用

许多应用已经出现,包括各种代码助手 copilot、pygma 和 replit 等。

  • Copilot 编码助手能够根据指示生成代码、将注释转换为代码、生成测试并提出备选方案。
  • Pygma 使用 Codex 将 Figma 设计转换为高质量代码。
  • Replit 使用 Codex 描述选定的一段代码的作用,以便每个人都能理解其功能。

下图为 Replit 依靠 Codex 来解释部分代码。

💡 ChatGPT,令人兴奋的AI聊天机器人

💦 ChatGPT介绍

📘ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人,能根据用户的提示,在对话中生成类似人类的文本响应,完成回答问题、提供信息或参与对话等各种任务。与许多使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT 经过了训练,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。

ChatGPT的亮点主要有哪些?

  • 新增代码理解和生成能力,对输入的理解能力和包容度高,能在绝大部分知识领域给出专业回答。
  • 加入道德原则。即ChatGPT能够识别恶意信息,识别后拒绝给出有效回答。
  • 支持连续对话。ChatGPT具有记忆能力,提高了模型的交互体验。

💦 现实生活中的应用

ChatGPT不仅会聊天,写得了代码,修复得了bug,还能帮你写工作周报、写小说、进行考试答题,绘画,看病,甚至你还可以诱骗它规划如何毁灭人类,许多人认为,ChatGPT不仅仅是一个聊天机器人,而可能是现有搜索引擎的颠覆者。

参考资料

举报
领券