一、AI 发展和业务分类
1、人工智能 Artificial Intelligence 发展阶段
人工智能 Artificial Intelligence 发展阶段 :
- 快速计算 : 快速进行大量的计算 , 只能进行计算 , 这是实现 AI 的最重要的前提 , 先提升计算量 ;
- 智能识别 : 语音识别 / 图像识别 , 模拟人的感官 , 识别外部事物 ;
- 智能输出 : 如 : GPT 可模拟人的语言输出 , Stable Diffusion 模拟人的视觉输出 ;
- 智能决策 : 认知智能 , 可以进行思考 / 决策 , 自动进行智能识别 , 做出决策输出出来 , 目前仅在 自动驾驶 领域实现了 L2 级别的智能驾驶功能 , 其它领域还在发展 ;
2、AI 业务涉及到的问题
AI 业务 涉及到的问题 :
- 输入数据 : 输入 文字 / 图像 / 声音 等数据 ;
- 输出数据 : 输出 结果 , 包括 文字 , 代码 , 数值 , 判断 , 标签 , 图像 , 视频 等 ;
- 量化衡量 : 如何判定输出结果的好坏 , 使用一个量化标准 , 衡量输出结果 ;
3、AI 业务分类
所有的 AI 相关的业务 , 都可以分为如下几类 :
- 分类 : 输出有限个标签 , 如 : 为新闻分类 : 政治 / 经济 / 体育 / 娱乐 等有限的几个标签 ;
- 聚类 : 不知道输出标签的个数 , 具体有多少个标签 , 靠数据本身分析后得到 ; 如 : 收集用户反馈 , 不知道用户反馈什么内容 , 只能将相似的内容聚类到一起 , 具体能聚多少种分类 , 需要分析后才能知道 ;
- 回归 : 预测一个数值 , 评价该输出的好坏标准是误差大小 , 如 : 根据司机的工作时间 / 公里数 / 用车成本 估算出司机 每天的利润值 ;
- 决策 : 输出连续的动作 , 决策树 , 如 : 下棋每一步怎么走 , 自动驾驶 应该加速 / 减速 / 刹车 / 鸣笛 / 变道 等操作 ; 评估决策需要根据最终的结果进行评估 , 如下棋是否赢 , 自动驾驶是否安全到达目的地 ;
二、ChatGPT 分析
1、ChatGPT 原理
ChatGPT 原理 : 每次生成一个字 , 猜下一个词的概率 , 如下图所示 , 已经生成了 The cat 文字 , 下面生成哪些字 ,
- eats 概率为 0.3
- stays 概率为 0.2
- sat 概率为 0.5
给出一个提示词 , 就会根据该提示词进行文本生成 , 给出的提示词越详细 , 生成的内容越具体 , 越准确 , 下面生成的词汇的方向就会收敛 ;
训练 : GPT 大模型 记录了所有人类的文本 , 这就是 学习训练过程 ;
- 训练的内容是 每个词 后面的词 出现的概率 , 也就是 权重 ;
权重与提示词 : 在 GPT 大模型中 , 每个词后面跟着不同的词是有一定的概率的 , 不同的环境下后面词汇出现的概率是不同的 , 使用提示词来设置环境 ;
提示词设置语境 : 当使用 GPT 模型时 , 给出提示词 , 生成一个语境环境 , 该语境下 , 不同的词的出现概率是不同的 , 将可能性最大的词生成出来 ;
生成参考和反馈修改 : 参考已经生成的语句 , 配合提示词 , 以及上下文语境 , 生成下一个词 , 以此类推生成更多的文字 ; 如果生成的不对 , 指出改进方向 , GPT 模型可以按照你给出的方向重新进行生成 ;
2、ChatGPT 训练
ChatGPT 训练语言模型 , 输出文本语句很通顺 , 但是 具体知识是否准确 , 价值观是否可以接受 , 这是不知道的 , 有时候输出的内容就是胡说八道 ;
使用英文输入 , ChatGPT 理解英文的准确率要高于中文 , 因此对于复杂的问题 , 建议使用英文输入 , ChatGPT 理解识别比较准确 ;
3、ChatGPT 可以解决的问题
ChatGPT 可以解决的问题 : ChatGPT 可以很好的解决 文本的 分类 / 聚类 问题 ;
- 输入要分类的 文本 数据 , 让 ChatGPT 进行 分类 ;
- 输入要聚类的 文本 数据 , 让 ChatGPT 进行 聚类 ; 对数据进行聚类 , ChatGPT 不是最有效的方法 , 但是可以实现 ;
- 复杂任务规划 , 将一个复杂的任务 , 让 ChatGPT 进行拆解 , 分步骤解析出来 , 给出解决步骤 ;
4、ChatGPT 不能解决的问题
ChatGPT 不能解决的问题 :
- 回归问题 不适合 使用 ChatGPT 解决 , ChatGPT 需要先理解你输入的文本 , 然后进行计算 , 只要理解错了一个数字 , 计算结果会偏差很多 ;
- ChatGPT 不擅长处理 算术 数值相关 问题 , 基本输入一道题目 , ChatGPT 输出后就是胡说八道 ; 因为 需要先分析理解题目 , 理解错了一个概念 名词 或 数字 , 得到的结果远远不同 , 解体的逻辑思维也不对 ;
- 决策问题 不适合 使用 ChatGPT 解决 , 比如下棋之类的题 , 基本也是胡说八道 ;
ChatGPT 解决不了的问题 , 可以自己训练模型 , 不仅局限于 ChatGPT 语言模型 ;