前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >零点有数:ChatGPT实践问题分析与应用展望

零点有数:ChatGPT实践问题分析与应用展望

原创
作者头像
人工智能日报
发布2023-02-16 15:47:08
5260
发布2023-02-16 15:47:08
举报
文章被收录于专栏:AI快讯

作者:零点有数数据科学家包利安 、零点有数算法经理吉文标

介绍

ChatGPT是OpenAI最新的语言模型,较其前身GPT-3有大幅提高。与其他大型语言模型一样,ChatGPT能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。作为OpenAI最新一代的大型语言模型,ChatGPT的设计非常注重交互性。为了调优ChatGPT,OpenAI使用了监督学习和强化学习的组合,其中强化学习的组件使其独一无二。OpenAI使用了“人类反馈强化学习”(RLHF)的训练方法,该方法在训练过程中利用人类反馈,以最小化无用、失真或有偏见的输出。

ChatGPT在实际测试与应用过程中的问题

1、多场景出错问题

1.1由于标注数据问题而引发的知识性错误。诸如回答内容存在事实性错误,对于确定的事实,其给出的答案无法达到高置信度。对于常识性的知识问题不能高效地给出符合日常认知的答案。大模型训练所需语料涉及面非常广,仅就人文学科而言,就存在非常庞杂的知识的语料,因此,在标注过程中,相关任务对标注人员的知识面、逻辑思考能力等都有极高的要求。在此基础上,还需要针对更多语料中提及的知识进行自动抽取,反复校验,才可一步步改进上述错误。

图中,关于古诗《登鹳雀楼》的提问,ChatGPT未能给出符合常识的回答,包括古诗的原文和作者信息。

1.2数据理解上的问题。对于简单的数据说明可以顺利地进行比较分析,但面对略复杂的语义理解要求,ChatGPT就会出现问题,对于中文丰富的词汇体系、语法和句法的特点,特别是涉及近义词之间的差别和近义程度的区分,还需要补充更多更广泛的训练数据、做进一步的训练和优化,才能修正相应问题。示例如下图。

1.3 基本的数据分析能力弱。由于基本的数据理解和分析能力较弱,ChatGPT目前无法正确有效地进行数理逻辑计算。

如下图所示,针对四人四天喝四桶水,八人八天喝多少桶水的数据计算问题,并没有一次性形成合理的计算逻辑链路,给出正确的计算结果。

2、答复的生成内容不具备实时性。

知识库信息的时效性不强。由于ChatGPT目前的版本仅支持2021年之前的语料信息提问,其回答的内容没有进行实时信息关联。训练一个模型的人力成本较大、时间周期较长,短期内难以有效地更新学习即时性的知识信息。

俄乌战争起始于2022年2月,而ChatGPT使用的最新训练数据只截止到2020年,因此对于最近发生的俄乌战争事件,无法给出具有时效性的情况分析。

3、模型能力覆盖广,但专业深度不足。模型复杂度,丰富性和通用性足够高,但对于某个专业领域方向的资深知识信息结构认知不足。

在上述的问答中,ChatGPT对于网络通信中的信息增益率公式只给出了概述性的描述,并未有效地展示公式的符合化表示及解释说明。

ChatGPT的负   面影响分析

ChatGPT在不同的场景中,展示出其应用之便利、性能之强大、前景之广阔,同时也凸显出一些值得关注的隐忧。从某种意义上而言,ChatGPT的出现,让诸多领域面临新的挑战,若未引起足够重视,可能会引发负 面的社会效应。

1、教育教学

在教育教学方面,最为直接的影响是学生在学习过程中,缺乏足够的思考,直接询问ChatGPT,轻松地获取到相关的知识和解答,特别是在论文的写作过程中,直接查询或生成相关内容,不仅不利于学生有效掌握相关知识,无法锻炼问题研究能力,甚至会形成过度依赖,影响学生的创造力,不利于教育的发展。

2、公共安全

公共安全领域主要涉及社会治安和信息安全。就社会治安而言,利用ChatGPT模仿不同人员的对话习惯,再结合语音合成功能,进而实现高仿真的人类交流和互动。相关功能如果应用在诈骗等场合,助长违法犯罪,影响社会稳定。就信息安全而言,数据治理面临更大风险,特别是关涉国家安全、商业机密、个人隐私等多方面的敏感数据。ChatGPT模型训练所使用的数据一般为大量可公开的数据和知识,但基于现有的技术研发数据管理体制,不一定能保证直接相关的敏感数据或基于公开数据研究所得的敏感数据不被泄露。

3、伦理道德

在伦理道德方面,无论是个人还是社会或国家同样受到一定的影响。从个人的角度来看,对于大多数未成年人,甚至部分成年人,尚未形成成熟且稳定的心智,在使用ChatGPT的过程中,个人想法很容易被直接或间接地带偏,进而做出不合适的行为;从社会或国家的角度来看,ChatGPT如果作为一个文化冲击的工具,对整个社会和国家将有可能产生不良影响。

以上这些方面,都亟待相关技术方在技术层面对相关内容进行完善,对各种使用方进行权限的控制和监控,同时相关职能部门应从国家层面进行立法,进行合理的限制和管控。

零点有数专家的思考与拓展

1、行业训练数据优势。如何整合行业历史沉淀数据转换为高质量、有效的训练数据集,更好提升行业应用模型的精度。

2、行业数据理解与解读更专业。我们在各行各业多年来沉淀了大量的行业内的专业知识库信息(如:12345政务服务便民热线),对各行业的数据特性有更深度的理解与解读。

3、强化推理能力。我们可以基于对业务场景的了解出发,对未知业务场景做从规则、向量表示推理到prompt的范式多层次学习推理过程。

4、线上更新机制。我们实时收集线上数据,并实时进行模式化的更新,动态反馈更新至模型中,形成模型长期反馈更新学习的机制。

5、合理挖掘发现行业应用场景,并更深层次地将GPT与垂直业务行业做融合,构建行业化的GPT模型,并服务于业务实际需求,如政务业务中生成式日报等。

更安全的数据管理。我们在长期业务实践中积累了丰富的数据管理经验,特别是在政务业务中,形成了完善的数据安全管理机制,保证模型构建和应用等过程中数据的安全性。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档