00:00
那今天我主要分享的就是从技术角度来跟大家讨论一下啊,怎么去做,用AI去辅助大家做这个技术创作。那首先做一下自我介绍。呃,我现在是在朗新科技的AI研究院,现在从事的就是大模型的这个算法和落地方向,那之前在腾讯呢,主要也是做AI算法的,然后在19年加入了我们腾讯云社区,所以算是这个共创观的一个老成员了,相信这也是为什么今天这个泽民能够邀请我来参加这一次的分享。那其实在参加这次分享之前呢,泽敏是上周五啊加了我的微信,当时我其实有点犹豫不决的,然后犹豫不决我现在一般都是去问GBT,然后他会,他给了我很多的建议,然后非常的啰嗦,然后我就问你就回答我去不去吧,然后他去,然后我就来了。然后来之前呢,我是,呃,还是想跟泽敏说,我要分享一下我的那个大纲,然后来看到底符不符合这次的主题,所以说我马上调用了我自己大脑的这个提取关键词任务,那我的大纲非常简单,就是AI创作和AI辅助创作。
01:12
然后就依据我平时的这个,呃,自己的AI的知识,结合我自己的这个相关的经验和心得,然后去跟AI做了一个脑报。然后可以看到他列的大纲非常的详细,但是也是说不清道不明,反正就有一股AI感,所以说我就结合了它,用它进行了参考,得到了我今天想要跟大家分享的一个内容。呃,主要就是以下大三大块,首先我跟大家分享一下,从算法的角度跟大家分享一下,或者探讨一下这个AI它的能力和边界到底在哪里。那AI它到底是怎么来?这个大语言模型它到底是怎么来的?这个AI的领域太大了,因为我所专注的就是大语言模型,所以今天跟大家聚焦的也是在大语言模型这个方向,那大语言模型它到底是怎么训练出来的,然后他为什么有这个能力呢?
02:04
呃,以GPT3,其实在GPT4出现,出现之前其实已经有123,只是说大家没有去做太大的关注,是因为他在前三代只做了一件事情。就是把这个AI关到小黑屋里面,不断的让他学习。就是呃,他他在这件,他在这段时间只去学会了两件事情,第一件事情就是学会怎么去表达,就是怎么把每一个单词和我们人类的进行一个对应。就是用一,呃,比如说1244个数字来表示我们的一个汉字,然后第二件事情呢,他就学会了怎么去压缩知识,就是把我们灌输给他的万亿级别的单词的内容压缩到我们现在所说的呃,32B的模型,72B模型,175B的模型,啊,这个175B就是它的参数量大小。那么他有了这两个能力以后,呃,就是得到了我们的贝斯模型,那个贝斯模型的产品形式是什么呢?
03:02
就是输入上文,然后预测下文。那么这个产品的话,对于真正的应用落地的话,基本上就是没有什么亮点,所以在在T的GBT之前,虽然已经有这么,其实基础技术已经在了,只是没有得到大家的,呃,这个。呃,产品形态,那么open I干了一件什么事情呢?他就做了第二步事情,他就写了很多的问答,对,然后在基础模型的基础上去进行微调。那么这件事情是呃产品形态是什么呢?就是把呃基础模型放出来了,跟大家进行一个对话,那么在对话的过程中,刚才大家也说到了,就是呃恰恰GPT他会一本正经的胡说八道,他会产生什很多的幻觉。那么基于这个问题呢?Open I就做了第三件事情,他就让人类来辅导这个一代,告诉他,呃,训练一个奖励模型就告诉他。
04:00
怎样的回答是正确的,然后怎样的回答是负面的,再利用强化学习的知识就告诉他,呃,正面的奖励模型告诉你分高的,你就应该这样学习,然后奖励模型告诉你是负反馈的,你就不要朝这个方向去学习了。那么利用这个强化学习的基础,才让这个前列PGGPT现在的效果是越来越好。那么通过这个流程,大家应该就基本能够了解这个大语言模型为什么能够起作用了。那么有了大语言模型以后,我们当然就是希望他能够为我们人类干越来越多的事情,毕竟已经投入了大量的人力、财力和升值,是能源。那对于这个大语言模型的边界呢?呃,我个人认为。呃,这里面有些字好像我个人认为,呃,对于需要学习,需要思考和需要创作的事情,还是要应该由人为主导的,也就是说我们所说的慢思考。呃,需要去逻辑推理的,还是应该由人去主导的,那对于一些快的思考,那我们要利用AI的他强大的记忆力和他强大的算法,然后去做为人类做一些辅助,那么在应用它的过程中呢,还是要考虑它仍然还是存在一个幻觉问题的。
05:16
另外我们通过刚才的流程也可以看出来,其实所有的数据都是由人来打标签的,甚至在强化学习过程中的,呃,跟人类对齐,这个能力其实也是人来指导的,那么这个人指导过程中其实一定会存在一些公平和边界的问题。所以大家大家在应用的时候也要考虑到大模型到现在为止还是还是有这些缺点的。那么了解了AI大模大模型以后,我们就来聊一聊这个技术创作。那我个人的技术创作的来源呢?呃,主要是以下几个方向,第一个就是我在项目中遇到的问题,那对于一些简单的问题呢,我就会简单的记录,那对于复杂的问题呢,就是我的一个创作题材,那什么是复杂的问题呢?
06:03
就是有可能这个问题对于别人来说,它是一个简单的问题,他只要消耗了我的时间,然后我进行了一个思考,对我而言就是复杂的问题,那他就是我的一个创作题材。呃,第二个方向呢,就是学习新技术,呃,因为我其实在17年之前是做客户端开发的,安卓客户端开发。然后17年以后呢,是呃加入了这个呃AI的团队,最开始是做的图像方面的,然后然后就是CV方面的,其呃后来有了音频的项目呢,我就会做呃,比如说音频补齐啊这一些的项目,然后在22年的时候呢,有一个马力预测的项目,然后我又去学习强化学习,那现在呢,我又是去做大语言模型,所以说对于对于这些大模块的技术呢,我一般就会形成一个。系列的文章,比如说这个强化学习,其实我当时二二年的时候是写到8。
07:00
就没有再停,停止了更新了,是因为那个系列已经能够完成我当时的项目项目了,但是因为现在大模大语言模型,当然刚才大家也看到强化学习是现在这个提升的一个利器,所以我现在需要把强化学习这一块给捡起来。呃,在上个月5月份我又继续在更新这个系列,呃,所以说以前的写作有可能在当时只是完成一个项目,但是比如说两年以后你可能又要用上,所以写作一定是有意义的。第三大块呢,就是技术沉淀,那这一块就不用多说了,这个应该是大家协作的一个最大的一个方向。那第4大块就是社区活动了。其实。4个区基本上每个月甚至每周都有一次大型的活动,呃,特别是如果大家加入了这个共参观的群里面的话,每周五还要去抢题目。所以说社区活动里面的是一呃也是,如果你平时没有那个呃写作灵感的话,社区社区的活动是一个比较大的方向,甚至他也可以告诉你创作方向。
08:09
那么对于这个,呃,技术内容的来源呢,其实刚才。呃,前面两位老师已经讲的非常详细了,那这一块呢,我就简单过一下。嗯,主要分为两个步骤,第一个你就是要不定期的去收集。呃,这里不定期的收集,呃,大家就是一定不要相信自己的记忆能力,大家记忆能力一定没有大模型记忆呃的记忆能力强,所以说平时大家在看到一些灵感的时候,哪怕你在刷B站。说在追番的时候,突然来了一个技术的视频,你当时不想看,你哪怕先点个一键三连,你先把它收藏起来。然后下一步你有了素材以后,你再去定期的整理,那在整理的过程中呢,你就会发现。嗯,第一这个阶段如果太零散的话,在整理的阶段,这个阶段就会花费很长的时间,所以说是一个迭代优化的过程,你下一次在整理的时候,下一个阶段的时候,你会自然而然的想到我第一个阶段在收集的时候就不要太零散了,所以说只要开始做。
09:16
这样后面就会越来越好的,那么经过这个整理、分析、提炼,理解这么一个循环的过程的话,慢慢的去思考,慢慢的将这些知识进行一个联系,然后节省,然后形成你自己的一个知识体系。所以希望大家就是动起来,那后面你个人的知识体系一定会越来越好。那么懂了AI,然后又有内容以后,下面我们就要去创作了,那如何利用AI进行创作呢?我举2个,那对于这个模型的工具和PRO的工程,刚才维尼老师已经讲的特别好了,我这里面就呃,完全跳过了。那我现在举两个案例,第一个案例呢,就是嗯,本次这个PPT怎么产生的。
10:02
那第一个步骤就是AI为我呃怎么辅助我做决策了,刚才已经说了,然后就是选题,选题这个事情,因为一定是要结合我个人的一个一些呃思考,或者是我个人的一些经验心得,所以说即使AI他有这个能力,我也不让他参与。第三步呢,就是AI跟我一起写大纲,主要是让他辅助我,然后给我一些思路,第4个就是确定大纲和一些章节的内容,这一些这一块其实是现在这种文字工作。大家也非常。能力也非常的强,只是因为这一次的分享一定要结合我个人的,呃,沉淀,不然来分享也没有什么意义,所以说这一部分也不需要他来参与,那下一部分的整理语句和文本的润色,这一块呢,是家非常强大的能力。那通过上面的这些环节以后,我就可以得到我的演讲稿。把这些演讲稿输入到TGPT里面,他会给你提一些建议,然后再一次进行一些整理,整理完了以后,我下一步就要考虑怎么把我的这个word转成PPT呢?我总不能拿一篇word来给大家,呃,对着念吧,然后就需要借借鉴一些呃,AI工具。
11:14
那这里的工具我用的是伽马。基本上对我来说。呃,没有什么,没有什么太大的用处,所以说现在对于这个多模态的大模型呢。有可能是因为我接触的并不是太多,大家可以去看一下那个维尼老师的公众号,可能会学习到更多的东西,那实际上我只是借鉴他来跟我进行一些排版的建议,那下一部分呢,就是我要把我写好的文档里面的那些章节输入给他,帮我提取关键字。那呃,提取关关键字以后,基本上每一页的关键词的内容就有了,呃有了以后我们就要进行一些图文的呃绘制,像这种流程图画的比较丑的流程图呢,就是我画的那里面一些比较好看的图片呢,就是AI生成的。
12:02
那最后呢,就是,呃,我个人在进行一些简单的排版,就得到了今天的PPT。那这个命题呢,实际上就是一个被动的,因为是泽敏给我的命题,那下面再分析一下我平时呃,主动去写AI技术的一些流程。呃,这个流程跟呃,这个陈老师其实分享的流程是一致的,首先就是选题,因为选题完全是因为有我的个人的项目,个人的经验,个人的心得,刚才已经介绍过了,所以说这个一块完全应该由个人来主控。即使是这个选题,AI已经有了很多的材料,我希望大家在自己创作的时候,呃,可以让他来给你一些建议,但是还是希望大家能多多的思考在这一块。然后第二块呢,就是拟定大纲,那么大纲有一些呃。比如说那种爆款的标题,这一块是AI非常的擅长的,呃,所以说在这一块呢,主要是借鉴他帮我们去取一些标题,然后就是对于一些大纲可以跟他进行先导报,让他帮你提供建议。第三块这种章节内容呢,其实是主要结合我们刚才第二章讲的你自己的个人的知识体系。
13:18
因为相当于是呃跟现在的这个RG技术一样,他要从我们的知识体系里面去把相关的给抽取出来,然后再写你自己的这个章节,然后这里面可能有你自己的一些领域知识,然后你自己的一些写作技巧和个人风格,那他能帮你呃AI能帮你做的顶多就是呃扩充材料,然后给你提供一些呃知识点的查缺补漏,然后就是。他比较擅长的缩写扩写,然后呃语句认设,最后的他最擅长的就是对于一些文本的纠错和排版,就是你转为markdown形式的话,他现在这一块其实非常强的,那经过了这四个步骤以后,我们就可以生成我们自己的这个呃技术文章了。
14:03
那现在呢,我现在在呃云社区里面应该有,我昨天还特意去看了一下,因为以前直接呃去没有去关注,我到底写了多少啊,昨天看了一下已经有80多篇的技术文章了,那么应该是从22年底China g PT出现以后,我就一直在利用AI帮我写辅助写作。呃,那今天我的分享大致就是这些内容了,就想跟大家说的就是,呃,开始写作吧,就从这个腾讯云设计开始,谢谢大家。好,谢谢熊熊非常真诚的分享。啊,大家有没有什么问题想跟熊熊交流呢?不好意思,不好意思。这么多人。好像是你先举。呃,老师您好,我是一名现在在读的大学生,然后日常的话,我对于就是拆GPT的使用还是非常频繁的,然后主要是用在日常的一些工作学习,包括一些新知识点了解当中,但是对于您刚刚就是提出的那个大语言模型,他会有一个幻觉问题,然后的话在我他在我使用当中,我也会有一些实际问题,就比如说呃,我在对我一个完全我不了解的东西去学习的时候。
15:14
他可能给我回答出一些,呃,他其就是有一部分,比如说80%的正确,那个,他的那个正确性是高的,但是另外一个,他可能有编造了20%的内容出来,他对我有一个很强的误导性,那我在这种过程当中,我应该去怎么去规避,或者说怎么样去有一个有一定理量程度的去理解,嗯,这里面呃两个方法,一个呢,就是像现在有很多的APP,其实他已经会帮你去通过互联网检索,这个刚才陈老师已经介绍过,他会把来源告诉你,那你去他的他提供给你的来源去看一下他提供的这个知识,呃,链接到底是不是有权威性的,这样去自己验证一下,那第二个呢,就是用这个RG,我不知道你有没有了解,就是外挂知识库的形式。
16:00
那外挂知识库就是你自己的知识体系,你首先你要写这篇,呃,你要去做创作的话,你肯定有你自己的知识体系,然后你从把相关的信息给他以后,他来帮你去进行一些呃,比如说提炼呀,或者是呃摘要的之类的信息。所以如果说幻觉问题要如要完全规避的话。呃,通过刚才介绍的这个模型怎么生成的,它其实就是一个概率的问题,就是一个概率生成的问题,所以说呢,即使是现在为止,我觉得对于大模型的幻觉问题应该还是存依然存在的。好的,谢谢老师。熊老师你好,你好,呃。在这个演讲刚刚开篇的时候,我听您说就是,呃,像类似于今天来不来演讲这种私人内容,您可能也会就是问一下这个GPT,所以说我想问一下就是您在生活中是如生活中也好,工作中也好,是如何平衡,就是自己思考和询问GPT之间的关系的。
17:00
因为这个我的职业就是做大模型的,所以说呃,所有的竞品我可能都会去体验一下,至于生活中真正的这个问题,他对我起的是一个判断的话,我肯定不会完全听他的,我还是要有自己的思考的。对于生活中的话,呃,常识性的问题,其实说实话,生活中的问题我问他的还是相对少一些,基本上都是我在工作中的一些技术问题,然后可能是一些知识类的问题会问的比较多。
我来说两句