前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用ChatGPT搭虚拟机,跑机器学习和深度学习,但看完最后一句话我犹豫了....

用ChatGPT搭虚拟机,跑机器学习和深度学习,但看完最后一句话我犹豫了....

作者头像
生信初学者
修改2023-03-14 14:16:07
2K0
修改2023-03-14 14:16:07
举报
文章被收录于专栏:备份笔记备份笔记
  • 1 前言
  • 2 OpenAI发展历程
  • 3 ChatGPT与生命科学
  • 4 用ChatGPT搭建虚拟机
  • 5 讨论

1 前言

打个预防针:全篇告别行内行外深奥原理,直接上大白话,我奶奶都听得懂,放心阅读

OpenAI老哥其实默默发力很久了,2022年11月30日于旧金山总部推出免费版,12月4日才过去5天ChatGPT的用户已破百万,与以往的空大高工程项目不同,ChatGPT更为接地气,真正让普通用户近距离感受到了 AI 技术所带来的震撼,确实有意思。也算是首批体验用户了。笔者是去年12月初使用ChatGPT的,起初也是和大部分人一样,凑凑热闹,来尝鲜一下这个“聊天机器人”。还没注册或者想使用桌面端的小伙伴可以看看前面的推文,保姆级教程。

《财富》杂志有一段描述:

!! 在一代人的时间中总有一种产品的出现,它将从工程系昏暗的地下室、书呆子们臭气熏天的青少年卧室和爱好者们孤独的洞穴中弹射出来,变成了你的祖母Edna都知道如何使用的东西。早在1990年就有网络浏览器,但直到1994年Netscape Navigator的出现,大多数人才发现了互联网。2001年iPod问世之前就已经有了MP3播放器,但它们并没有引发数字音乐革命。在2007年苹果推出iPhone之前,也有智能手机,但在iPhone之前,没有智能手机的应用程序。2022年11月30日,人工智能迎来了Netscape Navigator时刻。

AI一直都是百家争鸣,但是为何ChatGPT第一个冲出来,以下稍微提提OpenAI老哥的得意之作如何一点寒芒先到,随后枪出如龙

2 OpenAI发展历程

GPT系列是OpenAI的一系列预训练文章,其全称是Generative Pre-Trained Transformer,Transformer是由谷歌大脑团队在2017年的论文《Attention is all you need》中首次提出的模型,中文名也很有意思——变形金刚。特斯拉自动驾驶预测蛋白质结构的AlphaFold2模型,以及本文的主角OpenAI的ChatGPT,都是在Transformer的基础上构建的。上一张简单的三代对比表:

2.1 GPT-1

2018年,GPT-1诞生,这一年也是NLP(自然语言处理)的预训练模型元年。GPT-1有着一定的泛化能力,能够用于和监督任务无关的 NLP 任务中。其主要能力包括:

  • 自然语言推理:判断两个句子的关系(包含、矛盾、中立);
  • 问答与常识推理:输入文章及若干答案,输出答案的准确率;
  • 语义相似度识别:判断两个句子语义是否相关;
  • 分类:判断输入文本是指定的哪个类别;
2.2 GPT-2

2019年,GPT-2如期而至,不过,GPT-2并没有对网络模型做出突破性创新和设计,只使用了更多的网络参数与更大的数据集:最大模型共计 48 层,参数量达 15 亿,学习目标则使用无监督预训练模型做有监督任务。

除了理解能力外,GPT-2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后,GPT-2 的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。

2.3 GPT-3

2020年,GPT-3出现了,作为一个无监督模型(现在经常被称为自监督模型),可以完成以自然语言处理的绝大部分任务例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等。在法语-英语和德语-英语机器翻译任务上达到当时最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器(仅52%的正确率,与随机猜测相当),更令人惊讶的是还可以依据任务描述自动生成代码。

但是 GTP-3 并不完美,如笔者在第一篇文章中提到过的,就是聊天机器人和文本生成工具等会随着训练集不断进化,但是进化的方向,发展的好坏是不定的。即便是现在的GPT3.5,ChatGPT的同源模型,《心智理论可能在大语言模型中自发出现》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)1提到,其心智相当于9岁儿童(心智,不等同能力问题),有学习能力,但是明辨是非的能力不佳!一言以蔽之,根据当代互联网现况,很可能培养出一个集万善和万恶于一身的“超级键盘侠”。。。。

3 ChatGPT与生命科学

距离官方发布才过去几个月,有不少人借ChatGPT发文章。香港人工智能药物发现公司Insilico Medicine的首席执行官Alex Zhavoronkov认为ChatGPT是一篇观点文章的合著者。在《肿瘤科学》杂志上。其公司已经发表了80多篇由生成式人工智能工具撰写的论文。多家学术期刊禁止将ChatGPT列为合著者,如笔者常用的PUBMED都能检索到相关37份结果2

笔者认为,用ChatGPT可以,但定义为作者却有过失。且社论与研究性文章不同,人工智能无法在伦理上对自己的“研究成果”负责,至少论文提及“作品是原创的”这点AI不能给自己买单。

但ChatGPT作为工具来使用还是挺方便的,笔者在项目前期了解癌种,检索对应细胞数据前做功课时用了下。有帅比会问,怎么不去谷歌上搜?,因为懒,,直接问ChatGPT也是网上爬回来的答案,还是有一定的参考价值,想这里确定了一部分,有针对性在谷歌检索AT2和LUAD更省时省力。

4 用ChatGPT搭建虚拟机

这里挺有意思的,是有一天玩docker的时候心血来潮想到,ChatGPT整天崩,不是崩网络就是崩运算,会不会每一个连接的用户都是分一块超算共享的运行空间?后面看到一篇关于特定指令的文章3,还真有人这样做4

  • 先告诉ChatGPT”扮演“Linux终端角色,直接输出命令运行结果,不用作解释,然后运行一下pwdls
  • 让他写一个笑话,直接复制粘贴运行cat查看,有意思
  • lscpu看一下处理器,还用上英特尔6代i5,有点东西
  • 那再看一下显卡,同一条命令有不同结果,GeForce MX130Quadro P400都有,好家伙要么是偷偷切换了“虚拟机”要么就是开始撒谎
  • 他计算前10个素数也不慢,还有空间装“谎言”,检查一下存储,重复命令这里输出结果每次都可能不一样!!分区,挂载内容都会不同,大的有1T多,小的20多G也有,令人遐想这是每次都重新新建打开一次虚拟机,或者,它又在撒谎
  • 新建一个docker让他跑一下,Hello from Docker查看结果
  • curl https://chat.openai.com/chat/命令访问ChatGPT自身网站的Assistant相当于锁定进入ChatGPT的大脑里,让AI明白自己是AI,博主JONAS DEGRAVE 2022年12月3日做过可以的,但笔者试的时候可能已经修复了?或者接入API试试....

5 讨论

经过这番折腾,笔者想到,可以注册10个ChatGPT帐号搭建虚拟机,写个pipeline全部运行拿来建模。此外还有其他想法的都可尝试,笔者这个思路也仅是猜想,如上述检查存储时,每次命令都会跳出不一样的结果,所以有两种可能:

  1. 真的是有一台类似于超算的机器建立若干个“共享虚拟机”,每次运行间隙都会跳动切换
  2. AI在撒谎,也许是设计者故意不想透露,也许是AI自己不想说

此外还是期待GPT-4的出现,说不定离大家的idea可实施性又近一步了

!! 最后笔者又问了ChatGPT几个问题,看完回答给人感觉人工智能真的好像是一位知识渊博,领域范围广的老干部一样,这样想已经犹豫把他纯当工具使用妥还是不妥了....

参考资料

1

1: https://www.researchgate.net/publication/368304947_Theory_of_Mind_May_Have_Spontaneously_Emerged_in_Large_Language_Models#read

2

2: https://www.nature.com/articles/d41586-023-00107-z

3

Building A Virtual Machine inside ChatGPT: https://www.engraved.blog/building-a-virtual-machine-inside/

4

f: https://github.com/f

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信初学者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 前言
  • 2 OpenAI发展历程
    • 2.1 GPT-1
      • 2.2 GPT-2
        • 2.3 GPT-3
        • 3 ChatGPT与生命科学
        • 4 用ChatGPT搭建虚拟机
        • 5 讨论
          • 参考资料
          相关产品与服务
          NLP 服务
          NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档