首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑运作机制,但不是通过反向传播

而我们正在使用神经网络基本上是相反它们很多经验,并试图把输入输出信息联系到参数中。认为反向传播比大脑使用方法更有效,但并不擅长从不多数据中抽象出很多结构。...它们必须做完全相同事情,这意味着最好是数字化或者基本数字化,它们会做一些事情,比如把数字相乘,这需要消耗很多很多能量来使运算变得非常谨慎,而这不是硬件目标。...你肯定要有结构,如果你说符号计算只是你部分整体结构,那么我们就是符号计算。...如果消极例子里没有这个结构,但在积极例子里那么这个结构就是关于消极例子积极例子之间区别,而不是你连接方式。...所以,尽管人们对这一点没有太多思考,但如果强大学习算法,你最好不要让它们学习神经网络自己权重连接。 Abbeel:你还提到了「学生模型打败老师模型」概念。这是什么意思?

37210

万字长文解释 ChatGPT 在做什么,以及为什么它能发挥作用?

值得注意是,当 ChatGPT 一些事情,比如写一篇文章时,它所做基本上只是反复询问 “鉴于到目前为止文本,下一个词应该是什么?” —— 而且每次都增加一个词。...因此,如果我们把这里每个像素灰度值当作某个变量 xi,是否一些所有这些变量函数,在评估时告诉我们这个图像是什么数字?事实证明,可能构建这样一个函数。不足为奇是,这并不特别简单。...在数学术语中,如果一个神经元输入 x = {x1, x2 …… },那么我们计算 f[w.x + b],其中权重 w 常数 b 通常为网络中每个神经元选择不同;函数 f 通常是相同。...像 ChatGPT 这样能力似乎令人印象深刻,人们可能会想象,如果人们能够 “继续下去”,训练越来越大神经网络,那么它们最终将能够 “任何事情”。...如果一个足够大神经网络,那么,是的,你可能能够任何人类能够轻易做到事情。但是,你不会捕捉到自然界一般能做事情 —— 或者我们从自然界塑造工具能做事情

1.1K20
您找到你想要的搜索结果了吗?
是的
没有找到

这篇文章把ChatGPT工作原理说清楚了!

值得注意是,当 ChatGPT 一些事情,比如写一篇文章时,它所做基本上只是反复询问 “鉴于到目前为止文本,下一个词应该是什么?” —— 而且每次都增加一个词。...因此,如果我们把这里每个像素灰度值当作某个变量 xi,是否一些所有这些变量函数,在评估时告诉我们这个图像是什么数字?事实证明,可能构建这样一个函数。不足为奇是,这并不特别简单。...在数学术语中,如果一个神经元输入 x = {x1, x2 …… },那么我们计算 f[w.x + b],其中权重 w 常数 b 通常为网络中每个神经元选择不同;函数 f 通常是相同。...像 ChatGPT 这样能力似乎令人印象深刻,人们可能会想象,如果人们能够 “继续下去”,训练越来越大神经网络,那么它们最终将能够 “任何事情”。...如果一个足够大神经网络,那么,是的,你可能能够任何人类能够轻易做到事情。但是,你不会捕捉到自然界一般能做事情 —— 或者我们从自然界塑造工具能做事情

43230

fast.ai 机器学习笔记(四)

然后如果我们在这里进一步,另一个带有权重 w2 线性层,现在计算对所有参数导数没有区别。我们仍然可以使用完全相同链式法则。 所以不要把多层网络想象成在不同时间发生事情。它只是函数组合。...顺便说一句,实际上还有第二个参数(r_adj=10),它是对 r 相同事情,实际上是通过一个参数除以 r,现在不会太担心,但这是另一个您可以用来调整正则化性质参数。...='0' 我们很多不同表需要将它们全部合并在一起。一种用 Pandas 合并事物标准方法只是使用了 Pandas 合并函数,具体来说总是进行左连接。...其中一个它们定义为整个训练集,另一个它们定义为一个随机子集。所以我想法是,在样本上所有的工作,确保一切都运行良好,尝试不同超参数架构。...因此,如果我们添加了一点权重衰减,比如 1e-7,那么这就表示这些解决方案不再是完全相同最好解决方案是参数最小且彼此最相似的解决方案,这将使其再次成为一个良好损失函数

10910

干货 | 如何写一个更好Python函数

如果需要计算新或不同统计数据,或者需要改变输出格式,就需要对这个函数进行调整。 所以,这个函数最好写成两个独立函数一个用来执行并返回计算结果,另一个用来获取这些结果并打印出来。...这种处理方式,不仅能让测试函数更容易,并且还允许这两个部分了迁移性,如果合适的话,还可能一起应用到不同模块中。 在编程中,你会发现好多函数都可以很多很多事情。...当给定函数没有返回值时,一些常见原因: “它所做只是[一些与I / O相关事情,比如将一个值保存到数据库中]。不能返回任何有用东西。” 不同意。如果操作顺利完成,函数可以返回True。...那么如果函数太长,应该怎么?重构。这会改变程序结构而不改变其行为。 从一个函数中提取几行代码,并把它们变成自己函数。这是缩短长函数最快、也是最常见方式。...在命令式编程(编写Python代码时所做那种)中,它们是所有函数中最安全函数它们也很容易被测试维护,甚至比只是幂等函数更重要是,测试它们基本上可以执行它们一样快。

59520

干货 | 如何写一个更好Python函数

如果需要计算新或不同统计数据,或者需要改变输出格式,就需要对这个函数进行调整。 所以,这个函数最好写成两个独立函数一个用来执行并返回计算结果,另一个用来获取这些结果并打印出来。...这种处理方式,不仅能让测试函数更容易,并且还允许这两个部分了迁移性,如果合适的话,还可能一起应用到不同模块中。 在编程中,你会发现好多函数都可以很多很多事情。...当给定函数没有返回值时,一些常见原因: “它所做只是[一些与I / O相关事情,比如将一个值保存到数据库中]。不能返回任何有用东西。” 不同意。如果操作顺利完成,函数可以返回True。...那么如果函数太长,应该怎么?重构。这会改变程序结构而不改变其行为。 从一个函数中提取几行代码,并把它们变成自己函数。这是缩短长函数最快、也是最常见方式。...在命令式编程(编写Python代码时所做那种)中,它们是所有函数中最安全函数它们也很容易被测试维护,甚至比只是幂等函数更重要是,测试它们基本上可以执行它们一样快。

59510

怎样才能写好一个 Python 函数

如果需要计算新或不同统计数据,或者需要改变输出格式,就需要对这个函数进行调整。 所以,这个函数最好写成两个独立函数一个用来执行并返回计算结果,另一个用来获取这些结果并打印出来。...这种处理方式,不仅能让测试函数更容易,并且还允许这两个部分了迁移性,如果合适的话,还可能一起应用到不同模块中。 在编程中,你会发现好多函数都可以很多很多事情。...当给定函数没有返回值时,一些常见原因: “它所做只是[一些与 I/O 相关事情,比如将一个值保存到数据库中]。不能返回任何有用东西。” 不同意。...如果它是纯函数或是幂等(下面讨论) ,它也可能是短那么如果函数太长,应该怎么?重构。这会改变程序结构而不改变其行为。 从一个函数中提取几行代码,并把它们变成自己函数。...在命令式编程(编写 Python 代码时所做那种)中,它们是所有函数中最安全函数它们也很容易被测试维护,甚至比只是幂等函数更重要是,测试它们基本上可以执行它们一样快。

55920

Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑运作机制,但不是通过反向传播

而我们正在使用神经网络基本上是相反它们很多经验,并试图把输入输出信息联系到参数中。认为反向传播比大脑使用方法更有效,但并不擅长从不多数据中抽象出很多结构。...它们必须做完全相同事情,这意味着最好是数字化或者基本数字化,它们会做一些事情,比如把数字相乘,这需要消耗很多很多能量来使运算变得非常谨慎,而这不是硬件目标。...你肯定要有结构,如果你说符号计算只是你部分整体结构,那么我们就是符号计算。...如果消极例子里没有这个结构,但在积极例子里那么这个结构就是关于消极例子积极例子之间区别,而不是你连接方式。...所以,尽管人们对这一点没有太多思考,但如果强大学习算法,你最好不要让它们学习神经网络自己权重连接。 Abbeel:你还提到了「学生模型打败老师模型」概念。这是什么意思?

73420

QT5C++ 11:Lambda是你朋友(翻译文)

在connect方法调用中使用SIGNALSLOT是连接函数名称宏,出于我们目的,先让假设它是魔法。 那么,信号/槽机制什么问题? 这个没有什么损坏,对吧? 它工作原理…猜。...问题2: 为什么必须定义三个方法基本相同事情?...,它们对不同文本做了基本相同操作,并用一个函数替换了它。...如果您不熟悉它们,可以通过搜索找到大量信息,但简单回答是,它们基本上是内联、未命名函数。...; }); } }; 这是一个比我们原来三个槽类更优雅解决方案。 附加说明 当然,并非一切都是完美的。在使用指向函数指针lambdas作为槽时,一些事情需要记住。

1.6K10

为什么对ChatGPT、ChatGLM这样大语言模型说“你是某某领域专家”,它回答会有效得多?(一)

最终结果是,它生成了一个可能跟随单词排名列表,以及“概率”: 值得注意是,当 ChatGPT 类似写文章之类事情时,它本质上只是一遍又一遍地询问“给定到目前为止文本,下一个单词应该是什么?...然而,为了更进一步,我们需要做不仅仅是随机挑选每个字母。例如,我们知道如果我们一个“q”,那么一个字母基本上必须是“u”。...就像这是我们可以用a + b / x + c sin( x )最好事情: 永远不存在“无模型模型”。...但对于 ChatGPT,我们必须建立一个由人脑产生的人类语言文本模型。对于类似的事情,我们(至少现在)还没有“简单数学”之类东西。 那么模型会是什么样子呢?...如果我们从函数中得到结果通常与人类所说一致,那么我们就有了一个“好模型”。重要科学事实是,对于这样图像识别任务,我们现在基本上知道如何构建执行此操作函数

7110

为什么对ChatGPT、ChatGLM这样大语言模型说“你是某某领域专家”,它回答会有效得多?(二)

想象一下我们 1 2 手写图像: 我们希望所有 1 都“被一个地方吸引”,而所有 2 都“被另一个地方吸引”。...(值得一提是,“无中间层”或所谓“感知器”网络只能学习基本上是线性函数,但只要有一个中间层,原则上总是可以以任意好精度近似任何函数,至少如果有足够神经元,尽管为了使其可训练性可行,通常需要一些正则化或归一化方法...在未来,是否会出现基本上更好训练神经网络方法,或者说执行神经网络任务方法认为几乎可以肯定会有。...04—足够大网络可以任何事情!‍‍‍ 类似 ChatGPT 这样系统能力如此令人印象深刻,以至于人们可能会想象,如果能够继续训练更大、更大神经网络,那么它们最终将能够“任何事情”。...嗯,如果我们图像是手写数字图像,我们可能会“认为两个图像相似”,如果它们相同数字。之前我们讨论过一个被训练用于识别手写数字神经网络。

7910

fast.ai 机器学习笔记(一)

不幸是,没有一套你应该总是具体事情,你只需要考虑一下即将做事情结果。这里一个非常简单例子。...但它没有分开是,如果所有变量基本上都是复制一个变量,那么它们看起来都同样重要,但实际上只是一个因素。 这在这里也是正确如果我们一列出现两次,那么对该列进行洗牌不会使模型变得更糟。...在这种情况下,发现制造年份从略优于下一个最好特征(连接器系统)变得更好了,但现在它更好了。因此,它似乎确实改变了这些特征重要性,并希望能给我一些更多见解。 问题:那么这如何帮助我们模型呢?...去除冗余特征[54:57] 我们已经看到,基本上测量相同事物变量会混淆我们变量重要性。它也会使我们随机森林稍微不那么好,因为需要更多计算来同样事情,还有更多列要检查。...所以这意味着不是可以去掉它们两个,而是可以去掉其中一个,因为它们基本上在衡量同一件事情

31910

码如其人,小老弟,你能写一手漂亮Python函数

也就是说,一个函数应该只一件事。这么一大原因是:如果每个函数一件事,那么只有在函数那件事方式必须改变时,该函数才需要改变。...当一个函数可以被删除时,事情就好办了:如果其他地方发生改动,不再需要该函数单一功能,那么只需将其删除。 举个例子来解释一下。...最好将该函数写成两个独立函数一个用来执行并返回计算结果;另一个用来接收结果并将其打印出来。...在编写函数时,遵循这些规则很容易。我们只需要养成编写文档注释习惯,并在实际写函数主体之前完成它们如果你不能清晰地描述这个函数作用是什么那么你需要更多地考虑为什么要写这个函数。...那么如果一个函数太长该怎么办?代码重构(refactor)!代码重构很可能是你写代码时一直在做事情,即使你对这个术语并不熟悉。它含义是:在不改变程序行为前提下改变程序结构。

47620

码如其人,同学你能写一手漂亮Python函数

也就是说,一个函数应该只一件事。这么一大原因是:如果每个函数一件事,那么只有在函数那件事方式必须改变时,该函数才需要改变。...当一个函数可以被删除时,事情就好办了:如果其他地方发生改动,不再需要该函数单一功能,那么只需将其删除。 举个例子来解释一下。...最好将该函数写成两个独立函数一个用来执行并返回计算结果;另一个用来接收结果并将其打印出来。...在编写函数时,遵循这些规则很容易。我们只需要养成编写文档注释习惯,并在实际写函数主体之前完成它们如果你不能清晰地描述这个函数作用是什么那么你需要更多地考虑为什么要写这个函数。...那么如果一个函数太长该怎么办?代码重构(refactor)!代码重构很可能是你写代码时一直在做事情,即使你对这个术语并不熟悉。它含义是:在不改变程序行为前提下改变程序结构。

56830

码如其人,同学你能写一手漂亮Python函数

也就是说,一个函数应该只一件事。这么一大原因是:如果每个函数一件事,那么只有在函数那件事方式必须改变时,该函数才需要改变。...当一个函数可以被删除时,事情就好办了:如果其他地方发生改动,不再需要该函数单一功能,那么只需将其删除。 举个例子来解释一下。...最好将该函数写成两个独立函数一个用来执行并返回计算结果;另一个用来接收结果并将其打印出来。...在编写函数时,遵循这些规则很容易。我们只需要养成编写文档注释习惯,并在实际写函数主体之前完成它们如果你不能清晰地描述这个函数作用是什么那么你需要更多地考虑为什么要写这个函数。...那么如果一个函数太长该怎么办?代码重构(refactor)!代码重构很可能是你写代码时一直在做事情,即使你对这个术语并不熟悉。它含义是:在不改变程序行为前提下改变程序结构。

44220

码如其人,同学你能写一手漂亮Python函数

也就是说,一个函数应该只一件事。这么一大原因是:如果每个函数一件事,那么只有在函数那件事方式必须改变时,该函数才需要改变。...当一个函数可以被删除时,事情就好办了:如果其他地方发生改动,不再需要该函数单一功能,那么只需将其删除。 举个例子来解释一下。...最好将该函数写成两个独立函数一个用来执行并返回计算结果;另一个用来接收结果并将其打印出来。...在编写函数时,遵循这些规则很容易。我们只需要养成编写文档注释习惯,并在实际写函数主体之前完成它们如果你不能清晰地描述这个函数作用是什么那么你需要更多地考虑为什么要写这个函数。...那么如果一个函数太长该怎么办?代码重构(refactor)!代码重构很可能是你写代码时一直在做事情,即使你对这个术语并不熟悉。它含义是:在不改变程序行为前提下改变程序结构。

48420

服务端 IO 性能大比拼:Node、PHP、Java Go

对于阻塞调用,你程序多等待了1000万倍时间。 ? 内核提供了阻塞I/O(“从网络连接中读取并把数据给我”)非阻塞I/O(“当这些网络连接有新数据时就告诉”)这两种方法。...每次你都需要做一些涉及I/O事情,发出请求或者提供一个当完成时Node会调用回调函数。 在求中进行I/O操作典型Node代码,如下所示: ? 可以看到,这里两个回调函数。...第一个会在请求开始时被调用,而第二个会在文件数据可用时被调用。 这样基本上给了Node一个在这些回调函数之间有效地处理I/O机会。...n=100),并以十六进制形式打印生成散列。选择了这个示例,是因为使用一些一致I/O一个受控方式增加CPU使用率来运行相同基准测试是一个非常简单方式。...作为比较,如果只考虑影响性能和易用性几个重要因素,可以得到: ? 线程通常要比进程更高内存效率,因为它们共享相同内存空间,而进程则没有。

1.5K40

手把手教你学会Python函数式编程

如果使用相同参数调用函数两次,则保证返回相同结果。如果你已经学习了数学函数,你就会知道这个好处。这称为参照透明度。由于函数没有副作用,如果你正在构建一个计算某些事情程序,你可以加速程序。...或者求四次方功能呢?我们可以继续写下它们吗?好吧,你可以。但程序员很懒如果你一遍又一遍地重复同样事情,这表明一种更快方法来加快速度,这将使你不再重复。我们可以在这里使用闭包。...(应该尽量找到一种,最好是唯一一种明显解决方案) 在Python中,mapfilter可以执行与列表推导(下面讨论)相同操作。...列表推导 前面,提到过你可以用map或filter任何事情,你可以用列表推导。列表推导是一种在Python中生成列表方法。...事实上,如果你想尝试生成某种列表,那么使用列表推导看起来会更清晰,更容易。如果我们想要将列表中每个0以下数字平方怎么办?了lambda,mapfilter你会写: 这似乎很长很复杂。

1.1K20

AI教父Hinton最新采访万字实录:ChatGPTAI过去现在与未来

现在,如果你展示足够多猫,当你展示一只鸟时,它会说鸟;当你展示一只猫时,它会说猫。事实证明,这种方法比手动连接特征检测器要有效得多。 这就是学生在图像数据库上所做事情。...这就是我们如何让一只鸟跳舞它们可以共享识别鸟所有连接权重,一个可以学会识别猫,另一个可以学会识别鸟,它们可以共享它们连接权重,这样每个模型都可以两件事。...这正是这些大型语言模型所做它们在共享。但这种方法只适用于数字计算机,因为它们必须能够模拟相同事物。而不同生物大脑无法相互模拟,因此它们无法共享连接。 问:为什么我们不坚持使用数字计算机呢?...认为接下来会发生一件事是,我们将朝着能够理解不同世界观系统发展,并且能够理解,好吧,如果你有这个世界观,那么这就是答案。而如果另一个世界观,那么答案就是另一个。我们得到我们自己真相。...另一个发生事情是,一个叫做「加拿大高等研究所」组织,为加拿大擅长领域教授提供额外资金,并为分布在不同地方教授提供相互交流资金,例如温哥华多伦多,也与美国、英国以色列等其他地区研究人员互动

47810

【软件架构】Michael Perry关于不可变架构、CAP定理CRDTs

认为这是我们作为程序员通常事情,除非我们主要从事函数式编程。很好奇你为什么这么认为?为什么我们默认为可变系统? 迈克尔·佩里:两个原因。第一,这就是世界运作方式。我们看到事情一直在变化。...你可能有来自提款机网络或信用卡机交易,还有那些我们不知道或者我们知道会发生事情,但它们仍然被保存在某处等等。 想当时不知道“最终一致性”这个词,但这基本上就是我们要处理问题。...再一次,发现这真的很有趣。那么,这样目的是什么? 迈克尔·佩里:认为这是使这种架构发挥作用基石之一。通常,如果我们使用是关系数据库,我们将有一个自动递增ID作为列之一。...因此,如果可以执行两个向无环图集合并集,那么可以保证执行这些操作任意两个节点将实现相同图。 现在有一个CRDT另一个方面,以前没有提到过。这是一个投影函数。...作为一名应用程序开发人员,如果你能给我一组历史事实,可以把它们组织成一个向无环图,你给我一个投影函数,告诉如何向你用户显示这个向无环图,那么这就是所需要可以解决最终一致性很强问题,可以在节点之间同步数据

28820
领券