首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2140
文章
1960496
阅读量
188
订阅数
独家 | 聊天机器人开发中的机器学习(附链接)
作者:Omkar Prabhune 翻译:方星轩 校对:王雨桐 本文约2800字,建议阅读5分钟本文作者从聊天机器人的种类、用途以及架构等角度介绍目前的聊天机器人技术,并在文末分享了一些聊天机器人行业的例子。 标签:聊天机器人,神经网络,自然语言处理NLP 本文将详细介绍聊天机器人的类型、它们的开发以及背后原理。 首先让我们先了解一些基础知识。聊天机器人(对话式 AI)是一种自动化程序,可通过文本消息、语音聊天来模拟人类对话。它根据大量输入和自然语言处理 (NLP) 学习如何做到这一点。 今天的聊天机器人在
数据派THU
2023-03-29
6980
【2023新书】数据科学的数学基础
📷 来源:专知本文为书籍介绍,建议阅读5分钟这本教材旨在从数学的角度指出数据分析的最重要的原则。 📷 这本教材旨在从数学的角度指出数据分析的最重要的原则。具体来说,它选择了这些问题进行探索:哪些是理解
数据派THU
2023-03-29
2380
【牛津大学博士论文】量子自然语言处理范畴论
来源:专知本文为论文介绍,建议阅读5分钟本文介绍了量子自然语言处理(QNLP)模型,其基础是计算语言学和量子力学之间的一个简单而强大的类比:语法纠缠。 本文介绍了量子自然语言处理(QNLP)模型,其基础是计算语言学和量子力学之间的一个简单而强大的类比:语法纠缠。文本和句子的语法结构将单词的含义联系起来,就像纠缠结构将量子系统的状态联系起来一样。范畴论可以使这种语言到量子比特的类比形式化:它是一个从语法到向量空间的monoidal函子。将这种抽象的类比转化为具体的算法,将语法结构转换为参数化量子电路的架构。
数据派THU
2023-03-29
2260
【DTU博士论文】面向自然语言处理的深度潜变量模型
来源:专知本文为论文介绍,建议阅读5分钟本文探索先进的优化方法和潜变量模型的设计,以完成自然语言处理任务。 多人工智能任务的改进。隐变量模型提供了一个优雅的框架,以新的功能来增强生成算法。然而,在自然语言处理领域,尚不清楚如何最好地将潜变量与强大且无处不在的语言模型相结合。 https://vlievin.github.io/deep-lvms-for-nlp.pdf 本文探索先进的优化方法和潜变量模型的设计,以完成自然语言处理任务。全文共分为三个部分。在第一部分中,我们提出了隐变量语言模型的三种结构。本
数据派THU
2023-03-29
2580
知乎精选 | ChatGPT与数学优化
来源:运筹or帷幄‍‍‍本文约2200字,建议阅读9分钟ChatGPT的准确性和速度以及处理复杂任务的能力使其成为一种非常有用的工具。 作者信息:宋志刚,中国科学院大学物理学博士 一、引言 ChatGPT是一个由OpenAI训练的大型语言生成模型,基于最先进的Transformer技术。它可以理解和生成人类语言,因此可以完成多种文本生成任务,例如问答、对话、文本生成、内容摘要等。它的准确性和速度以及处理复杂任务的能力使其成为一种非常有用的工具。 ChatGPT的技术特点包括: 1)自然语言处理能力:可以理
数据派THU
2023-02-24
9300
知乎精选 | ChatGPT与数学优化
来源:运筹or帷幄‍‍‍本文约2200字,建议阅读9分钟ChatGPT的准确性和速度以及处理复杂任务的能力使其成为一种非常有用的工具。 作者信息:宋志刚,中国科学院大学物理学博士 一、引言 ChatGPT是一个由OpenAI训练的大型语言生成模型,基于最先进的Transformer技术。它可以理解和生成人类语言,因此可以完成多种文本生成任务,例如问答、对话、文本生成、内容摘要等。它的准确性和速度以及处理复杂任务的能力使其成为一种非常有用的工具。 ChatGPT的技术特点包括: 1)自然语言处理能力:可以理
数据派THU
2023-02-24
9300
《ChatGPT:利用最先进的技术支撑多域作战》
来源:专知本文约2000字,建议阅读5分钟我们对ChatGPT带来的可能性感到兴奋。 ChatGPT是一个建立在GPT-3大型自然语言模型上的人工智能驱动的聊天机器人,自OpenAI于2022年11月推出以来,已经风靡全球。它是历史上增长最快的消费者应用程序,在1月份,即推出后仅两个月,估计有1亿月度活跃用户。 它引发了一场兴趣和争议的风暴,在包括教育、娱乐、新闻、制造、科技和艺术等广泛的行业和领域中展开了激烈的辩论。瑞安-雷诺兹用它写了一个薄荷手机广告(一个相当有效的广告),在线媒体公司Buzzfeed
数据派THU
2023-02-24
6950
《ChatGPT:利用最先进的技术支撑多域作战》
来源:专知本文约2000字,建议阅读5分钟我们对ChatGPT带来的可能性感到兴奋。 ChatGPT是一个建立在GPT-3大型自然语言模型上的人工智能驱动的聊天机器人,自OpenAI于2022年11月推出以来,已经风靡全球。它是历史上增长最快的消费者应用程序,在1月份,即推出后仅两个月,估计有1亿月度活跃用户。 它引发了一场兴趣和争议的风暴,在包括教育、娱乐、新闻、制造、科技和艺术等广泛的行业和领域中展开了激烈的辩论。瑞安-雷诺兹用它写了一个薄荷手机广告(一个相当有效的广告),在线媒体公司Buzzfeed
数据派THU
2023-02-24
6950
张俊林:由ChatGPT反思大语言模型(LLM)的技术精要
来源:Datawhale 夕小瑶的卖萌屋本文约28000字,建议阅读25分钟本文介绍了ChatGPT反思大语言模型。 ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large Language Model)效果能好成这样;惊醒是顿悟到我们对LLM的认知及发展理念,距离世界最先进的想法,差得有点远。我属于既惊喜又惊醒的那一批,也是典型的中国人,中国人善于自我反思,于是开始反思,而这篇文章正是反思的结果。 实话实说,国内在LLM模型相关技术方面,此刻,距离最先进技术的差距进一步
数据派THU
2023-02-23
7800
别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出
来源:机器之心本文约4200字,建议阅读8分钟ChatGPT加持的新必应没有想象中那么完美。 这些天看下来,在与谷歌 Bard 加持的搜索引擎较量中,微软基于 ChatGPT 的新必应似乎完全占据了上风。但仍不禁要问,新必应的搜索结果真的无懈可击吗?最近有来自新加坡南洋理工大学和新加坡技术设计大学的NLP研究者深扒了微软发布会上搜索演示的细节,并揪出了很多错误。 2 月 8 号美东时间八点半,谷歌发布会在巴黎召开。前一天微软正式推出了新一代 AI 驱动搜索引擎 New Bing,把基于 ChatGPT 技术
数据派THU
2023-02-23
2440
超详超硬Jeff Dean万字总结火热出炉!图解谷歌2022年AIGC、LLM、CV三大领域成就
来源:深度学习与图网络 本文约7500字,建议阅读15分钟 本文总结了2022年谷歌在ML领域取得的新进展。 2022年,谷歌在机器学习方面有什么进展? Google Research高级研究员兼高级副总裁Jeff Dean一文帮你总结! Jeff Dean代表Google Research社区发布一篇干货满满的长文,总结了谷歌在2022年激动人心的新进展。 显然,大佬花了很久(也许是一年),酝酿了一个大的。 在这次的第一篇中,Jeff Dean首先讨论了语言、生成、视觉和多模态模型。 接下来,他还将讨
数据派THU
2023-02-23
3490
超详超硬Jeff Dean万字总结火热出炉!图解谷歌2022年AIGC、LLM、CV三大领域成就
来源:深度学习与图网络 本文约7500字,建议阅读15分钟 本文总结了2022年谷歌在ML领域取得的新进展。 2022年,谷歌在机器学习方面有什么进展? Google Research高级研究员兼高级副总裁Jeff Dean一文帮你总结! Jeff Dean代表Google Research社区发布一篇干货满满的长文,总结了谷歌在2022年激动人心的新进展。 显然,大佬花了很久(也许是一年),酝酿了一个大的。 在这次的第一篇中,Jeff Dean首先讨论了语言、生成、视觉和多模态模型。 接下来,他还将讨
数据派THU
2023-02-23
3490
NeurIPS'22|Hinton团队开源:用一个统一的接口处理四大视觉任务
来源:极市平台 本文约1800字,建议阅读5分钟 本文提出了一种将四个看似不同的视觉任务(目标检测,实例分割,关键点检测,图像描述)统一在单个像素到序列界面中的方法。 论文链接:https://arxiv.org/pdf/2206.07669v2.pdf 源码链接:https://github.com/google-research/pix2seq 简介 训练能够执行无数个任务的单个神经网络模型是迈向通用人工智能的重要一步。在NLP领域,许多NLP相关任务都可以统一在大型语言模型下进行。主要原因是这些任务
数据派THU
2023-02-23
2520
深度学习和经典统计学是一回事?
来源:机器之心 本文约7000字,建议阅读10+分钟 本文会解释为什么深度学习的基础其实不同于统计学,甚至不同于经典的机器学习。 深度学习和简单的统计学是一回事吗?很多人可能都有这个疑问,毕竟二者连术语都有很多相似的地方。在这篇文章中,理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异,认为“如果纯粹从统计学角度认识深度学习,就会忽略其成功的关键因素”。 图源:https://twitter.com/YiMaTweets/status/155391346418
数据派THU
2022-10-11
5850
独家 | 使用ONNX搭建NLP Transformers pipelines
作者:Thomas Chaigneau 翻译:欧阳锦校对:和中华 本文约3000字,建议阅读7分钟本文介绍了如何使用ONNX构建真实世界的NLP应用。 如何用ONNX构建真实世界的NLP应用,而不仅仅是为了张量做基准测试。 图片源自网络 ONNX是一种用于神经网络的机器学习格式。它是可移植的,开源的,并且在不牺牲准确性的情况下提高推理速度,真的很厉害。 我发现了很多关于ONNX基准的文章,但没有一篇文章介绍将其用于真实世界NLP任务的简便方法。我还在Hugging Face的discord server
数据派THU
2022-10-09
8260
【Manning新书】自然语言处理入门
来源:专知本文为书籍介绍,建议阅读5分钟这本书可以通过一系列的实际应用作为一个全面的指南。 我写这本书的主要目的是帮助你了解NLP领域是多么令人兴奋,在这个领域工作的可能性是多么无限,以及现在的门槛是多么低。我的目标是帮助你轻松开始在这个领域,并向你展示你可以在几天内实现多么广泛的不同的应用,即使你以前从未在这个领域工作过。这本书可以通过一系列的实际应用作为一个全面的指南,如果你只对一些实际任务感兴趣,也可以作为参考书。到你读完这本书的时候,你就已经学会了: https://www.manning.com
数据派THU
2022-09-27
3170
独家 | GPT-3“知道”我什么?
作者:Melissa Heikkilä  翻译:顾伟嵩校对:欧阳锦 本文约5800字,建议阅读10+分钟本文详细介绍了大型语言网络的隐私安全问题。 大型语言模型是根据从互联网上收集的大量个人数据进行训练的。所以我想知道:它对我有什么影响? 对于一位报道AI的记者来说,今年最大的新闻之一是大型语言模型的兴起。这些人工智能模型生成了本是人类才能写出的文本,有时非常令人信服,他们欺骗了人们,让他们认为自己是有意识的。 这些模型的力量来自于从互联网上收集的大量公开的人造文本。这不禁让我思考:这些模型拥有关于我的什
数据派THU
2022-09-20
3450
原创 | 一文读懂 BERT 源代码
文:陈之炎 本文约4400字,建议阅读10+分钟本文对BERT模型预训练任务的源代码进行了详细解读,在Eclipse开发环境里,对BERT 源代码的各实现步骤分步解析。 BERT模型架构是一种基于多层双向变换器(Transformers)的编码器架构,在tensor2tensor库框架下发布。由于在实现过程当中采用了Transformers,BERT模型的实现几乎与Transformers一样。 BERT预训练模型没有采用传统的从左到右或从右到左的单向语言模型进行预训练,而是采用从左到右和从右到左的双向语言
数据派THU
2022-09-14
5450
【MIT博士论文】利用临床和生物医学表征学习的结构和知识
来源:专知本文为论文介绍,建议阅读5分钟在本文中,我将探索新的生物医学数据预训练和表示学习策略,这些策略利用外部结构或知识来为局部和全局尺度的学习提供信息。 用于健康和生物医学领域的机器学习的数据集通常是有噪声的,采样不规律,只有稀疏的标记,相对于数据和任务的维度都很小。这些问题推动了表示学习在这个领域的应用,它包含了各种技术,旨在产生适合下游建模任务的数据集表示。该领域的表示学习还可以利用生物医学领域的重要外部知识。在本文中,我将探索新的生物医学数据预训练和表示学习策略,这些策略利用外部结构或知识来为局
数据派THU
2022-09-14
3240
Yann LeCun:语言的有限性决定了 AI 永远无法比肩人类智能
来源:AI科技评论本文约4100字,建议阅读7分钟寻找人工智能中的常识(common sense)是比关注语言更重要的任务。 前段时间,谷歌工程师声称自家的 AI 聊天机器人 LaMDA  具有了意识,引发了一片混乱。 LaMDA 是一种大型语言模型(LLM),能够基于任何给定文本预测出可能出现的下一个单词。许多对话在某种程度上都很容易预测,所以这种系统可以推动并保持对话流畅地进行。LaMDA 在这一点上表现非常出色,以至于这位叫 Blake Lemoine 的工程师开始怀疑它产生了类人的知觉。 随着 L
数据派THU
2022-09-08
1740
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档