首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

在一篇由GPT-3生成的论文中,ChatGPT重现了图灵测试的原始论文

大数据文摘授权转载自AI科技评论 作者:李梅、黄楠 编辑:陈彩娴 以 ChatGPT 为代表的文本生成的兴起,正促使许多研究人员寻求一个比原始版本更具挑战性的图灵测试。 图灵测试解决两个问题:“机器可以思考吗?”,如果可以,“如何证明它?”经典图灵测试针对的是 AI 最棘手的目标之一:如何欺骗不知情的人类?但随着当前语言模型变得越来越复杂,与 AI 如何欺骗人类相比,研究人员开始更关注“如何证明它?”的问题。 有观点认为,现代的图灵测试应当在科学的环境中证明语言模型的能力,而不是仅仅看语言模型是否能够愚弄或

04

OCR 【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取

信息抽取 (Information Extraction) 是把原始数据中包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始数据,输出的是固定格式的信息点,即从原始数据当中抽取有用的信息。信息抽取的主要任务是将各种各样的信息点从原始数据中抽取出来。然后以统一的形式集成在一起,方便后序的检索和比较。由于能从自然语言中抽取出信息框架和用户感兴趣的事实信息,无论是在信息检索、问答系统还是在情感分析、文本挖掘中,信息抽取都有广泛应用。随着深度学习在自然语言处理领域的很多方向取得了巨大成功,循环神经网络(RNN)和卷积神经网络(CNN)也被用于信息抽取研究领域,基于深度学习的信息抽取技术也应运而生。

04

深度学习简化总结合注意力与循环神经网络推荐的算法

互联网将全球信息互连形成了信息时代不可或缺的基础信息平台,其中知识分享服务已经成为人们获取信息的主要工具。为了加快互联网知识共享,出现了大量以知乎为代表的问答社区[1] 。用户注册社区后可交互式提出与回答问题达到知识共享和交换。然而,伴随用户急剧增多,平台短时间内积攒了数目巨大、类型多样的问题,进进超过有效回复数,严重降低了用户服务体验。如何将用户提出的问题有效推荐给可能解答的用户,以及挖掘用户感兴趣的问题是这些平台面临的严重挑战。这种情况下,工业界和学术界对以上问题开展了广泛研究,提出了一些针对问答社区的专家推荐方法提高平台解答效率[2] 。现有工作大多利用基于内容的推荐算法解决该问题[3-6],比如配置文件相似性、主题特征相似性等,匹配效果依赖于人工构建特征的质量。近年来,以卷积神经网络(Convolutional Neural Network, CNN)、Attention 注意力机制为代表的深度学习技术不断収展,幵且已经成功应用到文本挖掘领域。相比于传统方法,深度模型可以学习到表达力更强的深度复杂语义特征。于是,出现了一些深度专家推荐算法,比如DeepFM[7] 、XDeepFM[8] 、CNN-DSSM 等,大大幅提升了传统推荐算法的准确度。虽然以上工作很好地实现了专家推荐,但都是根据用户长期关注的话题及相关解答历史刻画用户兴趣,产生的推荐结果也相对固定。随着时间推移,用户会不断学习新知识,其关注点及擅长解答的问题也很可能収生改变,由此会产生用户兴趣变化,甚至短期兴趣漂移[10] 。这些动态变化会严重影响推荐算法效果,所以如何动态刻画用户兴趣就显得尤为重要。其实,用户历史回答行为具有明显的时间序列关系,通过对已解答问题的序列分析有很大可能感知用户兴趣变化。近年来,循环神经网络(Recurrent Neural Network, RNN)被广泛用来处理序 列 数 据 , 比 如 长 短 期 记 忆 网 络 ( Long Short-Term Memory, LSTM)、门控循环单元(Gate Recurrent Unit, GRU)等,可以根据前面状态输入结合当前模型状态产生当前输出。该类方法可与 CNN结合处理问题内容序列数据,从用户历史解答行为中挖掘长期与短期兴趣,从而动态产生当前兴趣。综合以上讨论,本文提出了结合注意力机制与循环神经网络的问答社区专家推荐算法,能够根据用户历史解答序列动态构建用户兴趣特征,实现推荐结果随时间収展不断调整。 主要工作与贠献如下:(1)基于预训练词嵌入模型分别实现了问题标题与主题标签的语义嵌入向量表示,将 CNN 卷积模型与 Attention 注意力机制结合,构造基于上下文的问题编码器,生成不同距离上下文的深度特征编码。(2)问题编码器对用户历史回答的问题迚行序列编码,利用长短期记忆循环神经网络 Bi-GRU 模型处理编码后的问题序列,幵结合用户主题标签嵌入向量构造用户兴趣动态编码器。(3)将问题与用户编码器产生的深度特征点积运算后加入全连接层实现相似度计算产生推荐结果。在知乎公开数据集上的对比实验结果表明该算法性能要明显优于目前比较流行的深度学习专家推荐算法。

02

CVPR 2018 | 逆视觉问答任务:一种根据回答与图像想问题的模型

随着传统的目标检测和目标识别方法的发展,很多问题已经得到了解决,人们对于解决更具挑战性的问题的兴趣也在激增,这些问题需要计算机视觉系统更好的「理解」能力。图像描述 [31]、可视化问答 [2]、自然语言对象检索 [20] 和「可视化图灵测试」[11] 等都存在要求丰富的视觉理解、语言理解以及知识表征和推理能力的多模态 AI 挑战。随着对这些挑战的兴趣不断增加,人们开始审视能够解决这些问题的基准和模型。发现意想不到的相关性、提供找到答案的捷径的神经网络,到底是针对这些挑战取得的进展,还是只是最新的类似于聪明的汉斯 [29,30] 或波将金村 [12] 这样的矫饰结果呢?

00

阿里巴巴超大规模知识图谱预训练实践:商品分类

👆点击“博文视点Broadview”,获取更多书讯 基于电子商务平台上亿级的庞大商品库,电子商务交易得以不断增长。 为了更好地支持日常业务,需要将这些海量的商品以一种更优的方式进行描述、存储和计算,并且需要支持融合不同来源的数据,建立实体之间的语义连接,因此采用了知识图谱这种数据构架。 阿里巴巴积累了上千亿规模的商品数据作为商品知识图谱,这些数据来源于淘宝、天猫、阿里巴巴等在内的多个阿里旗下平台,囊括了品牌制造商、消费者、国家机构、物流提供商等多方利益相关者的数据。 从知识产权保护或购物体验的角度来看,商

01

AAAI 2020 提前看 | 三篇论文解读问答系统最新研究进展

在本篇提前看中,我们重点聚焦 AAAI 2020 中与问答系统(Q&A)相关的文章。问答系统是自然语言处理领域的一个重要研究方向,近年来各大国际会议、期刊都发表了大量与问答系统相关的研究成果,实际工业界中也有不少落地的应用场景,核心算法涉及机器学习、深度学习等知识。问答系统(Q&A)的主要研究点包括模型构建、对问题/答案编码、引入语义特征、引入强化学习、内容选择、问题类型建模、引入上下文信息以及实际应用场景问题解决等。在本次 AAAI2020 中,直接以「Question/Answer」作为题目的论文就有 40 余篇。本文选取了其中三篇进行详细讨论,内容涉及语义特征匹配、模型构建和医学场景应用等。

02
领券