自然语言处理(Natural Language Processing,简称NLP)是一种人工智能技术,它是指让计算机能够理解、处理和生成自然语言的能力
在自然语言处理(NLP)项目中,“数据决定上限,模型决定下限”。高质量、大规模、标注精准的数据是构建高性能 NLP 系统的前提。本章将系统介绍 NLP 项目全生...
自然语言处理应用的第一步通常是分词,即将输入字符串分割成语义相关的单元。在许多应用中,这些单元比单个单词更小。例如,与查询“文字处理”高度匹配的搜索结果可能使用...
深度学习框架是构建自然语言处理(NLP)模型的基础设施。目前,TensorFlow/Keras 与 PyTorch 是两大主流选择,它们在设计理念、开发体验和部...
随着Alexa等语音合成服务的普及,文本规范化 (TN) 已成为文本转语音流程的首要步骤。TN将原始文本(如字符串“6-21-21”)转换为口头化形式(如“tw...
自然语言处理(NLP)的工程落地离不开强大而丰富的 Python 生态系统。从基础数据处理、文本清洗,到词向量训练、预训练模型微调,Python 提供了覆盖全流...
随着人工智能从“单模态感知”迈向“多模态认知”,多模态预训练模型(Multimodal Pre-trained Models) 成为连接语言、视觉、听觉等信息的...
在2021年欧洲计算语言学协会会议(EACL)上,我们的论文《不可靠新闻检测数据集中的隐藏偏见》获得了最佳长文论文的荣誉提名。在这篇论文中,我们研究了研究社区用...
生成式预训练模型(Generative Pre-trained Models)是自然语言处理(NLP)迈向通用人工智能的关键一步。与仅能“理解”语言的判别式模型...
随着共享出行行业的规范化发展,网约车平台对车辆合规性的审核需求日益严苛。《网络预约出租汽车运输证》(以下简称“运输证”)作为车辆合法运营的核心凭证,其信息的自动...
Saxon在亚利桑那州立大学完成了电气工程的本科学位,并获得了计算机工程硕士学位。他目前正在加州大学圣塔芭芭拉分校完成计算机科学博士学位,核心研究聚焦于自然语言...
命名实体是一个由单个或多个标记组成的连续片段,具有"人物"、"地点"或"组织"等标签类型。命名实体识别算法需要在标注数据(如OntoNotes)上进行训练。
BERT(Bidirectional Encoder Representations from Transformers)是自然语言处理(NLP)领域具有里程碑...
手写文字识别(Handwritten Text Recognition, HTR)是模式识别领域一个历史悠久且极具挑战性的课题。与印刷体不同,手写体具有极大的可...
<font size=1>一种依赖于逆强化学习(即通过示范学习)的技术,在仿真中将任务完成率提高了14%到17%。</font>
🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
获奖者来自八个国家的30多所大学。获奖者将能够访问某机构公共数据集,以及某机构云服务的AI/ML服务和工具。