NLP中包含连字符的复合名词提取困难 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

入门 NLP 前，你必须掌握哪些基础知识？

AI = 神经网络？这8个技术就不是！

大数据文摘作品编译：傅一洋、丁慧、Aileen AI热潮中，有关神经网络的声音最大。然而，AI远远不止如此。目前在AI技术领域中，投入资金最多的当属对神经网络的研究了。在众人眼中，神经网络技术貌似就是“程序构造的大脑”（虽然比喻很不准确）。神经网络的概念早在20世纪40年代就被提出，但直到现在，人们对于神经元及大脑的工作方式仍然知之甚少，最近几年，科研界关于神经网络技术创新的呼声越来越强，渴望重启神经网络的热潮…… 其实，除了神经网络以外，AI领域中还包含很多更有趣、更新颖，更有前景的技术，文章中就将

现货与新闻情绪：基于NLP的量化交易策略（附代码）

从交易的角度来看，铜的定价取决于金属交易所的供需动态，尤其是伦敦金属交易所（LME）和芝加哥芝加哥商品交易所交易所（CME）。然而，铜的交易价格受到无数因素的影响，其中许多因素很难同时衡量：

Python自然语言处理工具小结

作者：伏草惟存来源：http://www.cnblogs.com/baiboy/p/nltk2.html 1 Python 的几个自然语言处理工具 NLTK:NLTK 在用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的借口，还有分类、分词、除茎、标注、语法分析、语义推理等类库。 Pattern:Pattern 的自然语言处理工具有词性标注工具(Part-Of-Speech Tagger)，N元搜索(n-gram search)，情感分析(senti

NLP之pyhanlp安装及其使用

pyhanlp的github：https://github.com/hankcs/pyhanlp

一文概览NLP句法分析：从理论到PyTorch实战解读

句法分析（Syntactic Parsing）是自然语言处理（NLP）中一个关键且不可或缺的任务。如果我们把自然语言看作一个庞大的建筑，那么句法分析就好比这座建筑的蓝图。正是因为有了这份蓝图，人们才能理解语言的结构，从而更准确地进行语义分析、情感分析或者机器翻译等高级任务。

一篇就够！数据增强方法综述

数据增强(Data Augmentation, DA)缓解了深度学习中数据不足的场景，在图像领域首先得到广泛使用，进而延伸到 NLP 领域，并在许多任务上取得效果。一个主要的方向是增加训练数据的多样性，从而提高模型泛化能力。

自然语言处理背后的数据科学

用Python构建NLP Pipeline，从思路到具体代码，这篇文章一次性都讲到了

授人以鱼不如授人以渔，今天的文章由作者Adam Geitgey授权在人工智能头条翻译发布。不仅给出了具体代码，还一步步详细解析了实现原理和思路。正所谓有了思路，无论是做英语、汉语的语言处理，才算的上有了指导意义。

用Python构建NLP Pipeline，从思路到具体代码，这篇文章一次性都讲到了

从“London”出发，8步搞定自然语言处理（Python代码）

【新智元导读】自然语言处理是AI的一个子领域，从人们日常沟通所用的非结构化文本信息中提取结构化数据，以便计算机理解。本文用通俗易懂的语言深入浅出的介绍了自然语言处理，并用Python实现了几个非常有趣的实例。

2022年必须要了解的20个开源NLP 库

在本文中，我列出了当今最常用的 NLP 库，并对其进行简要说明。它们在不同的用例中都有特定的优势和劣势，因此它们都可以作为专门从事 NLP 的优秀数据科学家备选方案。每个库的描述都是从它们的 GitHub 中提取的。

基于依存句法分析的资金账户交易画像

电网企业资金流动大，交易频繁，属于典型的资金密集型企业。目前电网企业在资金安全管理方面普遍存在资金监控信息化程度低和监督监控不完善等问题。改变现有监控系统低效、信息孤岛的现状，需要构建基于大数据的集安全监控、信息共享、数据分析、决策支撑为一体的资金智能安全防控平台，实现信息化的资金安全管理模式。这一管理模式的实现需要使用自然语言处理（Natural Language Processing, NLP）及机器学习等技术。目前NLP技术的研究主要集中于情感分析方面，多应用于互联网行业。在电力行业，尤其是资金安全管理领域应用存在较多空白。

NLP项目：使用NLTK和SpaCy进行命名实体识别

命名实体识别（NER）是信息提取的第一步，旨在在文本中查找和分类命名实体转换为预定义的分类，例如人员名称，组织，地点，时间，数量，货币价值，百分比等。NER用于自然语言处理（NLP）的许多领域，它可以帮助回答许多现实问题，例如：

Python NLP 入门教程

本文简要介绍Python自然语言处理(NLP)，使用Python的NLTK库。NLTK是Python的自然语言处理工具包，在NLP领域中，最常使用的一个Python库。什么是NLP？简单来说，自然语言处理(NLP)就是开发能够理解人类语言的应用程序或服务。这里讨论一些自然语言处理(NLP)的实际应用例子，如语音识别、语音翻译、理解完整的句子、理解匹配词的同义词，以及生成语法正确完整句子和段落。这并不是NLP能做的所有事情。 NLP实现搜索引擎: 比如谷歌，Yahoo等。谷歌搜索引擎知道你

如何“锚定”NLP模型中的语言智慧？丨长文评析语言探针

事实上，可解释性并没有数学上的严格定义，可以简单理解其为人们能够理解模型决策原因的程度。换句话说，对机器学习模型来说，它的可解释性越高，人们就越容易理解它为什么做出某些决策或预测。

Python 中进行文本分析的 Top 5 NLP 工具

翻译自 Top 5 NLP Tools in Python for Text Analysis Applications 。

NLP札记1

NLP（Natural Language Processing），自然语言处理，是一门融合了计算机科学、人工智能以及语言学的交叉学科。自然语言和编程语言对比自然语言比编程语言的词汇量丰富自然语言是非机构化的；编程语言是结构化的。结构化指的是信息具有明确的结构关系，比如编程语言中具有类和成员、数据库中的表和字段等，都可以通过明确的机制来进行读写。自然语言存在大量的歧义，这些歧义根据语境的不同变现为特定的义项。自然语言容错性高，编程语言中程序员必须保证拼写、语法绝对规范。编程语言的变化缓慢温和

NLP基础任务 - 句法分析简介

作者：nlp初学者小吴 (清华大学) 已获授权链接：https://zhuanlan.zhihu.com/p/565282216 编辑：深度学习自然语言处理公众号句法（Syntactic）分析是NLP的经典任务 Syntactic tasks: Word level Word level的句法分析任务有：形态分析、分词、序列标注形态分析：Morphological analysis，指将一个词的词根（stem）和词缀（prefix & suffix）提取出来的任务分词：Word segmentat

资源 | 知网（HowNet）知识库的简单调用指南

机器之心整理参与：蒋思源机器之心曾采访过语知科技的董强先生，在那一篇文章中，我们详细讨论了基于知网知识库的 NLP 解决方案。虽然我们已经了解了这种方法的潜力，但只有真正实现了调用过程，并明确体会到知网知识库的强大之处，我们才真正对这种方法有一个直观的理解。基于知网（HowNet）知识库的方法在实践和研究中确实大大提升了 NLP 的性能。在最近的 ACL 2017 会议中，清华大学牛艺霖、谢若冰、刘知远和孙茂松等人发表了一篇名为《Improved Word Representation Learnin

深入理解BERT Transformer ，不仅仅是注意力机制

BERT是google最近提出的一个自然语言处理模型，它在许多任务检测上表现非常好。如：问答、自然语言推断和释义而且它是开源的。因此在社区中非常流行。

RS(2)--从文本数据到用户画像

用户画像其实就是从海量的用户数据中，建模抽象出来每个用户的属性标签体系，这些属性通常需要具有一定的商业价值。

谷歌推出云自然语言API

将自然语言处理（NLP）的先进成果，从前沿研究的小世界里拿出来，送到普通的数据科学家和软件工程师手中，这已经成为一场运动。7月20日，谷歌也加入进来，发布了测试版的云自然语言API。谷歌的NLP API让用户可以利用如下三个核心的NLP特性：情感分析——分析语言的基调，比如积极或消极；实体识别——识别语言中不同的实体，比如人或组织；语法分析——识别语言中的各种词性，比如句子X包含3个名词。这些工具使用了谷歌的深度机器学习算法，这也是其API与其他自建的数据科学工具的不同之处。 NLP软件是一种构建用

深度 | 你知道《圣经》中的主要角色有哪些吗？三种NLP工具将告诉你答案！

在思考数据科学的时候，我们常常想起数字的统计分析。但是，各种组织机构越来越频繁地生成大量可以被量化分析的非结构文本。一些例子如社交网络评论、产品评价、电子邮件以及面试记录。

自然语言处理之分词、命名主体识别、词性、语法分析-stanfordcorenlp-NER(二)

在前面我们介绍了Stanford CoreNLP，自然语言处理之命名实体识别-tanfordcorenlp-NER(一)

深入理解BERT Transformer ，不仅仅是注意力机制

【NLP基础】信息抽取(Information Extraction:NER(命名实体识别),关系抽取)

信息抽取的定义为：从自然语言文本中抽取指定类型的实体、关系、事件等事实信息，并形成结构化数据输出的文本处理技术

NLP 教程：词性标注、依存分析和命名实体识别解析与应用

当我们提到数据科学时，我们经常想到的是针对数字的统计分析。但实际上，更为常见的是由机构所产生的大量非结构化文本数据，它们需要被量化和分析。其中的一些例子有社交网络评论，产品评价，电邮，采访稿。

11款开放中文分词引擎大比拼

在逐渐步入DT（DataTechnology）时代的今天，自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说，并没有类似英文空格的边界标志。而理解句子所包含的词语，则是理解汉语语句的第一步。汉语自动分词的任务，通俗地说，就是要由机器在文本中的词与词之间自动加上空格。

hanlp安装和使用

在https://github.com/hankcs/HanLP/releases中下载data然后覆盖HanLP-1.3.4.zip解压后的data

孔晓泉：自然语言处理应用和前沿技术回顾

雷锋网 AI 研习社按：伴随着近几年的机器学习的热潮，自然语言处理成为了目前炙手可热的研究方向，同时也是 Google、Microsoft、Facebook、Baidu、Alibaba 等各大公司投入巨额资金和高端人力努力争夺的下一个互联网流量入口（智能助手、智能音箱等）。

资源 | 你是合格的数据科学家吗？30道题测试你的NLP水平

选自Analyticsvidhya 作者：Shivam Bansal 机器之心编译参与：黄小天、李亚洲、Smith 近日，analyticsvidhya 上出现了一篇题为《30 Questions to test a data scientist on Natural Language Processing [Solution: Skilltest – NLP]》的文章，通过 30 道题的测试，帮助数据科学家了解其对自然语言处理的掌握水平。同时文章还附上了截至目前的分数排行榜，最高得分为 24（超过 25

用 Python 和 Gensim 库进行文本主题识别

从大量文本中自动提取人们谈论的主题（主题识别）是自然语言处理的基本应用之一。大型文本示例包括社交媒体订阅、消费者对酒店、电影和其他业务的评价、用户评论、新闻和客户发来的邮件。

《自然语言处理入门》12.依存句法分析--提取用户评论

语法分析(syntactic parsing )是自然语言处理中一个重要的任务，其目标是分析句子的语法结构并将其表示为容易理解的结构(通常是树形结构)。同时，语法分析也是所有工具性NLP任务中较为高级、较为复杂的一种任务。通过掌握语法分析的原理、实现和应用，我们将在NLP工程师之路上跨越一道分水岭。本章将会介绍短语结构树和依存句法树两种语法形式，并且着重介绍依存句法分析的原理和实现。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐