人工智能LeadAI-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

人工智能LeadAI

专栏成员

461

文章

660262

阅读量

104

订阅数

词向量技术 | 从word2vec到ELMo

深度学习 NLP 服务神经网络

"词和句子的嵌入已成为所有基于深度学习的自然语言处理（NLP）系统的重要组成部分，它们在固定长度的稠密向量中编码单词和句子，以大幅度提高神经网络处理文本数据的能力。"

2018-08-17

2.5K0

命名实体识别 | NLP系列学习

NLP 服务数据库

在自然语言处理中，分词，词性标注，命名实体识别和句法情感分析是非常关键的分支，因为最近需要对此有一些应用，便去了解了一下特定领域目前使用的方法以及一些困难，特此进行总结。

2018-07-31

1.5K0

NLP系列学习:CRF条件随机场(1)

编程算法 NLP 服务机器学习

大家好,今天让我们来看看条件随机场,条件随机场是一项大内容,在中文分词里广泛应用,因为我们在之前的文章里将概率图模型和基本的形式语言知识有所了解,当我们现在再去学习条件随机场会容易比较多(在动笔写这篇文章前我也翻阅了很多的博客,发现很多博主上来就讲一大堆核心公式,而之前的铺垫知识都很少提,我觉得这不太好,会让很多人一开始就懵)。

2018-07-30

3020

基于Text-CNN模型的中文文本分类实战

NLP 服务推荐系统

转眼学生生涯就结束了，在家待就业期间正好有一段空闲期，可以对曾经感兴趣的一些知识点进行总结。

2018-07-30

2.5K0

NLP系列学习:前向算法和后向算法

编程算法 NLP 服务

在这一篇文章里,我们可以看到HMM经过发展之后是CRF产生的条件,因此我们需要学好隐马尔科夫模型.

2018-07-26

2980

pyTorch自然语言处理简单例子

pytorch NLP 服务

最近在学pyTorch的实际应用例子。这次说个简单的例子：给定一句话，判断是什么语言。这个例子是比如给定一句话： Give it to me 判断是 ENGLISH me gusta comer en la cafeteria 判断是 SPANISH 就是这么简单的例子。来看怎么实现：准备数据格式 [(语句，类型)，...] data是train的时候用的语句，test_data是test的时候用的语句 data = [ ("me gusta comer en la cafeteria".spl

2018-03-12

1.4K0

学习资料参考：从深度学习到自然语言处理

深度学习 NLP 服务

注意：本文已经更新，新版结合深度学习简介和发展历程，给出了更详尽的学习资料参考。新版链接：深度学习简介与学习资料参考（http://peteryuan.net/deep-learning-intro/）本文主要介绍一些与神经网络和自然语言处理相关的经典教程、资料，以便初学者能有个比较清晰的学习参考。从机器学习到深度学习深度学习脱胎于神经网络，而神经网络又是一种机器学习的经典算法。因此，如果希望从理论上更深刻地掌握深度学习，建议了解相关的机器学习知识。机器学习 Andrew Ng.（吴恩达）的机器学习

2018-03-09

7520

基于自然语言识别下的流失用户预警

在电商运营过程中，会有大量的用户反馈留言，包括吐槽的差评，商品不满的地方等等，在用户运营生态中，这部分用户是最有可能流失也是最影响nps的人群，通过对其评价的语义分析，每日找出潜在的流失人群进行包括"电话回访","补券安慰"，"特权享受"等行为，有效的降低了用户的流失。根据实际的业务营销效果，在模型上线后，abtest检验下模型识别用户人群进行营销后的流失率比随意营销下降9.2%，效果显著。当前文本文义识别存在一些问题：（1）准确率而言，很多线上数据对特征分解的过程比较粗糙，很多直接基于df或者idf结

2018-03-09

1.1K0

基于朴素贝叶斯的自然语言分类器

概述自然语言分类是指按照预先定义的主题类别，为文档集合中的每个文档确定一个类别。本文将介绍一个限定类别的自然语言分类器的原理和实现。采用Python作为编程语言，采用朴素贝叶斯作为分类器，使用jieba进行分词，并使用scikit-learn实现分类器。训练数据来自于凤凰网，最终交叉验证的平均准确率是0.927。训练数据获取中文自然语言分类现成可用的有搜狗自然语言分类语料库、北京大学建立的人民日报语料库、清华大学建立的现代汉语语料库等。由于语言在使用过程中会不断演进，具有一定的时效性，我们最终决定

2018-03-08

1.3K0

使用CNN+ Auto-Encoder 实现无监督Sentence Embedding (代码基于Tensorflow)

tensorflow NLP 服务深度学习

1前言这篇文章会利用到上一篇：基于Spark /Tensorflow使用CNN处理NLP的尝试的数据预处理部分，也就是如何将任意一段长度的话表征为一个2维数组。本文完整的代码在这： autoencoder-sentence-similarity.py（https://gist.github.com/allwefantasy/51275cb5c649e4a69b33131e967e2af9#file-autoencoder-sentence-similarity-py）基本思路是，通过编码解码网络（

2018-03-08

1.2K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态