首页
学习
活动
专区
工具
TVP
发布

AI机器学习与深度学习算法

专栏作者
223
文章
406426
阅读量
53
订阅数
使用 HanLP 统计二元语法中的频次
计算句子概率值的工具就是语言模型,但是随着句子长度的逐渐增大,语言模型会遇到下面两个问题:
触摸壹缕阳光
2020-08-04
1.3K0
通俗讲解语言模型的评价指标-困惑度
无论是n-gram语言模型(unigram, bigram, tirgram)还是理论上可以记忆无限个单词(无穷元语法, ∞-gram)递归神经网络语言模型(RNN Language Model),都会涉及到一个最关键的问题:如何来评价这些语言模型的好坏?
触摸壹缕阳光
2020-07-20
2.3K0
通俗理解n-gram语言模型
本文主要介绍n-gram语言模型,如果想要了解语言模型的相关知识可以看《带你理解语言模型》。
触摸壹缕阳光
2020-07-20
2.6K0
带你理解语言模型
显然"西安在去哪"是一句极其别扭不通的句子,所以我们会很自然的选择输出"现在去哪",但是输入法没有我们那么智能能够一下子就判断出要输出哪一句话,输入法会计算出两个句子的概率值,然后通过比较选择概率值大的句子作为最终的输出结果,计算句子概率值的工具就是语言模型。
触摸壹缕阳光
2020-07-14
3780
[L4]实战语言模型~softmax与交叉熵
在介绍完了如何处理数据以及如何构造样本之后,就可以构建我们的神经网络语言模型了,下面是使用LSTM构建的语言模型的大体结构:
触摸壹缕阳光
2020-06-04
1K0
[L3]实战语言模型~构建embedding层
由于在公众号上文本字数太长可能会影响阅读体验,因此过于长的文章,我会使用"[L1]"来进行分段。这个系列将主要借鉴《Tensorflow实战Google学习框架》这本书,主要介绍实现语言模型的一些前期准备,后期会出更详细的文章。
触摸壹缕阳光
2020-06-04
1.3K0
[L2]实战语言模型~数据batching
由于在公众号上文本字数太长可能会影响阅读体验,因此过于长的文章,我会使用"[L1]"来进行分段。这个系列将主要借鉴《Tensorflow实战Google学习框架》这本书,主要介绍实现语言模型的一些前期准备,后期会出更详细的文章。
触摸壹缕阳光
2020-05-28
6570
[L1]Seq2Seq中Beam Seach的应用场景
由于在公众号上文本字数太长可能会影响阅读体验,因此过于长的文章,我会使用"[L1]"来进行分段。这系列将介绍Seq2Seq模型中的Beam Search算法。
触摸壹缕阳光
2020-04-08
6490
使用Gensim模块训练词向量
在以词项为基本单元输入的自然语言处理任务中,都避免不了将词项转换成算法能够输入的特征表示,词项的特征表示有很多种,这里主要介绍的就是词向量。word2vec是比较流行的训练词向量的算法,使用Gensim模块可以非常简单的训练出词向量。
触摸壹缕阳光
2020-03-27
1.6K0
一步步搭建Stanford NLP工具包
今天看视频看到的Stanford NLP,这里按照视频的讲解,简单做个笔记。Stanford NLP是少有的支持中文语料的工具,Stanford NLP提供了一系列自然语言分析工具。它能够给出基本的词形、词性,并且能够标记句子的结构,语法形式和字词的依赖,指明那些名字指向同样的实体,指明情绪,提取发言中的开放关系等。需要注意的就是Stanford NLP代码库运行比较慢。
触摸壹缕阳光
2019-11-12
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档