首页
学习
活动
专区
工具
TVP
发布

AI星球

专栏作者
46
文章
86095
阅读量
23
订阅数
浅谈Embedding技术在推荐系统中的应用(1)
接着上一篇[推荐之矩阵分解],继续说Embedding在推荐领域的应用方法,矩阵分解为描述User/Item提供了一种向量化表达的方案,而本篇将探究如何从word2vec的角度获取Item的向量化表达。
流川枫
2020-04-24
1.2K0
推荐系统之矩阵分解模型
最近在整理Embedding技术在推荐系统中的应用,总结了获取各类item2vec的方法,推荐系统中的矩阵分解作为解决item2vec问题初期技术方法之一,虽已在推荐领域摸爬滚打了十几年,但至今仍旧在工业界的推荐场景中扮演着重要的角色,本文就对推荐系统中的矩阵分解进行简单的介绍,为后续几篇介绍推荐系统中的Embedding技术做铺垫。
流川枫
2020-04-24
1.3K0
NLP界最强特征提取器--Transformer
前面介绍NLP领域词向量技术的时候提到了目前最炙手可热的语言模型BERT,而BERT之所以能取得这样的瞩目成就,离不开其采用的超强特征提取器Transformer。
流川枫
2020-04-24
4.4K0
词向量(2)--从ELMo到Bert
其实,本文到这里,"核心内容"就已经讲完啦...当然如果你还不困的话,可以继续往下看,应该会有助于睡眠的
流川枫
2020-04-24
1.4K0
词向量(1)--从Word2Vec到ELMo
若你是做NLP的,一定对词向量很亲切,若你是做推荐的,对词向量也一定不会陌生,以词向量为代表的序列向量化方法已经成为机器学习中必不可少的实战利器。
流川枫
2020-04-24
7530
如何在ubuntu 16.04 下安装 Tensorflow
如果系统没有安装 gcc 则会提示 command not found。这时要先安装 gcc。
流川枫
2018-11-07
1.5K0
[转载]深度学习技术在文本数据智能处理中的实践
人工智能目前的三个主要细分领域为图像、语音和文本,老师分享的是达观数据所专注的文本智能处理领域。文本智能处理,亦即自然语言处理,试图让机器来理解人类的语言,而语言是人类认知发展过程中产生的高层次抽象实体,不像图像、语音可以直接转化为计算机可理解的对象,它的主要应用主要是在智能问答,机器翻译,文本分类,文本摘要,标签提取,情感分析,主题模型等等方面。
流川枫
2018-10-22
1.1K0
从零开始用Python搭建超级简单的点击率预估模型
本篇是一个基础机器学习入门篇文章,帮助我们熟悉机器学习中的神经网络结构与使用。 日常中习惯于使用Python各种成熟的机器学习工具包,例如sklearn、TensorFlow等等,来快速搭建各种各样的机器学习模型来解决各种业务问题。 本文将从零开始,仅仅利用基础的numpy库,使用Python实现一个最简单的神经网络(或者说是简易的LR,因为LR就是一个单层的神经网络),解决一个点击率预估的问题。
流川枫
2018-10-12
1.7K0
值得玩味儿的14个Python编程小技巧
最近的工作中经常使用Python编写一些基本解决一些NLP的小问题,在自己的工作日记里面也记录了不少的python编程中常用的小"Trick",看到最近大家学习Python的劲头儿这么火辣,那就简单的贴出一些。该篇文章定位是"Just show me code"风格----即:少废话,直接Sublime里面写Python!
流川枫
2018-10-10
4300
[转载]如何在NLP领域第一次做成一件事
自己也写过一篇关于NLP研究领域的个人粗浅的理解与入门学习建议----吾爱NLP(3)—我对NLP的理解与学习建议,今日偶然发现了微软亚研大佬的这篇文章,不仅介绍了NLP相关的各个研究领域以及入门实践的路径,还简单的解读了如何完成一篇学术论文,特此转载希望对各位有帮助。
流川枫
2018-09-12
5880
基于D3.js实现分类多标签的Tree型结构可视化
今天新来的实习生需要对部分分类文本进行多标签的检测,即根据已构建好的一、二级标签Excel文档,对众包平台人工标注的数据以及机器标注的数据进行评测。 此情此景,让我想起了曾经在实验做的文本多标签分类的工作,所以就想用Echart 或D3.js实现层级标签可视化为一个Tree的结构,方便实习生们查阅,提高工作效率。 说干就干!
流川枫
2018-09-12
1.9K0
逻辑回归(LR)个人学习总结篇
逻辑回归(LR,Logistic Regression)是传统机器学习中的一种分类模型,由于LR算法具有简单、高效、易于并行且在线学习(动态扩展)的特点,在工业界具有非常广泛的应用。
流川枫
2018-09-12
4.6K0
吾爱NLP(5)—词向量技术-从word2vec到ELMo
"词和句子的嵌入已成为所有基于深度学习的自然语言处理(NLP)系统的重要组成部分,它们在固定长度的稠密向量中编码单词和句子,以大幅度提高神经网络处理文本数据的能力。"
流川枫
2018-09-12
1.6K0
吾爱NLP(4)—基于Text-CNN模型的中文文本分类实战
转眼学生生涯就结束了,在家待就业期间正好有一段空闲期,可以对曾经感兴趣的一些知识点进行总结。
流川枫
2018-09-12
8K0
简明AWK实战教程
AWK是一个强大的格式化文本处理工具,一般在类Unix操作系统中都是必带的工具(Linux、Mac OS),因此,使用无需安装,非常的方便与便捷。
流川枫
2018-09-12
1.7K0
机器学习程序猿在Linux猩球的生存指南
一个小程序猿,在一场飞行意外中,坠落到Linux猩球,与家乡Win猩球/Mac猩球的绚丽多彩不同的是:Linux猩球大部分时间都是处于黑暗之中[命令行/Shell界面],因此,大多数时候他只能跟这个黑色的世界进行交互。为了更好的生存下来,他制作了这个基本生存指南。
流川枫
2018-09-12
1K0
让你"又爱又恨"的推荐系统--程序猿篇
推荐系统的应用场景,我相信在日常生活中大家基本都会接触到。例如,作为一个篮球爱好者,在淘宝上搜索的“kobe X 篮球鞋”,然后之后一段时间打开淘宝,首页界面可能会推荐很多与篮球鞋相关的商品,这算是一个比较正常的应用场景吧。当然还可能有其它的一些场景,例如上面用户吐槽的手机麦克风可能被监控,进而自己的喜好被平台方获取并产生推荐......
流川枫
2018-09-12
3.4K0
Spark常用的算子以及Scala函数总结
首先,介绍一下scala语言: Scala 是一种把面向对象和函数式编程理念加入到静态类型语言中的混血儿。
流川枫
2018-09-12
4.8K0
想玩转工业界机器学习?先学Spark吧
作为一名学生,如何还没听说过Spark这套计算框架,那么我觉得还是留在学术界的机器学习混吧,工业界现在也许还不适合你。
流川枫
2018-09-12
6250
我与Python--从Hacker到探索Deep Learning
进入大学之后,我们逐渐“被教授”了C、C++、Java等编程语言,但为什么我会选择python作为最喜欢的编程语言呢?
流川枫
2018-09-12
4630
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档