首页
学习
活动
专区
工具
TVP
发布

阿泽的学习笔记

欢迎关注公众号:阿泽的学习笔记
专栏作者
103
文章
165576
阅读量
34
订阅数
Item embedding 取平均得到 User embedding,是四不像还是四都像
所谓高维空间的诅咒:在低维空间中是四不像,但随着 Embedding 维度的增加,取平均后的 Item Embedding 会和用户原本的 Embedding 越来越近。所以高维下大概率是“四都像”。
阿泽 Crz
2021-12-02
1.1K0
点击率预估分析中的问题
A:网上已经有很多的文章解释过这个问题,简单的说就是离线评估的 AUC 是评估请求与请求之间点击率的序,而在线评估的是广告与广告点击率的距,评估的角度就不一致,所以这种情况是有可能发生的。举一个极端的例子,假设人在 wifi 环境下更喜欢点广告,但无论是哪个广告更喜欢点的程度都是一样的,如果在离线环境下如果我们加入了是否在 wifi 环境下这个特征,我们就应该能得到更高的 AUC,而在线时,因为这个特征的影响对所有广告是一样的,其实无法提升我们的在线效果,因为 P(Ad_x|Wifi)=P(Ad_x),所以不会提升。
阿泽 Crz
2021-12-02
1.1K0
五个工业风满满的 Look-alike 算法
广告主通常会基于用户标签来圈定广告的目标人群,比如广告主想投奥迪的广告可能会选择北方 25~44 岁男性;投奔驰可能会选择江浙地区 25 ~55 岁男性。
阿泽 Crz
2021-07-29
1.5K0
深度学习的深度学习路程
MyEncyclopedia 公众号主浙大本硕毕业后在BAT做资深工程开发,精通Java,算法和大数据开发,本可以靠着工程能力成为P9,但出于对AI的强烈兴趣,在业余时间,自学多年,从理论到实践,并最终转行到知名公司任资深机器学习岗。MyEncyclopedia 公众号提炼自己在AI多个领域的学习心得体会:深度学习,强化学习,统计机器学习,算法与工程实现。同时,用上述多个视角来全面看待问题,坚持从第一性原理出发理解推导。凭借着强大的编程能力,公众号还大量使用动画模拟和代码例子的来阐述深奥的概念。
阿泽 Crz
2021-07-06
1.1K0
KDD2021 放榜,6 篇论文带你了解阿里妈妈AI技术
ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是国际数据挖掘领域的顶级会议,由 ACM 的数据挖掘及知识发现专委会(SIGKDD)主办,被中国计算机协会推荐为A类会议。自 1995 年以来已连续举办 26 届,今年将于 8月14日至18日 在新加坡举办。
阿泽 Crz
2021-07-06
1.6K0
用AI构建AI - AutoML综述
这篇文章会主要以《Automated Machine Learning: Methods, Systems, Challenges》这本书为主要参考,结合一些其它论文,工具框架对这个领域进行介绍。
阿泽 Crz
2021-07-06
1.1K0
算法模型调优指南
在算法项目落地过程中,如果只考虑机器学习相关部分,个人感觉最花时间的两个部分是数据质量问题处理和模型实验与迭代调优。在之前Fullstack Deep Learning介绍的基础上,我们在这篇文章中主要针对第二个问题做一些详细的展开。
阿泽 Crz
2021-07-06
1.1K0
云原生与AI漫谈
写完上次的 MLOps 主题文章后,接下来计划写一篇机器学习与云原生结合的文章。不过个人在这块的经验并不多,还在各种学习和素材积累中。今天先来闲聊一些最近一阵子对云原生这个火热话题的一些发散性遐想。
阿泽 Crz
2021-07-06
6830
5 分钟理解百度 ERNIE 核心思想
从图中,我们很容易发现 ERNIE1.0 对于 BERT 的改进是在 MLM 任务。在论文,作者阐述了三种不同的 mask 技巧:
阿泽 Crz
2021-07-06
3590
没有最好,只有A/B测试!
“A/B测试不一定是最好的评估方法。它不是万能的,但不会A/B测试肯定是不行的。”
阿泽 Crz
2021-07-06
1.4K0
你真的懂点击率(CTR)建模吗?
点击率(CTR,Click-Through Rate)以及派生的各种用户行为概率(如商品购买率、推荐好友接受率、短视频3s曝光率等)是广告、推荐、搜索等互联网应用中大家耳熟能详的词汇。以点击率为例,如何建立高效的CTR预估模型是领域从业者们的核心能力,也是头部企业长期重兵投入、持续优化的核心技术。
阿泽 Crz
2021-07-06
1.3K0
【图神经网络】GCN-1(谱图卷积)
Spectral Networks and Deep Locally Connected Networks on Graphs
阿泽 Crz
2021-04-29
8560
【图神经网络】GCN-2(ChebyNet)
Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering
阿泽 Crz
2021-04-29
7910
LambdaLoss | Google排序学习优化框架
今天分享一篇谷歌在CIKM'18上发表的排序学习listwise损失函数优化的论文「LambdaLoss」[1],可以认为是沿袭着微软早期代表性工作[2]的路线,即:
阿泽 Crz
2021-04-29
1.5K0
【图神经网络】GCN-3(semi-GCN)
本文提出了一种可扩展的图结构数据半监督学习方法,通过谱图卷积的局部一阶近似确定卷积网络结构选择。并且在引文网络和知识图数据集的大量实验中,证明了其方法有很大的优势。
阿泽 Crz
2021-04-29
5010
【读书笔记】学会提问
最近读了《学会提问》,原版全称是《ASKING THE RIGHT QUESTONS - A GUIDE TO CRITICAL THINKING》。
阿泽 Crz
2021-04-14
6530
时间序列基础教程总结!
最近在Kaggle发现了一个关于时间序列比较不错的kernal,决定翻译一下搬运过来,大家一起学习交流一下。如果预期不错的话准备写四章,分别是时间序列Python基本操作、统计分析、时间序列分解与随机游走、统计建模分析。
阿泽 Crz
2021-03-24
7220
【读书笔记】自控力
欲望没有绝对的好坏之分,重要的是欲望将我们引向哪个方向,以及我们是否足够明智,知道什么时候该听从欲望的声音。
阿泽 Crz
2021-03-10
3690
当推荐遇到冷启动
冷启动问题,大家并不陌生。但是如何解决呢?加特征,加样本,加图谱,加规则?十方在做信息流广告推荐时,主要通过加一些泛化特征解决冷启动问题,但是这样并不一定是最好的方案,新广告很大程度上,还是会被模型"低估"。如何解决冷启动问题呢?
阿泽 Crz
2021-03-10
6750
【图神经网络】数学基础篇
能够将数据转换到欧几里德空间的便是欧几里德结构化数据,如时间序列数据,图像数据,上图则是图像数据的一个例子
阿泽 Crz
2021-03-10
1.4K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档