首页
学习
活动
专区
工具
TVP
发布

小小挖掘机

专栏作者
516
文章
865885
阅读量
237
订阅数
ICLR2023推荐系统投稿论文集锦
今年ICLR会议已经把审稿意见放出来了,特此整理了一下关于推荐系统相关的论文,总共筛选出24篇。值得说明的是,之前整理的顶会论文都是正式被接收的,比如NeurlPS2022推荐系统论文集锦与CIKM2022推荐系统论文集锦。这次由于ICLR是Open Review的,所以目前下文所列出的论文列表不是最终的接收列表,而是投稿列表。正因为如此,我们可以看到每篇论文的投稿过程,了解在投稿过程中所关注论文的审稿意见以及评分,并可以学习一下在投稿过程中如何与审稿人进行亲切友好的battle。下文整理了每篇文章的标题、目前获得的评分、论文链接以及论文摘要。大家可以通过链接获取论文的详细评审意见以及论文的原始文件。
石晓文
2022-12-30
7150
10大算法工程师炼丹Tricks
针对类别不平衡问题,用预测概率对不同类别的loss进行加权。Focal loss对CE loss增加了一个调制系数来降低容易样本的权重值,使得训练过程更加关注困难样本。
石晓文
2021-03-24
9140
时间间隔感知的自注意力序列化推荐方法
序列化推荐系统通过探索用户的交互顺序,以此基于他们最近所做过的事情的上下文预测他们的下一个动作。之前有马尔可夫链以及循环神经网络RNN和Self Attention可以解决类似的问题。
石晓文
2021-03-24
1.8K0
Papers with Code 2020 全年回顾
2020年Papers with Code 中最顶流的论文,代码和benchmark。
石晓文
2021-01-08
8480
大幅提升训练性能,字节提出新型分布式DNN训练架构
现有的分布式 DNN 训练架构无法充分利用异构资源实现高性能训练。近期,来自字节跳动和清华大学的研究人员提出一种新型分布式 DNN 训练架构——BytePS,解决了这一问题,实现了大规模训练性能的显著提升。这项工作已在国际顶级计算机系统会议 OSDI’20 上发表,其开源代码在 GitHub 上获得 2400 stars。
石晓文
2020-12-22
1.7K0
多目标学习在推荐系统中的应用
一般来说在搜索和推荐等信息检索场景下,最基础的一个目标就是用户的 CTR,即用户看见了一篇内容之后会不会去点击阅读。但其实用户在产品上的行为是多种多样的。比如在微信的订阅号中,用户可以对某个内容进行点赞,可以收藏这个内容,可以把它分享出去,甚至某篇文章如果他觉得比较符合他的兴趣,也可以进行留言。
石晓文
2020-11-09
3.4K0
TUPE :重新思考语言预训练中的位置编码
论文:https://arxiv.org/abs/2006.15595 代码:https://github.com/guolinke/TUPE
石晓文
2020-07-16
1.1K0
Rethink DL | 激活、损失函数与正则化
知乎 | https://zhuanlan.zhihu.com/p/26122560
石晓文
2020-07-03
7910
BERT大魔王为何在商业环境下碰壁?
大型基于Transformer的神经网络,例如BERT,GPT和XLNET,最近在许多NLP任务中取得了最新的成果。这些模型的成功基于通用任务(例如语言建模)和特定下游任务之间的迁移学习, 这些模型在有标记数据的静态评估集上表现出色。但是,在商业环境中部署这些模型通常会产生较差的结果。这是因为商业环境通常是动态的,并且在推理数据和训练数据之间包含连续的领域变化,例如新主题,新词汇或新写作风格等。
石晓文
2020-07-03
8070
来自AI专家的13篇必读论文
在“顶尖人工智能书籍”阅读榜单大受欢迎之后,我们联系了一些社区人士,找出他们认为每个人都应该阅读的论文!
石晓文
2020-05-14
5930
[学习资源分享]-3Blue1Brown数学课程、李宏毅《深度学习人类语言处理》等
之前小编就整理过3Blue1Brown推出的《线性代数的本质》课程的学习笔记,除此之外,还有《微积分的本质》、《深度学习》等系列的课程。3Blue1Brown推出的数学课程用八个字形容,就是深入浅出、直观明了。对于学习数学有困难的朋友,看一下他们的课程,一定会受益匪浅。下面是3Blue1Brown在B站的中国官方账号连接截图:
石晓文
2020-04-14
1.1K0
Hive中group by还能这样玩?
表中一共有四列数据,分别是地区,员工姓名,月份和销量。目前的需求时,想同时得到各地区的销量、各员工的销量,以及每个员工在每个地区的销量。
石晓文
2020-04-14
6890
「紫禁之巅」四大图神经网络架构
近年来,人们对深度学习方法在图数据上的扩展越来越感兴趣。在深度学习的成功推动下,研究人员借鉴了卷积网络、循环网络和深度自动编码器的思想,定义和设计了用于处理图数据的神经网络结构。图神经网络的火热使得各大公司纷纷推出其针对图形结构数据的神经网络框架。下面分别介绍四大图神经网络框架。
石晓文
2020-03-25
1.4K0
深度学习中的优化算法串讲
寄语:优化算法是一个超参数,一个优化算法不是适合所有损失函数的,没有哪个优化算法是绝对的好或绝对的坏,是要根据损失函数判断的
石晓文
2020-03-09
1.1K0
一些NLP的面试问题
练习NLP是一回事,破解面试是另一回事。对NLP人员的面试与一般的数据科学非常不同。在短短几年内,由于迁移学习和新的语言模型,这些问题已经完全改变了。我个人经历过,随着时间的推移,NLP面试变得越来越艰难,因为我们取得了更多的进步。
石晓文
2020-02-24
9780
深度学习中的双下降现象
深度学习中的双下降现象,可能大家也遇到过,但是没有深究,OpenAI这里给出了他们的解答。
石晓文
2019-12-19
4070
特征工程|空间特征构造以及文本特征构造
关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~
石晓文
2019-12-11
1.2K0
31个惊艳的数据可视化作品,让你感受“数据之美”!
在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来。在这个过程中,我们既是数据的生产者,也是数据的使用者,然而初次获取和存储的原始数据总是杂乱无章的。
石晓文
2019-12-04
8150
使用一个特别设计的损失来处理类别不均衡的数据集
本文是谷歌对CVPR ' 19上发表的一篇文章的综述,文章的标题是Class-Balanced Loss Based on Effective Number of Samples。它为最常用的损耗(softmax-cross-entropy、focal loss等)提出了一个针对每个类别的重新加权方案,能够快速提高精度,特别是在处理高度类不平衡的数据时。
石晓文
2019-11-22
1.3K0
easyeda,一个简单实用的探索性数据分析工具
在算法工程师的日常工作中,探索性数据分析(Exploratory Data Analysis)是一种常见的任务。通过分析数据的缺失情况,分布情况,以及和标签的相关性等,数据EDA可以帮助算法工程师评估数据的质量,了解数据的特点,为特征工程提供方向指引,并对后续建立的模型能够达到的效果上限形成初步预期。
石晓文
2019-11-21
6760
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档