首页
学习
活动
专区
工具
TVP
发布

小小挖掘机

专栏作者
516
文章
859499
阅读量
237
订阅数
ICLR2023推荐系统投稿论文集锦
今年ICLR会议已经把审稿意见放出来了,特此整理了一下关于推荐系统相关的论文,总共筛选出24篇。值得说明的是,之前整理的顶会论文都是正式被接收的,比如NeurlPS2022推荐系统论文集锦与CIKM2022推荐系统论文集锦。这次由于ICLR是Open Review的,所以目前下文所列出的论文列表不是最终的接收列表,而是投稿列表。正因为如此,我们可以看到每篇论文的投稿过程,了解在投稿过程中所关注论文的审稿意见以及评分,并可以学习一下在投稿过程中如何与审稿人进行亲切友好的battle。下文整理了每篇文章的标题、目前获得的评分、论文链接以及论文摘要。大家可以通过链接获取论文的详细评审意见以及论文的原始文件。
石晓文
2022-12-30
7050
10大算法工程师炼丹Tricks
针对类别不平衡问题,用预测概率对不同类别的loss进行加权。Focal loss对CE loss增加了一个调制系数来降低容易样本的权重值,使得训练过程更加关注困难样本。
石晓文
2021-03-24
9090
时间间隔感知的自注意力序列化推荐方法
序列化推荐系统通过探索用户的交互顺序,以此基于他们最近所做过的事情的上下文预测他们的下一个动作。之前有马尔可夫链以及循环神经网络RNN和Self Attention可以解决类似的问题。
石晓文
2021-03-24
1.8K0
Papers with Code 2020 全年回顾
2020年Papers with Code 中最顶流的论文,代码和benchmark。
石晓文
2021-01-08
8420
大幅提升训练性能,字节提出新型分布式DNN训练架构
现有的分布式 DNN 训练架构无法充分利用异构资源实现高性能训练。近期,来自字节跳动和清华大学的研究人员提出一种新型分布式 DNN 训练架构——BytePS,解决了这一问题,实现了大规模训练性能的显著提升。这项工作已在国际顶级计算机系统会议 OSDI’20 上发表,其开源代码在 GitHub 上获得 2400 stars。
石晓文
2020-12-22
1.7K0
多目标学习在推荐系统中的应用
一般来说在搜索和推荐等信息检索场景下,最基础的一个目标就是用户的 CTR,即用户看见了一篇内容之后会不会去点击阅读。但其实用户在产品上的行为是多种多样的。比如在微信的订阅号中,用户可以对某个内容进行点赞,可以收藏这个内容,可以把它分享出去,甚至某篇文章如果他觉得比较符合他的兴趣,也可以进行留言。
石晓文
2020-11-09
3.4K0
【时空序列预测实战】详解时空序列常用数据集之MovingMnist数据集(demo代码)
这篇文章我们主要介绍MovingMnist数据集,做这个方向的research是逃不过这个数据集的使用的
石晓文
2020-11-09
1.8K0
TUPE :重新思考语言预训练中的位置编码
论文:https://arxiv.org/abs/2006.15595 代码:https://github.com/guolinke/TUPE
石晓文
2020-07-16
1.1K0
Elasticsearch遇上BERT:使用Elasticsearch和BERT构建搜索引擎
在这篇文章中,我们使用一个预先训练好的BERT模型和Elasticsearch来构建一个搜索引擎。Elasticsearch最近发布了带有矢量字段的文本相似性搜索。另一方面,你可以使用BERT将文本转换为固定长度的向量。一旦我们通过BERT将文档转换成向量并存储到Elasticsearch中,我们就可以使用Elasticsearch和BERT搜索类似的文档。
石晓文
2020-07-09
2.1K0
Rethink DL | 激活、损失函数与正则化
知乎 | https://zhuanlan.zhihu.com/p/26122560
石晓文
2020-07-03
7850
BERT大魔王为何在商业环境下碰壁?
大型基于Transformer的神经网络,例如BERT,GPT和XLNET,最近在许多NLP任务中取得了最新的成果。这些模型的成功基于通用任务(例如语言建模)和特定下游任务之间的迁移学习, 这些模型在有标记数据的静态评估集上表现出色。但是,在商业环境中部署这些模型通常会产生较差的结果。这是因为商业环境通常是动态的,并且在推理数据和训练数据之间包含连续的领域变化,例如新主题,新词汇或新写作风格等。
石晓文
2020-07-03
8040
来自AI专家的13篇必读论文
在“顶尖人工智能书籍”阅读榜单大受欢迎之后,我们联系了一些社区人士,找出他们认为每个人都应该阅读的论文!
石晓文
2020-05-14
5880
[学习资源分享]-3Blue1Brown数学课程、李宏毅《深度学习人类语言处理》等
之前小编就整理过3Blue1Brown推出的《线性代数的本质》课程的学习笔记,除此之外,还有《微积分的本质》、《深度学习》等系列的课程。3Blue1Brown推出的数学课程用八个字形容,就是深入浅出、直观明了。对于学习数学有困难的朋友,看一下他们的课程,一定会受益匪浅。下面是3Blue1Brown在B站的中国官方账号连接截图:
石晓文
2020-04-14
1.1K0
「紫禁之巅」四大图神经网络架构
近年来,人们对深度学习方法在图数据上的扩展越来越感兴趣。在深度学习的成功推动下,研究人员借鉴了卷积网络、循环网络和深度自动编码器的思想,定义和设计了用于处理图数据的神经网络结构。图神经网络的火热使得各大公司纷纷推出其针对图形结构数据的神经网络框架。下面分别介绍四大图神经网络框架。
石晓文
2020-03-25
1.4K0
深度学习100问-12:深度学习有哪些经典数据集?
很多朋友在学习了神经网络和深度学习之后,早已迫不及待要开始动手实战了。第一个遇到的问题通常就是数据。作为个人学习和实验来说,很难获得像工业界那样较高质量的贴近实际应用的大量数据集,这时候一些公开数据集往往就成了大家通往AI路上的反复摩擦的对象。
石晓文
2020-03-24
6870
深度学习中的优化算法串讲
寄语:优化算法是一个超参数,一个优化算法不是适合所有损失函数的,没有哪个优化算法是绝对的好或绝对的坏,是要根据损失函数判断的
石晓文
2020-03-09
1.1K0
一些NLP的面试问题
练习NLP是一回事,破解面试是另一回事。对NLP人员的面试与一般的数据科学非常不同。在短短几年内,由于迁移学习和新的语言模型,这些问题已经完全改变了。我个人经历过,随着时间的推移,NLP面试变得越来越艰难,因为我们取得了更多的进步。
石晓文
2020-02-24
9750
深度学习中的双下降现象
深度学习中的双下降现象,可能大家也遇到过,但是没有深究,OpenAI这里给出了他们的解答。
石晓文
2019-12-19
4040
特征工程|空间特征构造以及文本特征构造
关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~
石晓文
2019-12-11
1.2K0
31个惊艳的数据可视化作品,让你感受“数据之美”!
在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来。在这个过程中,我们既是数据的生产者,也是数据的使用者,然而初次获取和存储的原始数据总是杂乱无章的。
石晓文
2019-12-04
8150
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档