石晓文

LV0
发表了文章

Elasticsearch遇上BERT:使用Elasticsearch和BERT构建搜索引擎

在这篇文章中,我们使用一个预先训练好的BERT模型和Elasticsearch来构建一个搜索引擎。Elasticsearch最近发布了带有矢量字段的文本相似性搜...

石晓文
发表了文章

ML&DEV[16] | 算法工程师内功修炼

所谓算法,所谓人工智能,很多媒体,或者是一些教程,甚至是现在的主流论文,很容易地会把大家的思路带入到各种深度学习(没错,机器学习都已经out那种)等之类所谓比较...

石晓文
发表了文章

机器学习数学基础:数理统计与描述性统计

所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。

石晓文
发表了文章

Rethink DL | 激活、损失函数与正则化

知乎 | https://zhuanlan.zhihu.com/p/26122560

石晓文
发表了文章

BERT大魔王为何在商业环境下碰壁?

大型基于Transformer的神经网络,例如BERT,GPT和XLNET,最近在许多NLP任务中取得了最新的成果。这些模型的成功基于通用任务(例如语言建模)和...

石晓文
发表了文章

因子分解机算法原理及实现

由于在逻辑回归中使用的是特征的最原始组合,最终得到的分隔超平面属于线性模型,其只能处理线性可分的二分类问题。现实生活中的分类问题是多种多样的,存在大量的...

石晓文
发表了文章

【白话机器学习】算法理论+实战之LightGBM算法

如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,在这简单的先捋一捋, 常见的机器学习算法:

石晓文
发表了文章

算法工程师如何应对业务方和老板的灵魂拷问?

潘乱老师的文章中有一段叙述,描述了 Robin 经常反馈 badcase 的情况:

石晓文
发表了文章

通俗讲解集成学习算法!

本文以图文的形式对模型算法中的集成学习,以及对集中学习在深度学习中的应用进行了详细解读。

石晓文
发表了文章

推荐系统遇上深度学习(八十五)-[阿里]长用户行为序列建模探索:MIMN

本文介绍的论文是《Practice on Long Sequential User Behavior Modeling for Click-Through Ra...

石晓文
发表了文章

推荐系统遇上深度学习(八十三)-[阿里]记忆增强网络—MA-DNN模型介绍

本文介绍的论文题目为:《Click-Through Rate Prediction with the User Memory Network》 论文下载地址为:...

石晓文
发表了文章

知乎高赞:985计算机视觉毕业后找不到工作怎么办?怒刷leetcode,还是另寻他路?

本人目前是985高校研究生,方向是计算机视觉。成绩中等,无论文,无比赛经历,有项目经历。编程基础还可以,自认为在教研室算好的了,python用得比较熟,C++也...

石晓文
发表了文章

一文详解数据归约的四种途径

数据归约是在保证数据信息量的基础上,尽可能精简数据量。筛选和降维是数据归约的重要手段,尤其在数据量大且维度高的情况下,可以有效地节约存储空间和计算时间。反之,...

石晓文
发表了文章

分布式机器学习框架与高维实时推荐系统

导读:随着互联网的高速发展和信息技术的普及,企业经营过程中产生的数据量呈指数级增长,AI 模型愈发复杂,在摩尔定律已经失效的今天,AI 的落地面临着各种各样的困...

石晓文
发表了文章

来自AI专家的13篇必读论文

在“顶尖人工智能书籍”阅读榜单大受欢迎之后,我们联系了一些社区人士,找出他们认为每个人都应该阅读的论文!

石晓文
发表了文章

【推荐实践】阿里飞猪“猜你喜欢”推荐排序实践

导读:飞猪猜你喜欢排序模型由线性模型升级到端到端的深度模型,并进行了多个版本的迭代。本文分享模型迭代中的一些技术沉淀。

石晓文
发表了文章

《可解释机器学习》中文版重磅开源!这位复旦小哥太给力了

我曾经介绍过一本不错的书籍:《A Gudie for Making Black Box Models Explainable》,中文译为《可解释机器学习》。这本...

石晓文

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券