首页
学习
活动
专区
工具
TVP
发布

毛小伟

专栏成员
14
文章
26092
阅读量
15
订阅数
新闻推荐实战 (九) :推荐系统流程的制造
本篇文章主要是讲解推荐系统流程构建,主要包括Offline和Online两个部分。
用户9656380
2022-11-11
7040
新闻推荐实战 (八) : 前后端交互
本文属于新闻推荐实战—前后端基础及交互—前后端交互部分。在前两节,我们分别简单的介绍了与本项目相关的前后的基础知识,目的是为了让大家更加细致的了解整个系统的前后端交互细节,以及更全面的了解一个推荐系统所需的组成部分。本文将从前后端的交互逻辑出发,更加全面的为大家讲解系统的每个细节,了解一个简单的推荐系统内的内部组成。
用户9656380
2022-05-31
5990
新闻推荐实战(七):Flask简介及基础
本文属于新闻推荐实战—前后端交互—后端构建之Flask。Flask作为该项目中会用来作为系统的后台框架,作为一个算法工程师需要了解一些关于开发的知识,因为在实际的工作中经常调试线上的代码来调用策略或模型。本文将对Flask以及一些基本的使用进行了简单的介绍,方便大家快速理解项目中的相关内容。
用户9656380
2022-05-31
1.4K0
推荐算法理论(一):协同过滤
本文是推荐算法理论系列的第一篇文章, 还是想从最经典的协同过滤算法开始。虽然有伙伴可能觉得这个离我们比较久远,并且现在工业界也很少直接用到原始的协同过滤, 但协同过滤的思想依然是非常强大,因为它借助于群体智能智慧,仅仅基于用户与物品的历史交互行为,就可以发掘物品某种层次上的相似关系或用户自身的偏好。这个过程中,可以不需要太多特定领域的知识,可以不需要物品画像或用户画像本身的特征,可以采用简单的工程实现,就能非常方便的应用到产品中。所以作为推荐算法"鼻祖",我们还是非常有必要先来了解一下这个算法的。
用户9656380
2022-04-14
2.1K0
新闻推荐实战 (六) : 前端基础及Vue实战
本文属于新闻推荐实战-前端界面展示。前端开发是一个创建 WEB 页面呈现给用户的过程,通过 HTML,CSS 及 JavaScript 以及衍生出来的各种技术及框架来实现用户的界面交互。通过前端展现数据库中的数据结果可以使用户可以更加详细、准确、快速地看到数据间的关系的规律。本文将从前端的概念出发,介绍前端的基本知识和项目中用到的相关框架和技术。
用户9656380
2022-04-14
2.3K0
新闻推荐实战(五):自动化构建用户及物料画像
本节内容主要讲的是上图中红框框起来的部分,也就是离线自动化构建用户和物料的画像,这部分内容在新闻推荐系统中是为系统源源不断添加新物料的途径,由于我们的物料是通过爬虫获取的,所以还需要对爬取的数据进行处理,也就是构造新闻的画像。对于用户侧的画像则是需要每天将新注册的用户添加到用户画像库中,对于在系统中产生了行为的用户,我们还需要定期的更新用户的画像(长短期)。下面分别从物料侧和用户侧两个方面来详细解释这两类画像在系统中是如何自动化构建的。
用户9656380
2022-04-14
5940
新闻推荐实战(四):scrapy爬虫框架基础
本文属于新闻推荐实战-数据层-构建物料池之scrapy爬虫框架基础。对于开源的推荐系统来说数据的不断获取是非常重要的,scrapy是一个非常易用且强大的爬虫框架,有固定的文件结构、类和方法,在实际使用过程中我们只需要按照要求实现相应的类方法,就可以完成我们的爬虫任务。文中给出了新闻推荐系统中新闻爬取的实战代码,希望读者可以快速掌握scrapy的基本使用方法,并能够举一反三。
用户9656380
2022-04-14
8040
新闻推荐实战(三):Redis基础
本文属于新闻推荐实战—数据层—构建物料池之Redis。Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库。由于是内存数据库,读写非常高速,可达10w/s的频率,所以一般应用于数据变化快、实时通讯、缓存等。但内存数据库通常要考虑机器的内存大小。Redis 是完全开源免费的,遵守 BSD 协议,是一个灵活的高性能 key-value 数据结构存储,可以用来作为数据库、缓存和消息队列。相比于其他的 key-value 缓存产品有以下三个特点:
用户9656380
2022-04-14
1.4K0
新闻推荐实战(二):MongoDB基础
前文 万字入门推荐系统 提到了后续内容围绕两大系列:推荐算法理论+新闻推荐实战。本文属于新闻推荐实战—数据层—构建物料池之MongoDB。MongoDB数据库在该项目中会用来存储画像数据(用户画像、新闻画像),使用MongoDB存储画像的一个主要原因就是方便扩展,因为画像内容可能会随着产品的不断发展而不断的更新。作为算法工程师需要了解常用的MongoDB语法(比如增删改查,排序等),因为在实际的工作可能会从MongoDB中获取用户、新闻画像来构造相关特征。本着这个目的,本文对MongoDB常见的语法及Python操作MongoDB进行了总结,方便大家快速了解。
用户9656380
2022-04-14
12.3K0
新闻推荐实战(一):MySQL基础
本文属于新闻推荐实战—数据层—构建物料池之MySQL。MySQL数据库在该项目中会用来存储结构化的数据(用户、新闻特征),作为算法工程师需要了解常用的MySQL语法(比如增删改查,排序等),因为在实际的工作经常会用来统计相关数据或者抽取相关特征。本着这个目的,本文对MySQL常见的语法及Python操作MySQL进行了总结,方便大家快速了解。文末附上参考资料
用户9656380
2022-04-14
2K0
万字入门推荐系统
最近一周我、强子、Y哥三人,根据自身如何入门推荐系统,再结合三人分别在腾讯做广告推荐、字节做视频推荐、百度做信息流推荐的经历,整理出了这份万字入门推荐系统。内容十分详细,涵盖了推荐系统基础、进阶、实战的全部知识点,并且每一块都给出了我们自己看过且觉得高质量的参考资料,所以不管你是科班还是非科班,按照这条路线走下去,找到推荐系统相关工作是完全没问题的。因为内容过于全面详细,即便你不从事推荐系统方向,只要是从事程序员,看完这篇文章也能有所收获。不过要先强调一下,如果是没有基础且时间充足的同学,可以按部就班的学,如果有一定基础或时间紧张,那就直接看核心知识。其中『 机器学习、深度学习、推荐算法理论知识、推荐系统实战项目 』这四块是核心知识,像数学、计算机基础可以等到你需要的时候再反过头来学习。在核心知识中也有次重点,要学会有的放矢,哪些知识是次重点,我都会在后面一一说明。
用户9656380
2022-04-14
4740
百度实习分享
大家好,我是Y哥。秋招基本结束了,整个秋招对我帮助最大的就是前段时间在百度的实习,自己打算总结一下,希望可以对找工作的同学有帮助。
用户9656380
2022-04-14
4290
我是如何看这个世界
首先这里要感谢大家支持。公众号第一篇文章发出后不到一星期就有500人关注,另外文章还被阿里天池的官方公众号转载,非常高兴能得到大家的认可。这段时间有很多朋友提供了宝贵的帮助和建议,包括一些大V主动转载并推荐我的公众号,小伟不胜感激。我这个人有一说一,别人对我的好我都会一直记着,你帮了我,日后若有需要尽管开口,我一定加倍帮你。
用户9656380
2022-04-14
5670
开篇:面经+为什么写公众号
这次春招实习,一共面了7家公司,经历了20多轮面试,拿了6家offer,最终选择了腾讯的CDG腾讯广告部门,推荐算法岗位,base深圳。
用户9656380
2022-04-13
3510
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档