小小挖掘机-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

小小挖掘机

专栏成员

516

文章

918679

阅读量

237

订阅数

基于Spark的大规模推荐系统特征工程

云数据库 SQL Server nosql sql spark 数据库

导读：特征工程在推荐系统中有着举足轻重的作用，大规模特征工程处理的效率极大的影响了推荐系统线上的性能。第四范式作为国际领先的机器学习和人工智能技术与平台服务提供商，面向大规模特征工程问题开发了下一代离线在线一致性特征抽取引擎FESQL，针对AI场景支持SQL接口，兼容Spark 3.0同时提供高性能的Native执行引擎。本次分享题目为基于Spark的大规模推荐系统特征工程及优化，主要内容包括：

2020-09-07

1.2K0

推荐系统数据集大列表

http https 网络安全推荐系统数据库

今天给大家介绍一个github仓库，收集了非常多的推荐系统的数据集，非常的全面，非常的实用，做推荐系统相关的同学可以收藏一下。

2019-10-21

5.3K0

推荐收藏 | 100个数据分析常用指标和术语

编程算法数据挖掘数据库 sql 数据分析

有个朋友是金融行业产品经理，最近在对已有的站内用户做分层与标签分类，需要对用户进行聚类分析。一般从事数据分析行业的朋友对这类词并不陌生，但是像市场运营人员就会把这类些名词概念搞混，导致结果不准确。数据分析相关概念多且杂，容易搞混。为了便于大家区分，今天小编就来盘点一下数据分析常用的术语解释。建议大家收藏起来方便查看。

2019-09-29

1K0

使用Excel&Python&Hive&SparkSQL进行数据分析开篇-环境搭建攻略！

scala xml hive 数据库

计划写一个新系列，分别使用Excel、Python、Hive、SparkSQL四种方式来实现简单的数据分析功能，例如GroupBy、透视表等功能。

2019-07-09

6670

又动歪脑筋--利用windows上的虚拟机执行定时爬虫并存入本地数据库！！

windows 爬虫数据库 linux mongodb

今天在畅游的主要工作内容是爬取百度贴吧的内容，今天上玩班就要三天碰不到公司的电脑，所以想搞一个定时任务，能在这三天里面每半个小时执行一次爬虫，但是自己不太熟悉windows下定时执行爬虫，所以想到了一

2018-04-11

1K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态