Spark学习技巧-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Spark学习技巧

本公众号主要分享Spark使用及源码，spark 机器学习，图计算，同时会涉及到hadoop家族。

专栏成员

810

文章

1302296

阅读量

248

订阅数

基于大数据的用户画像构建小百科全书

spark 数据挖掘数据库大数据数据处理

用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签，而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户，可以让人更容易理解用户，并且可以方便计算机处理。

Spark学习技巧

2021-03-05

1.2K0

用户画像在阅文的探索与实践

编程算法数据挖掘大数据

导读：阅文作为国内最大的网络文学公司，我们在实践过程中，总结了一套适合自身业务特点的用户画像方法论，及实践经验。本文将介绍为什么需要用户画像，以及如何做用户画像，并结合在阅文场景下所面临的问题，为大家分享下我们在用户画像上的探索与实践。

Spark学习技巧

2021-03-05

7040

如何把握数据治理项目启动的最佳时机

数据挖掘数据分析企业 erp 大数据

如今，大数据正在社会的各行各业发挥着越来越重要的作用，数据已成为企业的核心资产和重要战略资源，是重要的生产因素。在数据驱动的信息化时代，企业只有将核心业务数据更好地掌握在手中，才能从中萃取更大的业务价值，进而优化产品管理，拓展市场新渠道，打造企业核心竞争力，而数据治理就是挖掘这些价值的重要手段和工具。对于企业而言，为什么要开展数据治理？何时启动数据治理项目？如何实施数据治理？在理清这些问题的前提下，借助端对端的数据治理，引领企业加快数字化转型，从而获取最大限度的价值。

Spark学习技巧

2019-10-14

6320

系列 | 漫谈数仓第四篇NO.4 『数据应用』（BI&OLAP）

数据挖掘开源大数据云数据库 SQL Server 数据分析

☞ 03.OLAP引擎 [ Kylin Druid Presto Impala Kudu ADB ES .. ]

Spark学习技巧

2019-10-08

2.5K0

推荐系统系列之隐语义模型

推荐系统数据挖掘

一、隐语义模型的基本思想隐语义模型是近年来推荐系统领域较为热门的话题，它主要是根据隐含特征将用户与物品联系起来。现从简单例子出发介绍隐语义模型的基本思想。假设用户A喜欢《数据挖掘导论》，用户B喜欢《三个火枪手》，现在小编要对用户A和用户B推荐其他书籍。基于 UserCF(基于用户的协同过滤)，找到与他们偏好相似的用户，将相似用户偏好的书籍推荐给他们；基于ItemCF(基于物品的协同过滤)，找到与他们当前偏好书籍相似的其他书籍，推荐给他们。其实还有一种思路，就是根据用户的当前偏好信息，得到用户的兴趣偏

Spark学习技巧

2018-06-22

8420

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态