首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

技术资源推荐数据仓库篇)

0x00 前言 前段时间有不少朋友让推荐一些数据仓库的书出来,本着“如果重复三次回答同一个问题,就应该写一篇博客”的原则,在这里梳理一下数据仓库相关的资源给大家。...0x01 书籍推荐 一、数据仓库工具箱(第3版):维度建模权威指南 英文名:《The DataWarehouse Toolkit-The Complete Guide to Dimensona Modeling...所以强烈推荐看了这本书,至少是前5五章。...推荐这本书的原因就在于现在大部分互联网公司的数据仓库都是基于这一套大数据框架来的,更准确的来讲,大家其实都是先工程,后理论,因此这本书可以作为对大数据生态的一览。...有一本小书推荐给大家:《数据仓库实践》,地址:http://www.mdjs.info/2018/01/01/data-warehouse/data-warehouse-in-action/。

3.9K31

推荐数据仓库的必读书

0x00 前言 数仓的必读书,其实已经推荐过好几次了,但是最近依旧有很多朋友在群里问数据仓库入门看什么书,索性接着视频号的讲稿,给大家再分享一次。 很多读者私信问居士,学习数据仓库该看什么书!...今天,居士就给大家分享居士认为必读的三本: 0x01 推荐 前两本书,一本是《数据仓库工具箱:维度建模权威指南》,一本是《数据仓库》。 两本分别代表了数据仓库建模中的两大流派:维度建模和范式建模。...因此,就要推荐第三本书,也是居士逢人必推的一本:《大数据之路:阿里巴巴大数据实践》。...该书可作为整个数据体系建设的参考书,从数据平台到数据仓库到数据应用,都有比较不错的讲解。...0xFF 总结 如果上面三本书觉得不够,也可以看一下居士写的关于数据仓库的文章,其中有一篇维度建模的文章在Google搜索里面也排到第一了。 当然,如果你有推荐的书,也可以留言出来~

1.1K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    首次揭秘1112背后的云数据库技术!| Q推荐

    从 2009 年到 2021 年,从千万交易额到千亿交易额, 11 已经开展了 12 年。如今,每年的 11 以及一个月后的 12,已经成为真正意义上的全民购物狂欢节。...是什么样的数据库撑起了 2021 年的 11 12 的稳定进行?...《数据 Cool 谈》第三期,阿里巴巴大淘宝技术部 12 队长朱成、阿里巴巴业务平台 11 队长徐培德、阿里巴巴数据库 11 队长陈锦赋与 InfoQ 主编王一鹏,一同揭秘了 11 12 背后的数据库技术...ADB 3.0(AnalyticDB for MySQL 3.0) 发布,高度兼容 MySQL 协议以及 SQL:2003 语法标准,支持对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库...在陈锦赋看来,云原生数据仓库 ADB3.0 很大的一个价值部分在于能够实现数据的在线化实时化,能够挖掘到一些目前还未被发现到的商业价值。

    31.7K50

    面试官:为什么在系统中不推荐写?

    作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction 源码解析 Eureka 和 Hystrix 源码解析 Java 并发源码 来源:孤独烟 引言 正文 背景介绍 写缺点...主要分为以下三个部分 (1)背景介绍 (2)写缺点 (3)改良方案 基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持...那么,写会带来什么坏处呢?OK,继续往下看! 写缺点 一致性问题打个比方我们现在有两个client,同时往两个DataSouce写数据。...如果采用写的方法,是避不开这个问题的! 那么有没有通用的办法来解决这些问题呢?有的,只要能按顺序记录数据的变更即可!那具体怎么做呢,我们继续往下看!...直接提取数据变化到kafka中,其他数据源从kafka中获取数据,避免了直接写从而导致一致性和原子性问题。 基于微服务的思想,构建在 B2C 电商场景下的项目实战。

    2.4K10

    推荐收藏:跨云数据仓库(data warehouse)环境搭建,这货特别干!

    方案 业务服务在腾讯云,在腾讯云机器上部署数据收集服务并将获取的业务数据打包上传至 sftp 供阿里云上的数据仓库服务经过 ETL 过程存储至 hive 库。...: l-test.beta4.dt.cn4 与现有的 beta 环境数据仓库机器使用同一套 hadoop 集群资源,hdfs 存储路径新增 /user/test/hive/warehouse_uat 隔离环境数据...服务正常运行 canal.deploy/adapter服务机器:l-test2.beta.plat.tp2,已存在且canal.deploy和canal.adapter服务正常运行 2.发布代码工程 数据仓库机器...开通业务服务机器:l-test.beta4.ep.tx1 与 sftp 机器之间的通信(关闭防火墙限制) 开通数据仓库机器:l-test.beta4.dt.cn4 与 sftp 机器之间的通信(关闭防火墙限制...sync 为通过监听 binlog 消息通过代码方式实现的个性化的同步逻辑,也是本次数据仓库搭建主要使用的数据同步方式。

    1.1K20

    TKDE2023 | 基于曲图学习的社交推荐算法

    TLDR: 本文将社交推荐任务建模在曲空间学习之下,并提出了一种基于曲图学习的社交推荐模型。...具体的,其设计了一个曲社交预训练模块以保留社交结构作为特征,并从显式的异质图学习和隐式的特征增强两方面缓解社交推荐存在的问题。...最近,一些研究探索了将图嵌入学习转移到曲空间的替代方法,曲空间可以保留现实世界图的层级结构。 然而,直接将当前的曲图嵌入模型应用于社交推荐并非易事,因为存在两大挑战:网络异质性和社交扩散噪声。...为了解决上述挑战,本文提出了一种基于曲图学习的社交推荐(HGSR)模型。首先,利用曲社交嵌入的预训练来探索社交结构,这可以保留社交网络的层级特性。...总之,本文提出了一种新颖的HGSR模型用于曲空间的社交推荐。为了利用社交影响扩散引入的异质性和噪声问题,设计了一种社交预训练增强的曲异质图学习方法。

    35910

    作为互联网企业,能为碳政策做点啥?| Q推荐

    为了应对全球气候的变化,我国在近几年也已经明确提出了“碳政策”。然而在政策之下,很多企业还未到意识自己与“减少碳排放”之间的联系,但在全球性问题面前,没有人是一座孤岛,谁也无法自全。...由于碳政策具有重要战略意义和变革意义,自其开始实行之后,我国各个领域的企业都开始参与到这场经济社会变革当中,来助力达成“碳”目标。...微软等互联网科技巨头在过去十年间相继制定了明确的碳中和目标,设立 100% 使用可再生能源的目标,采取全方位、系统化的节能减排措施;而自 2021 年以来,中国互联网企业开始探索碳中和路径,如阿里、腾讯、百度等互联网巨头纷纷积极响应碳政策...那么,在碳政策已成确定趋势的背景下,中小互联网科技企业又可以采取哪些行动思路来助力实现碳目标呢?...3 碳政策之下,数据库扮演重要角色 众所周知,公有云服务通常可以比本地部署实现更高的 IT 运营效率运行,在减少碳排放的同时也能够减少运营成本。

    2.8K30

    CIKM22「清华+华为」DualRec:考虑过去和未来信息的网络序列推荐模型

    导读 序列推荐(SR)在个性化推荐系统中发挥着重要作用,因为它从用户的实时增长行为中捕获动态和多样的偏好。...与标准的自回归训练策略不同,未来数据(在训练期间也可用)已用于促进模型训练,因为它提供了关于用户当前兴趣的更丰富的信号,并可用于提高推荐质量。...双向知识迁移机制增强了网络学习的知识。 2. 方法 2.1 问题定义 用户集合为 \mathcal{U}=\{u_1,......,i_{|T_u|}^{(u)}\} ,序列推荐的任务就是基于上述序列,预测用户 T_u+1 时可能交互的商品 i_{T_u+1}^{(u)} ,可以表示为下式, p(i_{T_u+1}^{(u)}=i...在网络模型中,两个编码器(分别表示为过去的编码器和未来的编码器)使用基础编码器实例化,通过基础编码器,过去和未来的建模被明确地分离。

    3K20

    为什么我说 ETL 是 SQL 人重启辉煌之光的必经之路

    往小了说,数据仓库是在实现另类的读写分离,以空间换取业务系统的时间。当所有高IO吞吐量的只读查询,都跑到数据仓库上时,业务库承载的IO压力就会大大减少,从而提高业务库并发量。...在6.18,12 看到自己心仪的衣服,包包,首饰一件件卖完,而自己还没有排上号的时候,多么希望系统能自动推荐一些类似的宝贝。...在购买技术书的时候,同样也喜欢购物App可以推荐符合我们口味的图书,省掉自己苦苦寻找的烦恼。 作为影迷来说,碰到一部符合自己口味的电影,是多么难寻。好比《教父》,好比《让子弹飞一会》,《出租车司机》。...所以加入了实时推荐,购物,看电影,听音乐等等,一切就都变成了乐趣。 ?...此时的实时数据处理,不再沿用传统的批次策略,而是每一次点击,滑动,切换都要实时地被计算框架给捕获,并给出反馈,或者推荐,或者聚合计算。

    89421

    2021年大数据Hadoop(三):Hadoop国内外应用

    最大的一个单Master节点集群有4500个节点(每个节点路4核心CPUboxesw,4×1TB磁盘,16GBRAM)。总的集群存储容量大于350PB,每月提交的作业数目超过1000万个。...Facebook同时在Hadoop基础上建立了一个名为Hive的高级数据仓库框架,Hive已经正式成为基于Hadoop的Apache一级项目。...百度的Hadoop集群为整个公司的数据团队、大搜索团队、社区产品团队、广告团队,以及LBS团体提供统一的计算和存储服务,主要应用包括: 数据挖掘与分析 日志分析平台 数据仓库系统 推荐引擎系统 用户行为分析系统...推荐引擎系统。 搜索排行榜。...四、腾讯 TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大

    3K41

    【Android 进程保活】应用进程拉活 ( 进程守护 + JobScheduler 保活 | 成功率最高 | 推荐使用 )

    文章目录 一、 进程守护保活 + JobScheduler 原理 二、 进程守护保活 + JobScheduler 源码 1、JobService 代码 2、判定服务运行工具类 3、清单文件 4、...MainActivity 代码 5、运行效果 三、 源码资源 一、 进程守护保活 + JobScheduler 原理 ---- 【Android 进程保活】应用进程拉活 ( JobScheduler...JobScheduler 使用流程 | JobService 服务 | 不同版本兼容 | 源码资源 ) 博客中介绍了 JobScheduler 的用法 ; 【Android 进程保活】应用进程拉活 ( 进程守护保活...) 博客中介绍了进程守护保活用法 ; 使用 " 进程守护保活 + JobScheduler " 机制 , 成功率最高 ; " 进程守护保活 + JobScheduler " 整合方法 : 在 JobService...的 onStartJob 方法中 , 判定 " 进程守护保活 " 中的进程是否挂了 , 如果这两个进程挂了 , 就重新将挂掉的进程重启 ; 判定 Service 进程是否运行 : public

    2.2K21
    领券