首页
学习
活动
专区
工具
TVP
发布

大数据

多年海量数据处理经验,化数据为力量
专栏作者
174
文章
274477
阅读量
108
订阅数
如何用SQL计算客户生命周期价值
Statsbot团队针对不同的客户和不同的商业模型预估了592次LTV(用户生命周期价值,Custom lifetime value)。我们在本文以及免费的电子书中分享了我们如何使用不涉及复杂的统计模型的SQL语句来计算客户生命周期价值。
大数据弄潮儿
2018-05-22
3.2K0
如何查询InfluxDB
InfluxDB是一个很流行的基于时间序列的数据库,下面是这个数据库的最基本的查询命令。InfluxDB使用类SQL(实际上它就是一种特殊的“SQL”)的语言。
大数据弄潮儿
2018-05-21
10.8K1
爬虫无烦恼,大牛教你怎么简单爬36kr网,带源码
抓取36kr网站数据 爬虫代码和数据sql脚本在下方链接,抓取过程主要是抓包找到url递归解析的规律,三个主要的函数 以及 表结构脚本如下: #建表语句(写爬虫时候忘记添加user_url 后续数据处理时候update补全了这个字段)CREATE TABLE `36kr` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键id', `column_id` varchar(255) DEFAULT NULL COMMENT '专题id', `tag` varc
企鹅号小编
2018-01-31
6900
大数据干货系列(五)-Hive总结
Hive总结 一、本质 Hive基于一个统一的查询分析层,通过SQL语句的方式对HDFS上的数据进行查 询、统计和分析。 二、四大特点** • Hive本身不存储数据,它完全依赖HDFS和MapReduce,具有可扩展的存储能力和计算能力 • Hive的内容是读多写少,不支持对数据的改写和删除 • Hive中没有定义专门的数据格式,由用户指定 • Hive是一个SQL解析引擎,将SQL语句转译成MR Job 下例:Hive写的wordcount 📷 三、HQL与SQL对比 📷 四、Hive体系架构 可以将H
企鹅号小编
2018-01-29
1.4K0
mysql联合索引详解
上一篇文章:mysql数据库索引优化 比较简单的是单列索引(b+tree)。遇到多条件查询时,不可避免会使用到多列索引。联合索引又叫复合索引。 b+tree结构如下: 每一个磁盘块在mysql中是一个页,页大小是固定的,mysql innodb的默认的页大小是16k,每个索引会分配在页上的数量是由字段的大小决定。当字段值的长度越长,每一页上的数量就会越少,因此在一定数据量的情况下,索引的深度会越深,影响索引的查找效率。 📷 对于复合索引(多列b+tree,使用多列值组合而成的b+tree索引)。遵循最左侧原
企鹅号小编
2018-01-29
8.5K2
关注专栏作者,随时接收最新技术干货
Techeek
腾讯产品运营
花落花飞去
腾讯社区运营
QiqiHe
腾讯产品运营
故障分析:数据库一致性关闭缓慢问题诊断
想必我们大家都知道,Shutdown immediate即一致性关闭数据库,数据库下次启动不需要做实例恢复即可open数据库。那么当数据库一致性关闭出现缓慢等状况时,该怎么办呢?那我们就来一起分析一下,数据库一致性关闭缓慢问题。 shutdown immediate在数据库中会做哪些操作? 📷 从以上图得知在shutdownimmediate关闭数据库只需要在数据库中强制选择检查点并关闭文件,不需要等待当前事物处理结束,不需要等待当前会话结束,不允许新连接。 引发shutdown immediate slo
企鹅号小编
2018-01-25
6230
Solr:不止于文字
本文介绍了Solr的发展历程、功能特性、适用场景以及其在大数据分析领域的应用。Solr是一个高性能的搜索和大数据分析引擎,它具有高可用性、分面搜索、动态聚类、大数据实时分析等功能。在大数据领域,Solr已经成为了一个重要的工具,可以帮助企业处理海量数据,实现快速搜索、文档聚类和大数据实时分析等功能。
花落花飞去
2017-12-21
1.3K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档