文渊之博

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

核心指标是用于判断该实验是否显著，观测指标用于判断该实验对其余指标的影响。另外，可以设反向指标，以观测该实验是否会带来一些负面影响。

AB实验相关流程

数据集有三列：userid，month，count，统计每个用户截止到当月为止的最大单月访问次数和累计到该月的总访问次数

hivesql 累加计算

我正在尝试使用 collect_list 为每个 ID 生成事件列表。所以类似于以下内容：

hivesql 实现collect_list内排序

常用spark优化参数
强制使用spark engine
set tqs.query.engine.type = sparkCli;
set spark.yarn.priority = 4;
双写HDFS开启：
set spark.shuffle.hdfs.enable=true;
set spark.shuffle.io.maxRetries=1;
set spark.shuffle.io.retryWait=0s;
set spark.network.timeout=120s;

## 双写HDFS开启

常用spark优化参数

背景

我们知道clickhouse一般都是处理单表的数据，经常需要实现同环比等分析场景，这里提供两种方式：
首先计算公式：

clickhouse 实现同环比

如果想正确显示 mapbox 地图，需要注册mapbox[1]，并在 superset 里配置 MAPBOX_API_KEY


安装 Superset 和ClickHouse

Judea Pearl是图灵奖得主，因果推断的奠基人之一。由于阅读的论文中涉及到反事实推断中Total Effect(TE), Natural Direct Effect(NDE), Total Indirect Effect(TIE)等概念，涉及到反事实推断方法的核心，因此前来拜读一下Pearl老爷子二十年前发表的这篇论文。

因果推断

最近工作使用了一段时间的的数据库客户端 DBeaver，发现客户端显示时间不正确。时间保存之后发现日期经常自动-1。

DBeaver 导入csv到myql发现的时间问题

order by会对输入做全局排序，因此只有一个Reducer(多个Reducer无法保证全局有序)，然而只有一个Reducer，会导致当输入规模较大时，消耗较长的计算时间，在生产环境中遇到数据量较大的情况，一般无法成功。

hive 的order by ,sort by，distribute by，cluster by

各行各业的打工人，经常会面对一种令人尴尬的质疑：为什么你把15-25归为一类，10-20不行吗？13-23不行吗？

K-means分箱

自增列的生成
over()里不带排序或order by 1是一样的效果
select row_number() over() as id,a1.id,relationwords,relation_words
from ods.ods_wpt_management_search_relation_words_full_1d a1
lateral view explode(split(relationwords,'；')) relationwords as relation_words
where dt='20

hive自增ID

　　最近很多时候需要将hivesql转化为prestosql ,这里面有很多不能直接复用需要调整func甚至改用其他逻辑。

hivesql和prestosql对比

由于Unique是Aggregate中的一种特殊的形式且底层也是使用Aggregate中的替换函数实现的，所以这里只看Aggregate模型。

Doris rollup介绍

简介：
        根据技术调研的过程可以明显的体会到hbase的存储方式和数据库的存储有着明显的区别，查询的方式也有着很大不同，HBase主要是通过这种filter来对数据进行筛选。同时对于数据的体量较大（10亿级别以上的数据数据量），检索和修改的场景较多时是比较适合使用hbase。

     HBase过滤器可以根据分为：列簇与列类型过滤器，行键过滤器，其他过滤器
HBase Filter 概览
查询hbase支持的filter 列表

HBase常用的Filter总结

为了帮助管理数据库级别的安全性，SQL Server具有数据库角色。就像服务器角色一样，也有两种不同类型的数据库角色:固定的和用户定义的。固定的数据库角色就像固定的服务器角色一样，这意味着它们拥有一组特定的权限，这些权限不能被更改。

数据库角色

安全角色可以简化SQL Server中的权限。在本文中,解释了固定的服务器和数据库角色

什么是基于角色的安全?

首先，创建一个server 对象实例，然后连接它。我只需要引入Script() 方法，脚本如下：

利用powershell 生成sqlserver 对象脚本

你是否需要连接数据库？这里有一段代码演示如何查询和获取SQL数据，只需非常简单正确的配置你的账户信息、服务器地址及SQL语句就行：

如何利用powershell 访问sqlserver

本篇将使用PowerShell脚本对SQL Server 的关键指标进行监控.

以下，用数据库空间容量为例，实现一下逻辑：

一、建表

为每台服务器创建一个表，用于记录服务器各个数据库的容量，以服务器名作为表名。

介绍一种使用poweshell 监控的方式

你可能已经知道 MySQL 从版本 5.7 开始提供了 NoSQL 存储的功能，在 8.0 中这部分功能也得到了一些改进（MySQL 5.7 vs 8.0，哪个性能更牛？），但鉴于这个在实际当中用得极少，本人也是没用过，所以本文不会介绍这方面的东西，而是关注其关系数据库方面。

mysql8.0的5个新特性介绍

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了文渊之博专栏，为你提供了文渊之博的相关文章，致力于帮助开发者快速成长与发展。

文渊之博

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐