腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
datartisan
专栏成员
举报
162
文章
346639
阅读量
29
订阅数
订阅专栏
申请加入专栏
全部文章(162)
编程算法(31)
sql(29)
python(28)
数据库(21)
文件存储(13)
数据(11)
云数据库 SQL Server(9)
正则表达式(8)
mysql(8)
linux(6)
hive(6)
windows(6)
csv(6)
excel(6)
存储(5)
函数(5)
bash(4)
unix(4)
神经网络(4)
深度学习(4)
http(4)
开源(4)
数据分析(4)
https(4)
jquery(3)
json(3)
access(3)
bash 指令(3)
人工智能(3)
网络安全(3)
list(3)
null(3)
pandas(3)
测试(3)
机器学习(2)
php(2)
oracle(2)
ide(2)
api(2)
numpy(2)
sql server(2)
grep(2)
大数据(2)
物联网(2)
5g(2)
unicode(2)
flink(2)
bi(2)
join(2)
powerbi(2)
select(2)
sumifs(2)
var(2)
报表(2)
编辑器(2)
工作(2)
排序(2)
算法(2)
同步(2)
图表(2)
优化(2)
语法(2)
负载均衡(1)
官方文档(1)
区块链(1)
NLP 服务(1)
数据挖掘(1)
java(1)
javascript(1)
regex(1)
node.js(1)
html(1)
postgresql(1)
打包(1)
jar(1)
负载均衡缓存(1)
apache(1)
apt-get(1)
mapreduce(1)
访问管理(1)
命令行工具(1)
TDSQL MySQL 版(1)
云推荐引擎(1)
网站(1)
在线旅游(1)
企业(1)
serverless(1)
自动化(1)
ssh(1)
gui(1)
jdbc(1)
线性回归(1)
tcp/ip(1)
anaconda(1)
机器人(1)
hbase(1)
kafka(1)
聚类算法(1)
utf8(1)
aggregate(1)
app(1)
awk(1)
between(1)
bit(1)
border(1)
case(1)
com(1)
count(1)
cron(1)
dataframe(1)
date(1)
dax(1)
default(1)
docx(1)
event(1)
exists(1)
firefox(1)
gif(1)
grid(1)
having(1)
hook(1)
impala(1)
insert(1)
int(1)
lag(1)
merge(1)
na(1)
next(1)
qgis(1)
range(1)
regexp(1)
replace(1)
root(1)
row(1)
rows(1)
sed(1)
series(1)
size(1)
sort(1)
sum(1)
tdd(1)
vertica(1)
vlookup(1)
word(1)
变量(1)
表格(1)
部署(1)
产品(1)
递归(1)
对象(1)
工具(1)
公众号(1)
后台(1)
架构(1)
脚本(1)
教程(1)
进程(1)
开发(1)
可视化(1)
连接(1)
流量(1)
面试(1)
命令行(1)
模型(1)
视频(1)
数据仓库(1)
数学(1)
思维导图(1)
搜索(1)
统计(1)
性能优化(1)
压缩(1)
终端(1)
字符串(1)
搜索文章
搜索
搜索
关闭
DuckDB 复杂关联
数据
语法
select
工作
面试
现实工作中,有一些场景需要关联,然而却不能直接进行关联,因为关联键并不直接存在,只有经过处理后才可以进行关联,今天,我们通过一个例子来学习一下。
披头
2024-11-21
72
0
PowerBI 连续天数通用计算模型
对象
模型
算法
powerbi
var
业务过程中,经常遇到需要计算连续天数的场景,比如:连续打卡天数、连续评优的同学、连续下单的客户等。
披头
2024-11-21
70
0
DuckDB 正则这么玩
正则表达式
regexp
replace
select
函数
DuckDB 中的正则表达式,基本上遵循了正则表达式的一些通用的规则,比如元字符、转义序列等,但是也有自己的特色(方言),在某些方面可以更好的实现需求。
披头
2024-11-21
143
0
Excel 正则 REGEXEXTRACT
函数
语法
字符串
正则表达式
excel
Excel 于今年推出了一系列正则函数,给文本处理带来的极大的便捷性,今天咱们就来看看最常用的 REGEXEXTRACT 是怎么使用的。
披头
2024-11-21
224
0
DuckDB 读取数据
压缩
存储
csv
函数
数据
读取数据是操作数据的第一步。本文将详细介绍如何使用 DuckDB 进行数据读取,包括各种文件格式数据的读取方法及其适用场景。
披头
2024-11-21
226
0
1 分钟安装 DuckDB
数据库
开源
测试
连接
命令行
DuckDB 的安装过程可以说非常简单,一般情况下,1 分钟即可搞定,与其他数据库几个小时的安装过程相比,简直不要太爽,今天咱们就来看看具体怎么安装。
披头
2024-11-21
369
0
Why DuckDB
数据库
部署
测试
进程
数据
目前世面上已经存在很多种数据库管理系统,但没有一种可以适合所有场景。数据库管理系统的选取应该基于其应用场景及其实施成本。
披头
2024-11-21
112
0
Vertica:如何计算下个月的第一天
数据库
next
vertica
函数
开发
今天在问题排查问题过程中,无意中搜索到了数据库领域泰斗级人物 Mike Stonebraker。
披头
2024-11-21
62
0
如何在 Power BI 中使用字段参数创建动态轴
数据
图表
bi
编辑器
产品
在数据可视化的世界里,灵活性和交互性常常决定了报告的成功。Power BI 中的动态轴 提供了这一点——允许用户动态地从不同角度探索数据。这个特性增强了用户的参与度和洞察力的发现。今天,我将带你一步步地实现在 Power BI 中使用字段参数创建动态轴,包括测试数据。让我们深入到一个实际的例子中,了解一下如何将动态轴集成到报告中。
披头
2024-11-21
124
0
SQL面试题003-行与行的比较
sql
lag
函数
排序
数学
分别将近两个学期的得分情况构造为子查询,然后将两个子查询相关联( JOIN ),便可以对两次得分情况进行比较,这是一种比较简单的解题思路,具体的解题过程留给你思考。
披头
2024-04-24
83
0
SQL每日一题-Q001
sql
insert
list
null
架构
复兴集团公司中有一份组织架构信息,包括部门信息及部分具有领导职务的雇员信息,详见下图示例:
披头
2024-01-10
205
0
Atlas Hook 导入 Hive 元数据
hive
hook
工作
数据
同步
Atlas 部署之后就可以导入 Hive 元数据,这部分工作由 Atlas 组件 Hook 来完成。初次导入 Hive 元数据需要通过执行 shell 脚本来完成,然后,Atlas 就可以自动同步增量元数据信息了。下面我介绍一下如何完成这些工作。
披头
2023-12-26
418
0
无监督or有监督?
数据挖掘
线性回归
聚类算法
数据
算法
无监督数据挖掘算法和有监督数据挖掘算法的主要区别在于数据集的标签信息。 有监督数据挖掘算法: 1. 特点:有监督数据挖掘算法适用于已知数据集的输入和输出关系的情况。 2. 过程:算法通过已知的输入和输出数据,学习建立映射关系,然后用这个映射关系对新数据进行预测。 3. 例子:分类算法(如决策树、朴素贝叶斯、SVM 等)和回归算法(如线性回归、逻辑回归等)。 无监督数据挖掘算法: 1. 特点:无监督数据挖掘算法适用于没有标签信息的情况。算法的主要目标是发现数据内部的结构和规律,而不是建立输入和输出之间的映射关系。 2. 过程:无监督算法通过聚类、降维、关联规则挖掘等方法,对数据进行内部组织,从而找出数据之间的关联性或相似性。 3. 例子:聚类算法(如 K-Means、DBSCAN 等)、关联规则挖掘(如 Apriori、FP-growth 等)和降维算法(如 PCA、t-SNE 等)。 总结: 有监督数据挖掘算法关注于建立输入和输出之间的映射关系,用于预测未知数据的输出。而无监督数据挖掘算法关注于发现数据内部的结构和规律,用于挖掘数据之间的关联性或相似性。这两种算法在实际应用中可以根据具体问题和需求进行选择和组合,以达到更好的挖掘效果。
披头
2023-10-29
281
0
Hive 删库跑路
数据库
hive
测试
递归
数据
“删库跑路”作为一种历史悠久、后果严重的公司资产损坏事故,一旦发生,后果难以估量,轻则业务短时间不可用,重则公司倒闭关门,甚至有人为此坐牢。已经发生的事件历历在目,希望大家引以为戒。
披头
2023-09-23
254
0
Hive 性能优化
存储
hive
数据
性能优化
优化
Hive 性能优化,可以从三个方面来考虑,即存储优化、执行过程优化和作业调度流程优化。
披头
2023-09-10
555
0
利用 Canal 将 MySQL 数据实时同步至 Kafka 极简教程
kafka
mysql
教程
数据
同步
笔者使用 Canal 将 MySQL 数据同步至 Kafka 时遇到了不少坑,还好最后终于成功了,这里分享一下极简教程,希望能帮到你。
披头
2023-09-10
2.2K
0
BI和报表的区别,终于有人说清楚了!
企业
bi
报表
工具
数据
其实这是相当错误的理解,但有这种错误观念也不怪大家,因为这两者都是大数据时代下的数据工具,两者的功能确实也有所重合,但两者在本质上还是存在较大差异。
披头
2023-08-17
436
0
Linux 三板斧之:awk
linux
正则表达式
awk
变量
数据
awk 是 Linux 三板斧之一,是一种强大的文本解析和处理语言。它可以对文本文件进行复杂的模式匹配、条件测试、循环与算术运算等。awk 的基本语法是:
披头
2023-08-17
250
0
Linux三板斧之:sed
bash
linux
自动化
sed
编辑器
sed 是 Linux三板斧之一,是一种非常强大的文本编辑器。它可以对文本文件进行添加、删除、替换、注释等操作。sed 的基本语法是:
披头
2023-08-17
184
0
Linux 三板斧之一:grep
linux
正则表达式
grep
root
搜索
grep 是 Linux 三板斧之一,是一种强大的文本搜索工具。它可以快速搜索文件的内容,寻找包含某个字符串或正则表达式的文本行。grep 的基本语法是:
披头
2023-08-17
306
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档