首页
学习
活动
专区
工具
TVP
发布

码字搬砖

专栏作者
209
文章
288117
阅读量
32
订阅数
一文搞懂 JSON Schema
json schema以一个json串来描述的json数据规范。可以用json schema检验一个给定的json串是否满足约定的json数据规范。
shengjk1
2022-09-22
6670
sql中count(1) count(*)与count(列名)的区别
count(1) count(*) 两者的主要区别是 count(1) 会统计表中的所有的记录数,包含字段为null 的记录。 count(字段) 会统计该字段在表中出现的次数,忽略字段为null 的情况。即不统计字段为null 的记录。 count(*) 和 count(1)和count(列名)区别 count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略列值为NULL count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略列值为NULL count(列名)只包括列名那
shengjk1
2022-09-21
1.4K0
spark sql 生成 json
想通过 spark sql 查询 hive 表然后将相应的字段组装成 sql,类似于 json_object ,不过可惜的是 spark 3.1.x 并没有 json_object 函数,不过还好spark sql 有 to_json 函数
shengjk1
2022-06-22
1.4K0
一文搞懂 Flink OperatorChain 对象重用
OperatorChain 的对象重用,可以提高效率,但什么情况下可以重用,什么情况下不可以重用,我们一起来看你一下代码:
shengjk1
2022-06-18
4750
python 和 java的区别( 不断更新中 )
python 跟 java 一样时强类型语言,也就是说它不会根据环境变化自动改变数据类型 python 是动态语言,而 java 是静态语言。也就是说 python 在编程时,永远不用给任何变量指定数据类型,而 java 写程序时必须声明所有变量的数据类型 python 的模块类似于 java 的 class,不过python模块导入会执行 代码的内容,而 java 不会 python 与 java 的执行方式还是蛮像的,都是将源码编译成 byte code 然后交给相应的虚拟机去执行 Python为了优化
shengjk1
2022-05-07
3350
一文搞懂各个开源版本
Alpha: Alpha是内部测试版,一般不向外部发布,会有很多Bug.除非你也是测试人员,否则不建议使用.是希腊字母的第一位,表示最初级的版本,alpha 就是α,beta 就是β ,alpha 版就是比beta还早的测试版,一般都是内部测试的版本。
shengjk1
2022-05-07
3550
一文搞懂 Maven Wrapper
mvnw是Maven Wrapper的缩写。因为我们安装Maven时,默认情况下,系统所有项目都会使用全局安装的这个Maven版本。但是,对于某些项目来说,它可能必须使用某个特定的Maven版本,这个时候,就可以使用Maven Wrapper,它可以负责给这个特定的项目安装指定版本的Maven,而其他项目不受影响。
shengjk1
2022-05-07
1.3K0
一文搞懂 linux 常见的版本区别
目前在用 mac 通过虚拟机的方式安装 linux,不要问题为什么这样做,哈哈哈哈。遇到了关于 liunx 版本的问题,特地来总结一下
shengjk1
2022-05-07
7360
一文搞懂 conda 与 pip 的区别
最为 python 的包安装工具,conda 与 pip 经常性的被使用,但却不甚了解两者之间的区别,现总结一下。
shengjk1
2022-05-07
1.1K0
理解什么是Spring IOC
IOC,全称 Inversion of Control 控制反转。即:原来是否创建对象由用户自己控制,现在由 Spring 容器进行控制,原来由用户创建对象,现在由 Spring 容器创建好对象后,供用户使用。
shengjk1
2022-05-07
1870
开发模型的演化
这是一个经典的模型,也是你们用的最多的模型 将项目活动分解为线性顺序阶段,其中每个阶段取决于前一个阶段的可交付成果。
shengjk1
2022-05-07
2700
什么是IDE
IDE 全称:integrated development environment 集成开发环境,指的是一种将常用的开发工具组合到一个图形界面中,以供开发者构建应用程序的软件。
shengjk1
2022-05-07
9360
云是什么
云其实本质上就是一群服务器+服务管理者。正是应为有服务管理者做统一的管理,运维人员不用一个机器一个机器的进行管理或配置,而直接通过统一的管理方式进行统一的管理和批量的设置。
shengjk1
2022-05-07
1.9K0
kafka 生产者的幂等性
kafka 提供了 “at least once” 的语义,即消息会发送一次或者是多次。但是人们真正想要的是 “exactly once” 的语义,即重复的消息不会再被发送
shengjk1
2022-01-11
7250
利用 Aviator 实现规则配置
我们调研了业界主流的一些规则引擎以及表达式引擎,如 Drools、EasyRule、JEXL、Aviator、qlExpress 等。从复杂度、与我们目前需求的契合程度、扩展性、性能、社区活跃度、文档、资料的完善程度以及使用者的学习成本等多方面考虑,决定采用 Aviator 来作为 filter_express 解析引擎 。 Aviator创建之初就是为了高性能、轻量级,并且支持自定函数以及各种定制选项,拥有各种内置函数且扩展较好,足够简单,用户的学习成本足够低,并且可以完美解决这个的问题。
shengjk1
2021-12-08
3.8K0
常见开源OLAP技术架构对比
OLAP(On-line Analytical Processing,联机分析处理)是在基于数据仓库多维模型的基础上实现的面向分析的各类操作的集合。可以比较下其与传统的OLTP(On-line Transaction Processing,联机事务处理)的区别来看一下它的特点:
shengjk1
2021-11-09
1.8K0
常见OLAP分类
1.OLAP分类 📷 2.OLAP常见的一些操作 1.上卷(Roll Up)/聚合:选定某些维度,根据这些维度来聚合事实,如果用SQL来表达就是select dim_a, aggs_func(fact_b) from fact_table group by dim_a. 2.下钻(Drill Down):上卷和下钻是相反的操作。它是选定某些维度,将这些维度拆解出小的维度(如年拆解为月,省份拆解为城市),之后聚合事实。 3. 切片(Slicing、Dicing):选定某些维度,并根据特定值过滤这些维度的
shengjk1
2021-11-02
1K0
centos 下安装 docker
其中 docker-ce 为社区版对于个人和大多数的企业 ce版已经够用了,两者之间具体的区别可以参考 https://boxboat.com/2018/12/07/docker-ce-vs-docker-ee/
shengjk1
2021-08-24
4080
一文搞定 Flink Job 的运行过程
之前我们知道了Flink 是如何生成 StreamGraph 以及 如何生成 job 和 如何生成Task,现在我们通过 Flink Shell 将他们串起来,这样我们就学习了从写代码开始到 Flink 运行 task 的整个过程是怎么样的。
shengjk1
2021-04-25
1.9K0
大数据架构如何做到流批一体?
阿里妹导读:大数据与现有的科技手段结合,对大多数产业而言都能产生巨大的经济及社会价值。这也是当下许多企业,在大数据上深耕的原因。大数据分析场景需要解决哪些技术挑战?目前,有哪些主流大数据架构模式及其发展?今天,我们都会一一解读,并介绍如何结合云上存储、计算组件,实现更优的通用大数据架构模式,以及该模式可以涵盖的典型数据处理场景。
shengjk1
2021-04-01
1.6K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档