DataScience

LV1
发表了文章

Git提交代码规范

Git 每次提交代码,都是需要写 Commit message(提交说明),否则就不允许提交。

DataScience
Git
发表了文章

Ambari离线安装大数据集群

Centos 最小化安装:各个节点进行:网络配置(Nat 模式且可以共享主机网络)

DataScience
大数据
发表了文章

[原创]-Day6.数据可视化之PPT引入

辛辛苦苦用pyecharts做好后,那如何展示给老板们看呢?打工人日常用的最多的展示工具是PPT,这次展示如何把pyecharts放到ppt上?一般把html文...

DataScience
发表了文章

教你用Python画一棵圣诞树

DataScience
发表了文章

[原创]-数据可视化实战项目

Request Headers 里面是我们用浏览器访问网站的信息,有了信息后就能模拟浏览器访问这也是为了防止网站封禁IP,不过糗事百科一般是不会封IP的,也是公...

DataScience
发表了文章

[原创]-Day5.数据可视化之Pyecharts

我们对matplotlib和seaborn都有了一定的了解,并且可以绘制一系列图形。今天我们将讲几个关于pycharts的具体的案例,让大家对可视化有更深的了解...

DataScience
发表了文章

[原创]-Day3.箱线图和热力图的绘制

箱线图(boxplot)又称盒式图,可以显示数据的分散情况,由五个数值点组成:最大值(max)-上界、最小值(min)-下界、中位数(median)和上下四分位...

DataScience
发表了文章

[原创]-Day3.常见图形不同绘制方式

Matplotlib:它在使用时灵活,可以定制化绘图,但是时间上的花费也比较多。为了提高画图效率,包Seaborn基于Matplotlib底层开发,使用更少的代...

DataScience
发表了文章

[原创]-Day1.零基础如何与Python做个朋友

总之,在数字化时代掌握⼀门编程语言,尤其是Python语言的使用是⾮常有必要的。相信使用Python的流行,不必多说,接下来我们一起学习基础语法。需要注意编程中...

DataScience
发表了文章

[原创]-Python-Anaconda解析

这是一个支持 Linux, Mac, Windows系统的python发行版本,占空间约600MB。如对空间要求严格的用户,Miniconda是一种选择。

DataScience
发表了文章

[原创]-Day2.零基础如何绘制数据可视化图形

今天我们要来了解折线图,散点图,条形图,直方图,饼图和器特点。认识Matplotlib的图像结构,并以Matplotlib绘制折线图为例来掌握设置辅助显示层;此...

DataScience
发表了文章

[原创]-Day4.数据可视化拓展图形

箱线图(boxplot)又称盒式图,可以显示数据的分散情况,由五个数值点组成:最大值(max)-上界、最小值(min)-下界、中位数(median)和上下四分位...

DataScience
发表了文章

Python爬取各类文档方法归类小结,获取文档资料必备小脚本

HTML文档是互联网上的主要文档类型,但还存在如TXT、WORD、Excel、PDF、csv等多种类型的文档。网络爬虫不仅需要能够抓取HTML中的敏感信息,也需...

DataScience
发表了文章

为什么黑客从不用鼠标,一直在敲键盘?看完长见识了

在电脑刚刚诞生的时候,人们可以通过计算机程序解决不少复杂的问题。而到了现在,人们可以使用电脑进行娱乐、办公等,生活因此变得相当便利。不过在个人电脑普及之后,世界...

DataScience
发表了文章

[原创]-数据仓库任务调度

随着数据仓库的开发,ETL作业会越来越多,怎么把这些作业有序的运行起来,就需要一个健壮的调度系统来保证数据能够准确、及时的提供给BI应用程序。

DataScience
发表了文章

[原创]-数据仓库维度建模

在数据建模过程中,最简单的描述就是按照事实表、维度表来构建数据仓库、数据集市。在维度建模方法体系中,维度是描述事实的角度,如日期、客户、供应商等,事实是要度量的...

DataScience
发表了文章

[原创]-数据仓库ETL开发

ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统数据仓库一般分为四层模型。

DataScience
发表了文章

[原创]-数据仓库架构的设计

架构是数据仓库建设的总体规划,从整体视角描述了解决方案的高层模型,描述了各个子系统的功能以及关系,描述了数据从源系统到决策系统的数据流程。业务需求回答了要做什么...

DataScience
发表了文章

[原创]-数据需求的定义

需求是数仓的核心,无论从广度还是深度的层面上做好需求调研的工作,对数仓的建设百利而无一害

DataScience
发表了文章

Excel?最强国产开源在线表格 Luckysheet 走红GitHub!

今天,要和大家推荐一款功能强大、配置简单、完全开源的用纯 JavaScript 编写的前端表格库!

DataScience

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券