首页
学习
活动
专区
工具
TVP
发布

A2Data

专栏作者
373
文章
383078
阅读量
30
订阅数
Git多账户多地址多秘钥的配置
Git是一个免费的、开源的分布式版本控制系统,旨在快速高效地处理从小型到大型的所有项目。
DataScience
2021-04-07
2.5K0
Git提交代码规范
Git 每次提交代码,都是需要写 Commit message(提交说明),否则就不允许提交。
DataScience
2021-02-05
1.5K0
Ambari离线安装大数据集群
Centos 最小化安装:各个节点进行:网络配置(Nat 模式且可以共享主机网络)
DataScience
2021-01-18
2.2K0
[原创]-Day6.数据可视化之PPT引入
辛辛苦苦用pyecharts做好后,那如何展示给老板们看呢?打工人日常用的最多的展示工具是PPT,这次展示如何把pyecharts放到ppt上?一般把html文件放到PPT用两种方法:
DataScience
2021-01-05
2.6K3
教你用Python画一棵圣诞树
如何用Python画一个圣诞树呢? 最简单的方法: height = 5 stars = 1for i in range(height): print((' ' * (height - i))
DataScience
2021-01-05
1.7K0
[原创]-数据可视化实战项目
Request Headers 里面是我们用浏览器访问网站的信息,有了信息后就能模拟浏览器访问这也是为了防止网站封禁IP,不过糗事百科一般是不会封IP的,也是公开信息,仅用于学习。
DataScience
2021-01-05
6670
[原创]-Day5.数据可视化之Pyecharts
我们对matplotlib和seaborn都有了一定的了解,并且可以绘制一系列图形。今天我们将讲几个关于pycharts的具体的案例,让大家对可视化有更深的了解。
DataScience
2020-12-18
1.1K0
[原创]-Day3.箱线图和热力图的绘制
箱线图(boxplot)又称盒式图,可以显示数据的分散情况,由五个数值点组成:最大值(max)-上界、最小值(min)-下界、中位数(median)和上下四分位数(Q1, Q3)。它可以帮我们分析出数据的差异性、离散程度和异常值等。
DataScience
2020-12-18
1.2K0
[原创]-Day3.常见图形不同绘制方式
Matplotlib:它在使用时灵活,可以定制化绘图,但是时间上的花费也比较多。为了提高画图效率,包Seaborn基于Matplotlib底层开发,使用更少的代码,将常用的可视化绘图过程进行封装,有时只需要一行代码便可以画出我们想要的图形,省时省力;此外seaborn还提供更为丰富的图像以及3D图形供我们使用。掌握两个库的使用可以满足我们在不同情况下的需求。
DataScience
2020-12-18
3.8K0
[原创]-Day1.零基础如何与Python做个朋友
总之,在数字化时代掌握⼀门编程语言,尤其是Python语言的使用是⾮常有必要的。相信使用Python的流行,不必多说,接下来我们一起学习基础语法。需要注意编程中除了文字部分可以使用中文,标点符号一定要使用英文输入法否则会报错。
DataScience
2020-12-18
8910
[原创]-Python-Anaconda解析
这是一个支持 Linux, Mac, Windows系统的python发行版本,占空间约600MB。如对空间要求严格的用户,Miniconda是一种选择。
DataScience
2020-12-18
9890
[原创]-Day2.零基础如何绘制数据可视化图形
今天我们要来了解折线图,散点图,条形图,直方图,饼图和器特点。认识Matplotlib的图像结构,并以Matplotlib绘制折线图为例来掌握设置辅助显示层;此外,用Matplotlob设置辅助显示层,内容还增添拓展部份,平时用到的不是很多,作为了解即可。
DataScience
2020-12-18
2.5K0
[原创]-Day4.数据可视化拓展图形
箱线图(boxplot)又称盒式图,可以显示数据的分散情况,由五个数值点组成:最大值(max)-上界、最小值(min)-下界、中位数(median)和上下四分位数(Q1, Q3)。它可以帮我们分析出数据的差异性、离散程度和异常值等。
DataScience
2020-12-18
1.1K0
Python爬取各类文档方法归类小结,获取文档资料必备小脚本
HTML文档是互联网上的主要文档类型,但还存在如TXT、WORD、Excel、PDF、csv等多种类型的文档。网络爬虫不仅需要能够抓取HTML中的敏感信息,也需要有抓取其他类型文档的能力。下面简要记录一些个人已知的基于python3的抓取方法,以备查阅。
DataScience
2020-12-08
1.4K0
为什么黑客从不用鼠标,一直在敲键盘?看完长见识了
在电脑刚刚诞生的时候,人们可以通过计算机程序解决不少复杂的问题。而到了现在,人们可以使用电脑进行娱乐、办公等,生活因此变得相当便利。不过在个人电脑普及之后,世界上也多了一种全新的行业,它就是黑客。了解黑客的朋友都知道,他们可以通过键盘敲出代码黑入别人的计算机,不过在他们完成一系列的操作时却可以完全不使用鼠标,这是为什么呢?
DataScience
2020-11-24
7020
[原创]-数据仓库任务调度
随着数据仓库的开发,ETL作业会越来越多,怎么把这些作业有序的运行起来,就需要一个健壮的调度系统来保证数据能够准确、及时的提供给BI应用程序。
DataScience
2020-11-24
7300
[原创]-数据仓库维度建模
在数据建模过程中,最简单的描述就是按照事实表、维度表来构建数据仓库、数据集市。在维度建模方法体系中,维度是描述事实的角度,如日期、客户、供应商等,事实是要度量的指标,如客户数、销售额等。
DataScience
2020-11-24
1K0
[原创]-数据仓库ETL开发
ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统数据仓库一般分为四层模型。
DataScience
2020-11-24
2.5K0
[原创]-数据仓库架构的设计
架构是数据仓库建设的总体规划,从整体视角描述了解决方案的高层模型,描述了各个子系统的功能以及关系,描述了数据从源系统到决策系统的数据流程。业务需求回答了要做什么,架构就是回答怎么做的问题。
DataScience
2020-11-12
1.3K0
[原创]-数据需求的定义
需求是数仓的核心,无论从广度还是深度的层面上做好需求调研的工作,对数仓的建设百利而无一害
DataScience
2020-11-12
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档