首页
学习
活动
专区
工具
TVP
发布

张俊红

专栏作者
356
文章
556513
阅读量
91
订阅数
SQL养成这8个好习惯是一笔财富
来  源:数据前线 不管是做数据开发还是数据分析,大部分人都离不开跟数据库打交道。如果数据量大,人员流动大,那么我么还能保证下一段时间系统还能流畅的运行吗?我么还能保证下一个人能看懂我么的存储过程吗?那么今天,我们结合平时个人工作经验和大家分享一下,希望对大家有帮助。 要知道SQL语句,我想我们有必要知道SQLserver查询分析器怎么执行SQL语句的,我么很多人会看执行计划,或者用profile来监视和调优查询语句或者存储过程慢的原因,但是如果我们知道查询分析器的执行逻辑顺序,下手的时候就胸有成竹,有把握
张俊红
2022-09-27
7290
如何解决抽样调查过程中所面临的难点和问题?——以政治学研究为例
论文| 量化研究方法 政治学抽样调查面临概念抽象、复杂,难以测量,理论假设中的关系结构复杂,不得不较多依赖面访式概率抽样调查的难点。受这些难点所限,一些调查中发生了概念不清、社会期许偏差、评价参照系偏差、覆盖偏差、无回答偏差,以及抽样成本高昂和无应答率居高不下等问题。针对这些难点和问题,学者们利用列举实验法、随机化回答技术、虚拟情境锚定法来解决社会期许偏差和评价参照系偏差问题;利用地址抽样来解决覆盖偏差问题,以空间单元格和夜间灯光亮度来降低高昂的抽样成本;以并行数据的应用来降低访员效应,处理无应答,构建应答
张俊红
2022-09-06
6140
万字总结,行业分析到底应该怎么做!
今天给大家分享一篇关于行业研究的干货,从行研基本内容、数据来源、分析框架到常见误区,总结的非常系统,值得一看~ 一、行业研究的基本内容 1、行业研究的目的 咨询、研究机构、券商/投行以及企业都会做行业研究。 很多新手分析师在拿到一个新的行业后,往往第一反应都是一脸懵逼。面对陌生的行业,不知道如何切入。 其实,切入的关键并不在于了解行业,而是要了解行业研究的目的。 咨询公司的行业研究报告一般都目的很明确,无非是向潜在客户宣传:“我很懂XX行业,你们赶紧来找我买数据/做项目吧!” 所以,咨询公司的研究报告大多是
张俊红
2022-09-06
3620
SQL优化的魅力!从 30248s 到 0.001s
今天给大家分享一次非常有意思的 SQL 优化经历,希望能帮助到大家。 文章来源:cnblogs.com/tangyanbo/p/4462734.html 作者: 风过无痕的博客 场景 用的数据库是mysql5.6,下面简单的介绍下场景。 课程表 create table Course( c_id int PRIMARY KEY, name varchar(10) ) 数据100条。 学生表 create table Student( id int PRIMARY KEY, name varchar(10)
张俊红
2022-08-26
1940
数据分析师的完整流程与知识结构体系
一个完整的数据分析流程,应该包括以下几个方面,建议收藏此图仔细阅读。完整的数据分析流程:1、业务建模。2、经验分析。3、数据准备。4、数据处理。5、数据分析与展现。6、专业报告。7、持续验证与跟踪。 (注:图保存下来,查看更清晰) 作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知识结构。 1. 数据采集 了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会
张俊红
2022-05-18
4180
太强了,10种聚类算法完整Python实现!
来源:海豚数据科学实验室 转自:数据分析1480 今天给大家分享一篇关于聚类的文章,10种聚类介绍和Python代码。 聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好探索一系列聚类算法以及每种算法的不同配置。在本教程中,你将发现如何在 python 中安装和使用顶级聚类算法。 完成本教程后,你将知道: 聚类是在输入数据的特征空间中查找自然组的无监督问题。 对于所有数据集,有
张俊红
2022-04-27
1.5K0
数据分析工具评测丨Yonghong Desktop对战Tableau Desktop
作为数据分析的爱好者,之前我是Tableau Desktop的深度用户,由于Tableau Desktop收费,免费的Public版本又在数据连接上有限制,所以常常限制了我的使用。从去年开始,我就切换到了国产的数据分析产品Yonghong Desktop。原因有二:一是Yonghong Desktop免费,二是Yonghong Desktop的表现丝毫不逊色于Tableau。 在开始之前,大家可以先扫码下载软件试用一下,或许能对本文的内容了解得更深刻。 Yonghong Desktop官网,下载软件请用
张俊红
2022-03-03
2K0
利用Python搭建一个实时监控可视化大屏
实际上可以将CPU和磁盘信息监控指标分表设置,两者对时间粒度要求是不一样的,减少不需要的资源消耗。后期专门写一篇来聊聊如何搭建数据指标体系。
张俊红
2021-08-20
2.1K0
常见的SQL面试题:经典50例
链接:https://blog.csdn.net/u010565545/article/details/100785261
张俊红
2021-08-20
6.3K0
对比Pandas,轻松理解MySQL分组聚合的实现原理
小小明,「凹凸数据」专栏作者,Pandas数据处理专家,致力于帮助无数数据从业者解决数据处理难题。
张俊红
2021-02-03
7640
作为一台“取数机”,你能不能把数据取准确?
作为一名数据分析师,可能经常会抱怨自己整天在接一些临时数据需求,根本没时间去做分析。所谓的临时数据需求更多的都是取数,一会领导要你看一下这个数,一会业务部门又要那个数,是不是感觉自己活生生就是个提数机器哈。我们先不论这种情况合理不合理,既然做了就要把这件事尽可能的做好,今天给大家分享一篇傅老师写的《关于如何能把数据取准确》。以下为分享正文:
张俊红
2020-02-24
7340
一篇来自10年数据总监关于数据分析师的理解
本文作者为数据海洋,海洋老师从一个数据分析师成长为管理过近百人的数据团队的负责人,这中间总结了不少经验,也踩了不少坑,现在他把这些分享出来,希望可以帮助到大家。总共有三篇,本篇为第一篇,主要写了数据分析师的入门需要的基本的知识,逻辑,工作方法。
张俊红
2020-02-10
3.5K1
Sql 中的变量使用
我们在学 Python 或者其他编程语言的时候都应该有学过变量这么一个东西,可是 Sql 这种查询语言中怎么也有变量呢?具体有什么用呢?
张俊红
2019-08-28
11.4K1
内连接的两种方式
在前面的文章中我们讲过两个概念,宽表和窄表,在现实业务中,数据库中很多表存储其实都是以窄表的形式来存储的,但是我们一般从数据库中获取信息的时候,都是需要同时从多个表中来获取信息,也就是需要将多个窄表先进行连接,然后再进行 select。连接方式主要有四种:左连接、右连接、内连接、外连接。默认是内连接(划重点,考试会考,但是貌似很多人不知道)。
张俊红
2019-07-24
9360
介绍一下 information_schema 库
今天给大家介绍一款 Mysql 中附属的数据库,就是 information_schema 数据库,为什么说是附属呢?是因为这个数据库是在安装 Mysql 的同时就会安装到你电脑上。这个数据库里面主要存储了关于数据库里面的各种库、表、列、注释等信息。这个库对我们有什么用呢?有很大用处,尤其是当一个公司没有数据字典的时候,你就可以通过查看这个数据库,然后自己去梳理字典。
张俊红
2019-06-24
1.8K0
数据分析系列——SQL数据库
数据分析系列——SQL数据库 总第49篇 ▼ 本文知识只是用作于常用的数据分析中,并未涉及专业数据库搭建等知识。全篇分为四个部分:初识数据库、数据库的操作、数据库存储数据的单元即表的基本操作、表的操作
张俊红
2018-04-11
2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档