我们经常会使用复选标记,用来表示任务已完成或测试已通过。在本文中,介绍在Excel工作簿中添加复选标记的15种方法。...方法1:插入复选标记 可以使用功能区“插入”选项卡中的“符号”命令,如下图1所示。 图1 在图2所示的“符号”对话框中,选择“Wingdings”字体,滚动到底部,可以看到复选标记字符。...图3 方法2:添加复选标记的项目符号 在工作表中插入一个文本框,单击鼠标右键,在快捷菜单中选择“项目符号——选中标记项目符号”,如下图4所示。...✓✔☑✅ 方法7:使用Emoji键盘插入复选标记 在工作表中,按Windows键+点(.)组合键,会弹出如下图5所示的窗口,在其中找到并选取复选标记输入。...check,在“为”框中粘贴复选标记,如下图6所示。
渲染显示:最后将带有颜色编码的二维平面呈现出来,形成最终的密度散点图。可选项:在绘制的密度散点图的右方或下方展示颜色条 colorbar。 为什么要用密度散点图?...在处理包含上万个数据点的大型数据集时,传统散点图可能会导致严重的过度绘制(overplotting),即不同数据点在图表上的位置重叠,使得无法清晰地看到数据分布。...高灵活性的密度散点图支持多种定制选项,比如调整颜色映射、透明度、标记大小等,以适应不同类型和规模的数据集。此外,还可以结合其他类型的可视化技术(比如轮廓线或网格)来增强表达能力。...异常值检测:密度散点图可以帮助我们识别异常值。如果某个区域的密度远高于其他区域,那么可能存在异常值。 聚类分析:密度散点图可以帮助我们发现数据的聚集区域。...无论是在科研、工业还是商业领域,掌握并应用这种技术都将极大地增强对数据的理解和利用能力。 下面讲解一个带拟合曲线的密度散点图的绘图示例。
它是一个图表,在垂直轴上显示所有残差,在 x 轴上显示特征。如果数据点随机散布在没有图案的线上,那么线性回归模型非常适合数据,否则我们应该使用非线性模型。...找出数据是线性还是非线性的三种最佳方法: 残差图; 散点图; 假设数据是线性的,训练一个线性模型并通过准确率进行评估。 四、什么是多重共线性,它如何影响模型性能?...在训练数据上有两个高度相关的变量会导致多重共线性,因为它的模型无法在数据中找到模式,从而导致模型性能不佳。所以在训练模型之前首先要尽量消除多重共线性。 五、异常值如何影响线性回归模型的性能?...l1 和 l2 在训练数据较少、方差高、预测特征大于观察值以及数据存在多重共线性的情况下都很有用。 八、异方差是什么意思? 它是指最佳拟合线周围的数据点的方差在一个范围内不一样的情况。...检验异方差的最好方法之一是绘制残差图。 数据内部异方差的最大原因之一是范围特征之间的巨大差异。
它是一个图表,在垂直轴上显示所有残差,在 x 轴上显示特征。如果数据点随机散布在没有图案的线上,那么线性回归模型非常适合数据,否则我们应该使用非线性模型。...找出数据是线性还是非线性的三种最佳方法 - 残差图 散点图 假设数据是线性的,训练一个线性模型并通过准确率进行评估。 4、什么是多重共线性。它如何影响模型性能?...在训练数据上有两个高度相关的变量会导致多重共线性,因为它的模型无法在数据中找到模式,从而导致模型性能不佳。所以在训练模型之前首先要尽量消除多重共线性。 5、异常值如何影响线性回归模型的性能?...l1 和 l2 在训练数据较少、方差高、预测特征大于观察值以及数据存在多重共线性的情况下都很有用。 8、异方差是什么意思? 它是指最佳拟合线周围的数据点的方差在一个范围内不一样的情况。...检验异方差的最好方法之一是绘制残差图。 数据内部异方差的最大原因之一是范围特征之间的巨大差异。
= 表示不等于 #让我们看看数据文件 sub #注意 R 将原始数据中的空白单元格视为缺失,并将这些情况标记为 NA。...,显着性检验标志着案例作为潜在的异常值。请注意,发现异常值的一种方法是寻找超出均值 2 个标准差以上的残差(均值始终为 0)。 接下来,让我们绘制一些模型图。...第一个散点图命令的额外参数标记每个数据点以帮助识别异常值。注意第二个图,如果残差是正态分布的,我们会有一条平坦的线而不是一条曲线。...现在我们制作测试之间关系的 3d 散点图。...#从你电脑上的文件中调入相关矩阵。
> agricul<-read.csv(file="11-2.csv") > y=agricul[,2] > x=agricul[,1] > plot(x,y) ###散点图检验异方差...从散点图可以看出,农作物种植业产值与播种面积存在某种线性关系,说明可以用线性回归进行分析,但是我们发现一个问题,即农作物种植业产值的离散程度随着播种面积的增加而增大,在散点图上表现为“喇叭”型分布,这实际上是说明数据存在异方差...异方差的主要后果是回归参数估计量不再具有有效,因此会对模型的F 检验和t 检验带来问题。因此在计量经济分析中,有必要检验模型是否存在异方差。...异方差的检验方法主要有散点图、残差图、Goldfeld-Quandt检验、Glejser检验和White检验。 (一)散点图与残差图 定性分析主要利用散点图和残差图的形状来初步判断异方差的存在性。...散点图和残差图呈“喇叭”型分布,说明例子的数据可能存在递增型异方差。但定性分析只能提供一个主观、初略的判断,还需进一步借助更加精确的检验方法。
异常值的几种情况 数据分析中,异常值是比较难于界定的,一般数据异常值会有几种情况: 单值异常 如下图所示,某市场产品客群的样本分布中,年龄为0-5岁与150-200岁即可判定为异常...如下为实现该散点图的SAS代码: ? ? 突发异常 如果出现下图情况,首先需要思考为什么会出现异常值,针对这种激增的异常,我一般会添加一个哑变量,用哑变量去表示该点发生了异常情况。...一般,如果判断了该点确实为异常值,我会标记出该点并禁止其入模,这里还需要注意区分强影响点与异常值的区别,如何判断某点是异常值还是强影响点?...回归中的强影响点 通常,回归模型可以用如下方法判断强影响点: 剔出残差 杠杆值 COOK距离 协方差比 异常值怎么处理 一般,我习惯用盖帽法去处理数据中的异常值,即: 如果一个置信区间左右两边各有三个标准差...通常,回归模型对于异常的敏感程度还算可以,有异常值放在那里也问题不大,但对于对异常值非常敏感的模型,一般需要删除掉两倍标准差以外的异常值了,例如聚类分析。
一种常用的方法是: 建立一个坐标系,横坐标表示入射角,纵坐标表示折射角; 将入射角及其对应的折射角,作为坐标系中的一个坐标点,在此坐标系中把点标记出来。...在实际业务中,散点图的样式可能具有多种,而且也不一定都是用来寻找某种函数关系。...从数据表中可以看出,我国部分城市 1 月份最低气温,有的在 0℃ 以上,有的在 0℃ 以下。对于这类数据,用条形图显示,结果是这样的。 ?...图 10 箱线图 通过箱形图,可以观察到如下信息: 数据的统计值为中位数、最大值、最小值等 数据集中是否存在异常值,以及异常值的具体数值 数据是否是对称的 数据的分布是否密集、集中 数据是否有偏向性 还要提到股票...在这个基础上,还有很多变形,这些变形可能综合了多种含义,比如堆积柱状图,能比较不同量之间的大小,也能部分显示分布情况。
异方差的检验 残差图直接观察: 绘制残差关于自变量的散点图,若残差均匀离散地分布在零线两侧则方差较为显著。...若残差呈现一定趋势和规律,则说明残差方差为异方差,因为其变化趋势受自变量影响,其值在统计学上不能认为为常数。...自相关的检验方法 图示检验法: 计算随机误差项的估计值:残差,并绘制 {e_t},{e_{t - 1}} 的散点图。...在进行消除自相关和异方差可以使用BOX-COX方法进行处理,选取合适的系数值进行变换后,求得回归方程。...,在剩余变量中选取一个与当前选取变量组合,计算所有的组合情况,并选出最优组合与先前组合进行了比较,若更优则选取,若更差则放弃; 考虑上一步增加的变量,再次在剩余变量中选取并组合,计算组合情况选择最优,并与与上次组合结果比较优劣
本文会带你学习: 数据分析流程 特征工程 缺失值、异常值、重复值的处理 箱线图怎么判断异常值 观察散点图、箱型图、箱线图等进行分析 两独立样本T检验 用到的库:numpy 、pandas、 matplotlib...左侧的子图是严重的右偏分布,在取对数后基本上趋于正态分布。 ? 4.2.2.2 使用边界值替换 我们可以对异常值进行截断处理,即使用临界值替换异常值。例如,在3σ与箱线图中,就可以这样来处理。...;last:除了最后一次出现外,其余相同的被标记为重复;False:即所有相同的都被标记为重复;使用duplicated()函数检测标记Series中的值、DataFrame中的记录行是否是重复,重复为...从结果图中我们可以看到,从大致的地理位置上看,西部城市好于东部城市,南部城市好于北部城市。 5.3 临海城市是否空气质量优于内陆城市?...使用边界值替换与分箱离散化在AQI分析与预测下部分会详细讲解。期待AQI 分析与预测下部分的学习吧,包括散点图矩阵、相关系数等。
缺点: 对异常值敏感:OLS对异常值比较敏感,因为它会直接受到异常值的影响,导致参数估计的偏差。 计算复杂度高:当数据集较大时,计算正规方程的逆矩阵可能会变得非常耗时,甚至不可行。...接下来,定义了一个函数 evaluate_model 来评估模型的性能,并计算了模型在测试集上的均方误差(MSE)。 通过选择不同的自变量组合进行模型拟合,并打印了相应的 MSE 值。...最后,绘制了拟合曲线,并标记了每个模型的均方误差(MSE)。 大家可以清晰地比较不同正则化方法和多项式阶数对拟合效果的影响。 7....异方差性的检验: 异方差性指的是残差的方差随着自变量的变化而变化,即残差的方差不是恒定的。可以通过绘制残差与预测值的散点图,观察残差的方差是否随着预测值的变化而变化。...绘制了残差的直方图和残差与预测值的散点图,并计算了模型的均方误差。 通过观察直方图和散点图,可以初步判断残差是否近似于正态分布、是否存在异方差性。根据均方误差的大小,可以评估模型的拟合程度。 8.
如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过三倍标准差的值。如果数据不服从正态分布,也可以用远离平均值的多少倍标准差来描述。 (3)箱型图分析。...QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差,其间包含了全部观察值的一半...1.直接绘制散点图 判断两个变量是否具有线性相关关系最直观的方法是直接绘制散点图。 ...2.绘制散点图矩阵 需要同时考察多个变量间的相关关系时,可利用散点图矩阵来同时绘制各变量间的散点图,从而快速发现多个变量间的主要相关性。 ...研究表明,在正态分布假定下,Spearman秩相关系数与Pearson相关系数在效率上是等价的,而对于连续测量数据,更适合用Pearson相关系数进行分析。 判定系数。
如上图所示,箱线图主要包含几个关键的数据,上、下四方位数,中位数,上、下边缘以及异常值。简单来说,上四分位数表示全部数据中有四分之一的数据大于它,异常值表示远离上或下四分位数。...可以看到每种属性都有异常值,远超于普通宝可梦,其中血量值的异常值数量最多。 接着我们来看不同的代目的各种属性的分布特征,共用同一个Y轴,同时绘制四张子图。...另外我们还可以在boxplot中添加参数hue,分门别类地进行箱线图绘制,这里根据是否为神兽来做区分,显然神兽的防御属性远超非神兽。 ?...我们可以清楚地看到有一部分电系宝可梦的攻击力在60左右,小提琴图有明显的膨胀部分;而岩石系的宝可梦的攻击力分布较为平均,小提琴图呈长窄形状。...分簇散点图 分簇散点图可以理解为数据点不重叠的分类散点图,swarmplot函数类似于stripplot函数,但该函数可以对点进行一些调整,使得数据点不重叠。
对数据做一些变换的目的是它能够让它符合我们所做的假设,使我们能够在已有理论上对其分析。...logx : bool, 可选 如果为True,则估计y ~ log(x)形式的线性回归,在输入空间中绘制散点图和回归模型。注意x必须是正的。...在某种意义上,回归函数 在从数据估计到的未知参数中是线性的。因此,多项式回归被认为是多元线性回归的特例。...{x,y}_jitter floats, 可选 在x或y变量中加入这个大小的均匀随机噪声。对回归拟合后的数据副本添加噪声,只影响散点图的外观。这在绘制取离散值的变量时很有用。...可以选择将最低平滑度拟合到残差图,这可以帮助确定残差是否存在结构 lowess 布尔值,可选 在残留散点图上安装最低平滑度的平滑器。
映射的例子包括: 位置(即在x和y轴上) 颜色(“外部”颜色) 填充(“内部”颜色) 形状(点数) 线型 尺寸 首先,必须添加x轴和y轴的位置,因为geom_point需要有关散点图的最基本信息,即要在...将这些图层添加到当前图中,x轴标记为“年龄(天)”,y轴标记为“平均表达量”。 使用ggtitle图层为绘图添加标题。...在框的上方和下方延伸到的点代表数据集的最大值和最小值。图的直线达到的点是除异常值外的最小值和最大值。 使用四分位值(IQR)确定异常值,IQR定义为:Q3-Q1。...在R的术语中,输出被定向到特定的输出设备,并指示输出文件的格式。必须创建或“打开”设备才能接收图像输出,对于在磁盘上创建文件的设备,还必须关闭设备才能完成输出。 将散点图输出成pdf文件格式。...然后我们使用刚刚创建的ggplot散点图将图像绘制到设备上。
该算法将数据样本看作是一个层次化的结构,在每个层次上不断合并最近的样本,直到所有样本都合并为一个簇或达到预设的聚类个数。...最后,通过绘制散点图,将样本点按照聚类结果进行可视化展示。总结Hierarchical Clustering算法可以找到数据样本之间的聚类结构,并自动划分为不同的簇。...最后,根据聚类结果,绘制了购买次数和浏览时长的散点图,不同群体用不同颜色标记。...这使得在大规模数据集上的应用受到限制。对噪声和异常值敏感: Hierarchical Clustering算法对噪声和异常值比较敏感,这可能导致聚类结果的不稳定性。...由于层次聚类的过程中会不断合并或分割簇,一个异常值的存在可能会影响整个聚类结果。
异方差的检验 2.1 图示法 观察 “残差 与拟合值 的散点图” 或者 “残差 与某个解释变量 的散点图” 。画图是直观方法,但不严格。 ?...rvpplot lnq // 残差与解释变量 lnq 的散点图 ?...假设已把 ${\hat \sigma_{i}^2}_{i=1}^n$ 存储在变量 var 上,可通过如下 Stata 命令来实现 WLS : */ reg y x1 x2 x3 [aw=1/var]...假设已把 ${\hat \sigma_{i}^2}_{i=1}^n$ 存储在变量 var 上,可通过如下 Stata 命令来实现 WLS : reg y x1 x2 x3 [aw=1/var] 其中,“...使用 OLS 时,变量 lnpl 的 p 值为 0.13,在 10% 的水平上也不显著; 使用 WLS 后,该变量的 p 值变为 0.002,在 1% 的水平上显著不为 0。
领取专属 10元无门槛券
手把手带您无忧上云