首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

统计学与pandas学习(一)——频数分布表和直方图

结合pandas学习《极简统计学》。第一章《用频数分布表和直方图刻画数据的特征》练习。 理论 根据原始数据什么也搞不明白,所以使用统计。...“统计”的手法,就是从原始数据,也就是“原始的现实”中,抽取出分布的特征和特点的方法。 统计学使用的方法叫“压缩”,是指“将作为数据列举的大量数字,以一定的基准进行整理,只抽取有意义的信息”。...此数字叫做“统计量”。...做频数分布图,首先需要做频数分布表,步骤如下: 找到数据中的最大值和最小值; 分组:按最大值、最小值划分范围; 决定“组值”:一般选择中间的数值; 数出各组中的数据数——“频数”; 计算“相对频数”,即各组的频数占全体的比例...,相对频数相加等于1; 计算“累计频数”,即频数合计,累计频数最终与全部数据数一致。

6.5K20

「R」频数检验

问题 你有分类数据然后想要检验是否这些数据值的频数分布是否与预期不符,或者是否组间的频数分布有(显著)差异。...方案 频数检验通常解决两类问题: 频数分布与预期或者理论的分布(比如50%的yes,50%的no)符合吗?(拟合优度检验) 两组或多组之间的频率分布有差异吗?...(独立检验) 通常用于解决这样问题的统计检验方法,分为精确检验与近似检验两种。...conf.int #> [1] 0.3742735 0.7453925 #> attr(,"conf.level") #> [1] 0.95 独立检验(比较组间) 卡方检验 想要检验控制和处理组结果的频数差异...data: ct.6 #> Cochran-Mantel-Haenszel M^2 = 2.0168, df = 3, p-value = 0.5689 McNemar检验 McNemar检验概念上是频数数据的一个被试内检验

1.2K10

Linux常用统计命令大全

简介Linux系统作为一种常用的操作系统,具有丰富的命令行工具,其中包括了许多用于统计数据的命令。这些命令可以帮助系统管理员和开发人员轻松地分析和处理数据。...本文将介绍一些常用的Linux统计命令,帮助读者更好地理解和使用它们。grepgrep命令用于在文本文件中搜索指定模式的文本行,并输出匹配的结果。...示例用法:wc -l filename # 统计行数wc -w filename # 统计单词数wc -c filename # 统计字节数sortsort命令用于对文本文件进行排序,...示例用法:df -h # 显示磁盘空间使用情况(人类可读格式)总结Linux提供了丰富的统计命令,可以帮助用户轻松地处理和分析数据。...本文介绍了一些常用的统计命令,包括grep、wc、sort、uniq、du和df等。希望本文能够帮助读者更好地理解和使用这些命令,提高工作效率。

12410

聊聊 Linux 的内存统计

点击上方“小强的进阶之路”,选择“星标”公众号 优质文章,及时送达 预计阅读时间: 18分钟 写在前面 本文主要分析 Linux 系统内存统计的一些指标以及进程角度内存使用监控的一些方法。...所以下文直接就找一台 Intel x86_64 架构下安装了 64bit Linux 系统的服务器作为例进行相关的实验和结果分析。...Linux 的内存管理从物理内存管理到虚拟内存管理涉及的概念和统计项实在太多,本文从实用和系统运维的角度出发,只列举一些最实用的统计。...Linux 2.4.10 内核之前,磁盘的缓存有两种,即 Buffer Cache和 Page Cache。前者缓存管理磁盘文件系统时读取的块,后者存放访问具体文件内容时生成的页。...共享内存、可执行程序的文件、动态库、mmap的文件等都统计在这里 Shmem — 共享内存的大小,包括Shared Memory、tmpfs和devtmpfs 注意 Linux 的内存是真正使用时才分配的

5.9K40

linux统计文件数目+linux统计指定时间的文件总数

如果ls -lR|grep "^-"|wc-l则可以连子目录下的文件一起统计。...grep ^- 这里将长列表输出信息过滤一部分,只保留一般文件,如果只保留目录就是 ^d  wc -l 统计输出信息的行数,因为已经过滤得只剩一般文件了,所以统计结果就是一般文件信息的行数,又由于一行信息对应一个文件...需要说明的是第二种方法会比第一种方法快很多,尤其是也统计子目录时。...linux统计指定时间的文件总数 由于工作原因,需要统计某目录下atime时间大于365天的文件,google搜索之后,发现find命令异常强大。...-atime +365 网上有答案; -exec:表示执行后面的命令; ls -l:略过; {} \; :表示前面find...找到的结果;  grep "^-": 过滤,只保留文件; wc -l: 统计数目

5.9K40

抖音开放平台用户授权获取用户的粉丝统计和短视频数

anchorService.saveDouyin(accessToken, anchorUuid, openId); } } 4.3、根据access_token和open_id就可以获取到该用户的基本信息和粉丝统计数据...logger.info("fansData result=" + response); return object; } 用户信息接口没有返回该用户的粉丝数,倒是在粉丝统计数据接口那边返回来粉丝数...image.png 粉丝活跃分布 image.png 粉丝设备分布 image.png 粉丝兴趣分布 image.png 4.4、根据access_token和open_id就可以获取到该用户所有的抖音短视频数据...image.png 这里不得不吐槽一下,像粉丝数、作品数、点赞数、总评论数、总分享数等这些和用户相关的字段应该统计出来在用户信息那个接口就要返回来的,这样能给开发者省了很多时间,而且更符合常理,不知道抖音是怎么想的

5.5K31

Python爬虫音频数

一:前言 本次爬取的是喜马拉雅的热门栏目下全部电台的每个频道的信息和频道中的每个音频数据的各种信息,然后把爬取的数据保存到mongodb以备后续使用。这次数据量在70万左右。...音频数据包括音频下载地址,频道信息,简介等等,非常多。...昨天进行了人生中第一次面试,对方是一家人工智能大数据公司,我准备在这大二的暑假去实习,他们就要求有爬取过音频数据,所以我就来分析一下喜马拉雅的音频数据爬下来。...分析频道 3.下面就是开始获取每个频道中的全部音频数据了,前面通过解析页面获取到了美国频道的链接。...异步 五:总结 这次抓取的数据量在70万左右,这些数据后续可以进行很多研究,比如播放量排行榜、时间区段排行、频道音频数量等等。后续我将继续学习使用科学计算和绘图工具来进行数据分析,清洗的工作。

1.4K80

Linux系统噪音统计(osnoise tracer)

Linux系统中作为一个普通线程是非常苦逼的。不仅NMI 、硬中断、软中断可以打断它,甚至其它普通线程也可以来打断干扰到它的运行。...从Linux 5.14-rc1开始引入了一个新的tracer---(osnoise tracer)。就是从一个线程thread的角度把这些噪音全部详细统计出来。...统计到这个程度,感觉还是不够详细。 可以打开osnoise对应的trace event....代码实现: 在以上每个打断事件处理函数中都插上trace event的钩子函数 来统计事件的执行时间,然后在每个cpu上运行一个内核线程进行周期性统计....我在阅码场发布过一个视频课程,对linux系统中各个tracer的使用和代码实现都有非常详细的讲解: ---end---

1.2K20
领券