前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python 数据分析之双色球高频数据统计

Python 数据分析之双色球高频数据统计

作者头像
Wu_Candy
发布2022-07-05 14:53:42
9350
发布2022-07-05 14:53:42
举报
文章被收录于专栏:无量测试之道
基础数据准备

基础数据是通过爬虫获取到。

以下是从第一期03年双色球开奖号到今天的所有数据整理,截止目前一共2549期,balls.txt 文件内容如下

Python 代码实现

分析数据特征和数据处理方式选择

代码语言:javascript
复制
#导入Counter
from collections import Counter

def readfile():
    red_lists=[]
    blue_lists=[]
    #打开文件并获取文件句柄
    with open("./balls.txt", "r",encoding='utf-8') as fp: 
    #开始读取文件并返回一个list
    list1=fp.readlines() 
    #遍历整个文件内容
    for i in range(len(list1)):
        #替换掉\n的字符再按空格分隔
        list2=str(list1[i]).replace("\n","").split(" ")
        for j in range(len(list2)):
            if j==6:
               #蓝球放入到blue_lists 列表中
               blue_lists.append(list2[j])
            else:
               #红球放入到red_lists 列表中
               red_lists.append(list2[j]) 
        #Counter可以快速便捷的对某些对象做一些统计操作,这里是对列表里面的数据进行出现次数统计,返回一个tuple
        red_count=Counter(red_lists)
        blue_count=Counter(blue_lists)
        #most_common可以用来统计列表或字符串中最常出现的元素并做排序,并返回一个list
        k = red_count.most_common(len(red_count)) 
        #输出出现频率最高的六个红球
        print("the red ball:",k[:6]) 
        l = blue_count.most_common(len(blue_count))
        #输出出现频率最高的六个蓝球
        print("the blue ball:",l[:6]) 
        
if __name__=="__main__":
    readfile()

执行结果
执行结果对比验证

从官网获取的数据进行对比,一致性校验通过

总结:

Python 在数据处理方面有着非常强大的优势,Python 的 Panda 库也可以非常出色的完成双色球的数据统计,大家有兴趣的可以实验一下。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无量测试之道 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基础数据准备
  • Python 代码实现
  • 执行结果
  • 执行结果对比验证
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档