考勤数据统计

读取考勤数据

import pandas as pd
myKq = pd.read_excel("kq.xlsx")
myKq[u'打卡日期'].values
array([u'2017-12-29 17:33:26', u'2017-12-29 17:31:54',
       u'2017-12-29 17:28:55', ..., u'2017-01-03 17:05:55',
       u'2017-01-03 12:32:11', u'2017-01-03 10:24:25'], dtype=object)
import numpy as np
#myKq.insert(1,'city',myKq['address']) #先复制原来的列
daytime = myKq[u'打卡日期'].map(lambda x:x.split(' ')) #分别处理新旧两列
day, time = [],[]
for d in daytime:
    day.append(d[0])
    time.append(d[1])
myKq['day'] = day
myKq['time'] = time
myKq.tail()
import matplotlib.pyplot as plt
from datetime import datetime
from matplotlib.font_manager import FontProperties  
font = FontProperties(fname=r"C:\\WINDOWS\\Fonts\\simsun.ttc", size=14)

def getMin(arrtime):
    a = (arrtime).split(":")
    return (float(a[0])-9)*60+float(a[1])
plt.figure()
def getMax(arrtime):
    a = (arrtime).split(":")
    return (float(a[0])-18)*60+float(a[1])

df = myKq["time"].groupby(myKq['day'])

night = df.max().map(lambda x:getMax(x))
morning = df.min().map(lambda x:getMin(x))
colors = np.array(['g']*morning.size)
dic_c_l = {'g':'work day', 'r':'friday', 'b':'weekend'}
for index, day in enumerate(morning.index):
    week = datetime.strptime(day, '%Y-%m-%d').weekday()
    if (week+1 == 5):
        colors[index] = 'r'
    elif (week+1==6 or week+1==7):
        colors[index] = 'b'
fig = plt.figure(figsize=(14,5))
ax1 = fig.add_subplot(121)

plt.xlabel(u'上班(day)',fontproperties=font)  
plt.ylabel(u'加班时间',fontproperties=font)  

for index, value in enumerate(dic_c_l.keys()):
    temp = np.where(colors==value)
    ax1.scatter(temp, night.values[temp], c=value,marker= 'o', label= dic_c_l[value])
ax1.legend(loc='upper left')

ax2 = fig.add_subplot(122) 
ax2.hist(night, bins = 40, normed= 0)


plt.xlabel(u'加班分钟数',fontproperties=font)
plt.ylabel(u'次数',fontproperties=font)

plt.show()
fig = plt.figure(figsize=(14,5))
ax1 = fig.add_subplot(121)

colors = np.array(['g']*morning.size)
dic_c_l = {'g':'work day', 'r':'monday', 'b':'weekend'}
for index, day in enumerate(morning.index):
    week = datetime.strptime(day, '%Y-%m-%d').weekday()
    if (week+1 == 1):
        colors[index] = 'r'
    elif (week+1==6 or week+1==7):
        colors[index] = 'b'
        
plt.xlabel(u'上班(day)',fontproperties=font)  
plt.ylabel(u'迟到时间',fontproperties=font)  

for index, value in enumerate(dic_c_l.keys()):
    temp = np.where(colors==value)
    ax1.scatter(temp, morning.values[temp], c=value,marker= 'o', label= dic_c_l[value])
ax1.legend(loc='upper left')

ax2 = fig.add_subplot(122) 
ax2.hist(morning.values, bins = 80, normed= 0)


plt.xlabel(u'迟到分钟数',fontproperties=font)
plt.ylabel(u'次数',fontproperties=font)
plt.show()

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ml

关于TF(词频) 和TF-IDF(词频-逆向文件频率 )的理解

TF(词频):  假定存在一份有N个词的文件A,其中‘明星‘这个词出现的次数为T。那么 TF = T/N; 所以表示为: 某一个词在某一个文件中出现的频率. T...

31960
来自专栏分子生物和分子模拟计算

Human Hemoglobin

14040
来自专栏SDNLAB

如何提高SDN可拓展性

Software Defined Networking是一种控制平面和数据平面分离的可编程的网络架构,目前已经有许多商业落地案例。在部署SDN时,往往会因SDN...

34170
来自专栏恰童鞋骚年

操作系统核心原理-6.外存管理(上)磁盘基础

  计算机是处理数据的机器,而数据就需要有地方存放。在计算机中,可供数据存放的地方并不太多,除了内存之外,最主要的存储数据的媒介就是磁盘。对于大多数计算机领域的...

16910
来自专栏大数据杂谈

Google Colab 免费GPU服务器使用教程

3.3K90
来自专栏大数据挖掘DT机器学习

Python爬虫股票评论,snowNLP简单分析股民用户情绪

一、背景 股民是网络用户的一大群体,他们的网络情绪在一定程度上反映了该股票的情况,也反映了股市市场的波动情况。作为一只时间充裕的研究僧,我课余时间准备...

49180
来自专栏瓜大三哥

FPGA内部资源介绍

39820
来自专栏WeTest质量开放平台团队的专栏

手游测试大杀器DS-5 StreamLine快速入门

Streamline是一款由ARM公司制作的终极性能测试利器,可以快速定位手游性能问题,甚至可以直接追溯代码。但Streamline需要自行搭建,确实让不少同行...

15220
来自专栏华章科技

干货 | 22个免费的数据可视化和分析工具推荐

当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City” ,同时其他人会说”New York, NY” 。因此你需要标准化这...

14940
来自专栏WeTest质量开放平台团队的专栏

UPA性能分析工具使用详解

自从WeTest宣布与Unity官方共同推出Unity性能分析工具UPA(Unity Performance Analysis)以来(Hi,我们和Unity合作...

14620

扫码关注云+社区

领取腾讯云代金券