由于互联网的快速发展,网络上存储了越来越多的数据信息。各大公司通过对这些数据进行分析,可以得到一些有助于决策的信息。
比如通过对某些用户的淘宝浏览记录数据进行分析,可以发现这些客户的潜在消费点,通过分类定点投放广告,增加商品的销售。
再比如信贷领域,可以通过分析申请人的征信数据,建模计算出申请人逾期的可能性大小,决定是否放贷,从而提高公司资金的使用价值。
在数据分析越来越热门的今天,学会数据分析,就是你升职加薪的重要砝码。
从今天开始,本公众号会出一系列数据分析和建模的免费教程。帮助大家快速入门数据分析,领悟python的魅力。
本文是数据分析的第一课,教大家如何在python中手动建立数据框,这个是数据分析的基础,也是数据测试常用的一个工具。
本文目录
1 导入包
对于没有安装python的同学,请自行按照网上的教程安装好python,建议安装一个anaconda,这样很多库也顺带安装好了。
#coding:utf-8 #申明编码格式,使用中文
import pandas as pd #导入包并给这个包取了一个别名pd
from pandas import DataFrame #导入pandas中的DataFrame类
首先,在jupyter中导入pandas包,由于要建立的数据框中包含中文,所以在代码的开头加了个coding为utf-8的申明。
2 要建立的数据框
我们要在python中手动建立的数据格式如下:
每行代表一个学生,各列分别表示如下:ID表示学号,name表示姓名,gender表示性别,age表示年龄,height表示身高。
3 建立以上数据框的python代码
把以上表格用python中的字典表示出来,并用pd.DataFrame函数把该字典转成数据框。
date = {'ID': ['1000001', '1000002', '1000003', '1000004', '1000005', '1000006', '1000007', '1000008'],
'name': ['鲁一凡', '唐妮娜', '周颖慧', '邹彩旗', '张泽坤', '李佳旻', '凌子洲', '赵浚琦'],
'gender': ['男', '女', '女', '女', '男', '女', '男', '男'],
'age': [17, 18, 20, 19, 18, 16, 17, 18],
'hegth':[1.78, 1.68, 1.62, 1.73, 175, 160, 1.82, 180]
}
date_frame = pd.DataFrame(date)
4 打印建立好的数据框
在jupyter中输入data_frame关键字即可得到如下结果:
至此,在python中手动建立数据框的任务已经完成啦,大家也跟着这个教程动手建立一个属于你的数据框吧