【Python环境】python 中数据分析几个比较常用的方法

1,表头或是excel的索引如果是中文的话,输出会出错

解决方法:python的版本问题!换成python3就自动解决了!当然也有其他的方法,这里就不再深究

2,如果有很多列,如何输出指定的列?

需求情况:有的时候,数据很多,但是只要仅仅对部分列的数据进行分析的话,要怎么做?

解决方法

df = pandas.read_excel('1.xls',sheetname= '店铺分析日报')

df = df.loc[:,['关键词','带来的访客数','跳失率']] #访问指定的列

一行读取数据,第二行访问指定列

3,如何为数据框添加新的列?

需求情况:有一个表格,里面的列是单价,数量,想再输出一个总价的列,或是对一些数据进行总结

解决方法:直接上代码

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

#把计算结果添加为一个新的列

df['result'] = df.price*df.num #新的列名,后面是对应的数值

print (df)

4,如何对百分号的数值进行计算,再将其输出

需求情况:比较蛋疼的一个情况,电商很多数据都是百分比的,带有百分号,不能进行直接的计算,需要对其进行转换,然后再输出

解决方法:

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

f = df['跳失率'].str.strip("%").astype(float)/100;

f.round(decimals=2) #保留小数点后面2位

f_str = f.apply(lambda x: format(x, '.2%')); #再转换成百分号并且保留2位数(精度可以调整)

df['跳失率'] = f_str #重新赋值

5,如何获取导入的数据有几行和几列(数值)

需求情况:有的时候需要写一个通用脚本,比如随机抽样分析,程序自动获取行和列的话,写出来的脚本通用性明显会很强

解决方法:

df.columns.size #获取列数

df.iloc[:, 0].size #获取行数

6,如何对数据进行排序

需求情况:这个就不用说了,到处都要用到

解决方法:

df['跳失率'].size #对数据进行排序

newDF = df.sort(['曝光量', '带来的访客数'], ascending=[True, False]); #多重排序

7,如何删除指定的列?

需求情况:同样,十几列的数据,如果你想获取指定的输出数据,可以用方法2,但是如果想要获取的数据列比较多,只有1-2行不想要,这样就可以用指定删除列的方法了

解决方法:

df.columns.delete(1)

一行代码搞定!

总结:整体来说的,python的语法在做数据分析还是相当简单的,很多的需求基本上就是一行代码搞定!

8,如何添加整行数据?

df.append([1,2,34,,5])

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2015-10-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏技术专栏

慕课网Flask高级编程实战-6.书籍详情页面的构建

大多时候,我们从数据库,或者外部网络获取到的原始数据,并不能满足复杂的业务需求。业务的直观体现就是页面。

23510
来自专栏一个会写诗的程序员的博客

编译器之自举

**要阅读本文,不需要太高深的编译原理知识,甚至不需要编译相关的知识。但是本文也不是面向对电脑一无所知的读者的,你至少要知道:

19310
来自专栏java工会

编写高质量代码的思考

最近在看《代码大全》,可以说是一本软件开发的百科全书,特别厚,但是干货也很多。平时写代码,代码规范是一个最低的要求(很多老代码连最低要求都达不到),为什么要这样...

9600
来自专栏Java架构师进阶

编写高质量代码的思考

最近在看《代码大全》,可以说是一本软件开发的百科全书,特别厚,但是干货也很多。平时写代码,代码规范是一个最低的要求(很多老代码连最低要求都达不到),为什么要这样...

11120
来自专栏CSDN技术头条

改变开发者编码思维的六种编程范式

译者注:本文介绍了六种编程范式,提到了不少小众语言,作者希望借此让大家更多的了解一些非主流的编程范式,进而改变对编程的看法。以下为译文: 时不时地,我会发现一些...

503100
来自专栏生信技能树

【生信菜鸟经】如何系统入门Perl

Perl是典型的脚本语言,短小精悍,非常容易上手,尤其适合处理文本,数据,以及系统管理。它在老一辈的生物信息学分析人员中非常流行,出于历史遗留原因大家肯定会或多...

44290
来自专栏决胜机器学习

设计模式专题(二)——策略模式

设计模式专题(二)——策略模式 (原创内容,转载请注明来源,谢谢) 一、概述 1、含义 策略模式(Strategy)是一种定义了各类算法的模式,其将各种算法...

35780
来自专栏Petrichor的专栏

python: 将列表中的字符串 连接成一个 长路径

  今天实习公司分配了一个数据处理的任务。在将列表中的字符串连接成一个长路径时,我遇到了如下问题:

9820
来自专栏数据科学与人工智能

【Python环境】如何使用正确的姿势进行高效Python函数式编程?

关于函数式编程 有哪些函数式语言? 其实函数是语言很早就出现了,上世纪30年代出现的Lambda和50年代的LISP,比面向过程和对象的语言出现的更早,现代的C...

232100
来自专栏机器之心

在Python 2.7即将停止支持时,我们为你准备了一份3.x迁移指南

35140

扫码关注云+社区

领取腾讯云代金券