首页
学习
活动
专区
工具
TVP
发布

我学python的第19天

我学python的第19天

今天是我学python的第19天,就因为学了python,我也是有三个周没有更新文章了,因为到了新公司,要适应大家的使用习惯,需要我学习写python,所以从入职的第一天起,我就开始每天写python,写下我19天的过程,先贴一个我最近写的代码,虽然还赶不上sas用的顺畅,但是基本我学会了基本的写循环了和函数了。

def group_percentiles(df,gg):

#功能:按照分位数统计各个分位数之间的占比

#输入:原数据集,要产品分位数的变量serise

#输出:输出每个变量的在每个分位数之间的统计

percentiles = np.array([1,5,10,25,50,75,90 ,95,99])

for x in range(1,len(gg)+1):

print(x)

if x==1:

yy=gg[1]

df=black_info_detail

ptiles_vers = np.percentile(df[yy], percentiles)

ptiles_vers=np.sort(list(set(ptiles_vers)))

cats = pd.cut(df[yy], ptiles_vers,right=False)

cats=pd.value_counts(cats)

cats=cats.reset_index(drop=False)

cats=cats.rename(columns=)

cats['varname']=yy

cats['rate']=cats['count']/sum(cats['count'])

else:

yy=gg[x]

ptiles_vers = np.percentile(df[yy], percentiles)

ptiles_vers=np.sort(list(set(ptiles_vers)))

cats1 = pd.cut(df[yy], ptiles_vers,right=False)

cats1=pd.value_counts(cats1)

cats1=cats1.reset_index(drop=False)

cats1=cats1.rename(columns=)

cats1['varname']=yy

cats1['rate']=cats1['count']/sum(cats1['count'])

cats=cats.append(cats1)

return cats

我这代码,肯定有很多可以改进的,要是会写python的粉丝看到我这代码可以改进的,麻烦留言区告诉我,现阶段所学到的函数,还不足以支撑我以几段代码写完我整个需求。

我从来写没写过python,铭仔会写一些python,但是因为我会写R,所以之前一些sas完成不了的算法,我都用R,不学习python的原因大部分是我懒,觉得SAS和R就够我使用了,这里不探究SAS、R、PYTHON那个最好用的问题,技多不压身。

我是统计专业的,所以我根本不懂计算机的东西,可能我们学了,但是我没好好学,所以一些很计算机的东西,我是完全不懂得,例如我不学python之前,我不知道什么叫json文件,至今我都感谢以前公司的数据的同事,都帮我解析了。

接下来就说下我学python的这19天吧~~

1

第一阶段

1、软件的基本安装以及使用。我用的软件是我的一个非常nice的同事给我的,叫spyder,这个软件的界面跟Rstudio有点类似,一个编译器来的,挺好用。

2、 熟悉python的最最最基本的语法,我这里不是说熟悉那种很多乱七八糟的函数,或者python的包之类的,就是简单的了解一下python里面,哪些是运行键啊,注释符号是什么啊,还有循环要空几个格之类的东西,因为这些最近基本东西都不了解的话,等下报错都知道怎么报错。

3、 分清楚在python中的各种数据类型,以及数据格式。Python中的数据格式,据我现在所接触到的哈,我也不知道自己了解全不全哈,就有serise list arrary dict dataframe这几种。Sas的数据格式相对简单一些,但是因为我之前学过R,这些数据格式理解起来也相对简单。

2

第二阶段

1、 写代码。我是那种学代码不爱看书的人,因为我看不下去,太慢了,而且还容易记不住,所以我就先自己弄了处理过的数据,把以前经常用sas处理数据的函数,先都写一遍,像什么数值转字符啊,转日期格式啊,模糊匹配,字符串处理等等之类的先基本写了一遍之后,你会发现,好无趣啊,都不知道自己在干嘛!

2、 看代码。其实上班学代码真的好无趣的,没啥目的性的东西,提不起兴趣,所以我学了一本比较基本的东西之后,我跟同事要了平时他们留着的一个函数(感谢我热心的同事),还有一些处理数据的过程,然后我开始拿我自己的数据,跑他们的代码,看到底在实现什么,然后把实现的方法记下来,毕竟写代码的思路很重要。

3、 独立完成需求。到这得时候,我已经学了一大概一个星期了,同事给了我一个需求,完成一个第三方的数据产品测试以及评估。这个数据让我为难了,不像以前就是直接一列一列的数据,返回的数据是一个json文件,我对json文件一无所知,但是同事给我时间啊,所以我就从最基本的,怎么解析,我以为python这么强大,估计一个函数就可以搞定了,但是我错了,json文件就是一层一层有一层,套了一套又一套。我每次以为解析完成了,完了里面还有一层,解析这个过程中,我不仅学了如何解析json文件以外,还学习了怎么将数据追加啊,merge成表啊,因为数据维度比较多,我还把同个流程的写成函数,就是在这个时候我完成了的第一个python函数。我准备我的第一个python代码裱起来,放在我家大厅看着。后面就是处理好的数据之后,我再简单写下衍生变量的代码,然后做下统计完成了这个需求。

3

第三阶段

我第三阶段是用python建模……,这个我最近在开始了做……..,看下周能不能来更新~~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180814B0BW4V00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券