Python 人工智能数据分析库 19 pandas的使用以及二项分布 7 pandas读取数据原创

2021-12-062021-12-06 15:57:00播放339

点赞0 收藏 0

Python 人工智能数据分析库 19 pandas的使用以及二项分布 7 pandas读取数据学习猿地

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
就是没有index，也没有hier，那么如果你想要把ind加上，那么就把index这个注释掉，如果你想要把hier加上，就把hi的这个注释掉就OK了。下面的这一个东西叫做columns column是干嘛的？叫做说保存指定的列，什么叫做保存指定的列？也就是说我们这里边它是有这太卡了，我一下划大有ABCD4列的，如果我们要去保存指定的列，就保存BCA这个列的话，那么就可以把这个东西指定上，指定上之后它就给我们保存的是BCA，我们来可以试一下，那么这个二应该就变化了，我把它关掉，来重新打开这个二来看是不是就剩三列了，这是这个是一列，这是一列，这是一列，而且它的顺序是按照BCA来的，我们来看这一个东西，应该是列的最开头的那个东西，我们来看一下是不是这1.6728对吧，那么这一列是C。
01:00
序列，那么这一列应该就是A列，1.089啊，所以这就是to csv，那我们再来看一下这个叫做做什么来着，瑞的CSV上节课上一次我已经给大家去做过了，这个东西就是read csv的一个方法，我来先简单的看一下read csv啊，那么这个东西叫做unna的啊，A named什么意思来看这个地方我们是不是给他了一个A，就是存储的数据里面包含ABC啊，包含这些个head，那么它在获取完了之后，会把这个head去对应上，但是你注意一个事情，就是我们是不是把index也存在里面了，他把index也当成数据给它读出来了啊，他把index也当数据读出来了，那么这个时候你如果想要去把index啊，你如果想把index不当成数据读出来怎么办？那么就需要用下面的这种更多的参数里面内容，我们来把下面这个看一下啊，有点卡，这有点太有点太卡了，我这受不了了，一会我一定要。
02:00
要把我的电脑重启一下来来看，就是他说我读的是叫做负点CSV，这个地方你可以指定分隔符，默认就是这个逗号是否，所以这一块基本上不用啊，就所有存储CSV的人大概都知道这块要用逗号是做分隔来，Had等于零啊，Had等于零，Had等于零的意思是指说将默认的是将第一行作为表头，什么叫做第一行来，我们刚刚是不是把第一行是abcd啊，我来看一下负点CSV啊，把这个删掉，来看第一行是不是abcd啊。那么他就会把第一行当做我们的，叫做columns，那么也就是说当做我们的列表，当做我们的列表，然后来，那么这个地方你也可以去，呃，叫做指定称浪，那么指定称浪的话，就没有东西去当做列表，那么来再往下看，下一个叫做index column啊，Index column index column的话是说以哪一行去做索引啊，再说一遍，以哪一行去做索引，来我们来继续啊，那么就是我们可以用这个来，我们把它试一下啊，我们用这个T等于零，这个是不变的，我们把这个column index column给他试一下，试一下它是什么样的结果，来我们来试一下，他说叫做看一下问题啊，叫做index name invalid，诶，怎么卡了index name invalid，那么也就是说这个name是不是不存在呀，是不是不存在啊？
03:40
看一下啊，是不是没有啊，我们应该以什么来去做它的这个，这个应该是以abcd吧，所以我们应该以的是叫做AB啊，然后是B来做它的索引，来再看一下，是不是他就把A的这一列和B的这一列当做索引，而后面的这些东西当做的值了呀，对吧，A的这一列和B的这一列当做它的，所以后面这个当做它的值，那么来后面这个叫做names names啊，Names的意思是指说不使用CSV的表头，是用自定义的这个表头来做，我们来看一下，如果我们把这个index column给它注释掉，那么把names给它打开，来看一下，Names给它打开，那么names给它打开的话，我们来跑一下会什么样的结果，Abcd看了吧，就是说相当于是我们把它的这个abcd替换掉了，之前的这个abcd啊，把它的abcd替换。
04:40
找了之前的这个啊，那么再往下的话，应该就是叫叫什么呢？这个叫什么，Use column use column。那么这个columns是指说我们去读取指定列啊，读取指定列我们来看一下它是什么样的效果吧，把它注去打开啊，什么关系吗？啊有什么有什么变化吗？看一下啊读取指定列0123，那么读取的是这个0123，也就是这是第零，这是第零列对吧。
05:13
这是第一列，这是第一列，这是第二列，这是第三列，他是不是把最后一列给干掉了，他应该是把最后一列给干掉了，我们来看是不是这样的情况啊，第零列是吧，第一列，第二列，第三列啊，那我再把它去掉，再看一遍啊，把它去掉是不是什么样的情况，你看最后一列是不是还存在呀，但是如果我们把它加上，那么最后一列就不存在了，所以它就会有这样的一个，就会有这样的一个区别，这样一个区别啊，那么我们把它干掉，因为它跟我们想要的内容不符，来再往下叫做n Rose，叫做读取前几行，跟刚才是不是会差不多，差不多呀，这个n Rose应该跟刚才的那个是差不多的啊，读取前几行，这就是第一行，第二行第三行0123啊，读取三行，那么这个地方你也可以去指定，比如说1万行，那是他是不是会全都读取出来啊，会全都读，他会把这1000行都读出来，那么这个叫。
06:11
默认把它注释掉，那么再来SK Rose是说我们从前到后去叫做叫做忽略几行啊，忽略几行，当然这个操作我觉得有很多时候这个操作是不是可以在我们的内存去完成呀，就是我们把数据读出来之后，然后用切片的方式把前几行切掉，是不是能跟这个达到一样的效果呀，所以一般我都是直接用这个RACSV，其他的我都不管，然后自己去做操作啊，那么这个地方，但是我给大家去叨叨一遍，你们有一个印象来好一下，那么就是它会去掉前两行啊，去掉前两行，但是它后面说了，我们可以用一个列表去去掉234行，那我们把列表拿过来去掉零啊，第二行，第三行，第四行，那么就是123这几行对吧，来给它干掉，那么下面就是k foot footer的意思是指说把从从底下开始去去掉，对吧？那么它这个是说必须配合engine等于Python来使用，否则。
07:11
会报警告，那么我们来看一下它是不是会报警告啊来它会报警告啊，它会报警告，所以那么得配合这个下面的engine来去实现，那么engine的话，你要把它改成Python啊，Pon pon看一下它说什么问题，叫做number of past names did not match number of of header fields in the please，就说我们指定的这个东西skip，我看一下它的问题是说number of past names是说我们给的这个个数跟跟我们下面的那个数值是不匹配的，来看一下是什么意思，哪到了，呃，我们给的个数跟下面的东西是不匹配的，有什么不匹配的，有哪是不匹配的？想一想啊，我们SK foot2，那么我们来看一下，如果是一好不好使，也不好使，默认是处。同时啊，是不是这个东西有问题啊，是不是这个东西有问题啊，我们来把它出示掉啊，我把它出示掉，那么这样的话我们再来看，诶也不。
08:11
不行，把它一支吃掉再来还是不行，咦，哎啊，在这在这引擎使用C更快，然后Python更完善，它应该是这报的错，这报的错我想想这报的错我们给的是Python没问题啊，我写错了吧，帮我看一下，我这个单词写错了吧，没写错吧，Engine也写错了吧，En，诶，没问题啊，那为什么一把这个skpeer给它加上就报错了，就报错了，是不是我上午还有一个问题没给大家说呢，什么问题来着，修改啊，那这样吧，我把这两个问题给大家去看一下吧，啊那么就是正好大家也看一下，如果我遇到问题怎么去解决是吧？啊百度，我遇到问题就是百度，然后百度找不着怎么办，谷歌是吧？百度找不着谷歌，我们把这个错误复制到这看一下啊，这个叫做number of past names did not match number of head啊，Did not match number of hi head in feels。
09:11
我知道了，我们这个names给的值1234，跟我们的那个his里面的值是不一样的，所以如果我们给它一个再加一个叫做F，它不就可以了，我们是不是，诶我们这个删掉了是吧？打开看一下，就是相当于说如果我们把这个东西打开的话，那么你看我把这个单词读完了之后，我就大概知道它是什么样的问题了，所以你们你们一定要学习学习英语是吧？啊这样的话会对你们就是，呃。叫做新学习内容有很大的好处啊，那么这个names是因为我们这边来看12345，它有五个数据，而我们之前只给他了四个表头，对吧？给他了四个表头，那么对于这四个表头来说的话，我们这个就是内容是不够的，那么用了这个engine等于Python之后，它内容是对应不上的，那么它就会给我们报错啊，其实跟这个skip，其实跟这个skip footer是没有关系的啊，我们以为是skip footer的问题，其实是这个的，我们把它如果去掉的话，它应该就报错吧，那么如果把它改成C，就应该是不报错，把它改成C就不报错，所以这是这个的问题啊，呃，问题是在这个地方，那么skip foot我们把它打开，比如说还得给它还原成二的话啊，还给它还原成二，是不是他说必须得用Python来做呀，我们把PY把它改成Python，然后那么按照刚才的话，我们就需要把这个地方给它多加一个叫做F。
10:43
那么这样的话，它就应该能够把最后的那一条来看，现在最后的一条是0.90.29078给它去掉啊对吧，这个变成什么0.0，那就是负的0.04，当然是0.0，什么0.0什么0.0.290.292078，这是这个叫做SK foot哎，我这一翻翻翻远了啊，那上午的那个，上午的那个问题还没解决吧，我找一下啊，上午的问题，上午的那个问题是给大家去看一下解决的，解决的解决的思路啊，我这个解决的思路就是他说你要去看这个这个网站啊，要去看这个网站，那么他说看这个网站，我们就看这个网站，应该就是这个啊，应该就是这个，那我把它这个放大一下，给大家看一下，这个网站里边说它有多多长，我这么长，我靠，那看来我是不是得总结一下，告诉你这也太长了，因为我如果把这个看完的话，有点太长了，有点太长哇去，我靠，这也太长了，我总结一下。
11:43
告诉你们，或者我们先看一下，呃，这个下面这个内容吧，叫做entif statusator using known indicators important for analy visualization and interactive display，这等于是什么都没说啊，Enable automatic and explicit data叫做叫做叫做叫做对齐啊，我怎么读我忘了，叫A对齐，这是一对齐的意思啊，Lotuit getting and setting subset of the data没说什么啊，等我总结一下再告诉你，这太长了，我这目前一时半会是看不完的，等我总结一下，然后呃，我们再继续啊，再继续按照刚才的这个这个步骤我们到哪了？大家是不是我们把这个read csv读完了，那么在读的过程中可能是会需要叫做时间的这样的一个呃，一个内容，我们把这个时间给它放。
12:43
同学啊，比C这就是我们的那个某一个CSV啊，某一个CSV我们是不是可以给它，呃，叫做改一下啊，比如说这个吧，我们给它删掉，删掉V，我们把这个东西给它放进去，那么这个CSV里面就包含这三条数据，那么上面的这一个应该是它的开对不对，应该是它的那个叫做columns啊，应该是它的columns，然后中间的这一个是它的数据啊，后面这两条是它的数据，我们来看一下，那么如果我们要把它读进来怎么办？是不是就是PD点瑞的下划线CSV括号，括号里边第一个我们要是给它的是叫做附点CSV，然后我们还要不要给他一些个参数啊，要不要给他一些个参数，我们给不给参数，这样我们先执行一下这个东西，看一下没问题，没问题我们就不给参数了，是吧，没问题就不给参数了，我以为会有什么问题啊，没问题就不给参数了，好，那么如果是这样的话，来看它有一个问。
13:43
问题啊，问题在于说这个data你觉得它是什么类型啊，它是不是应该是叫做object类型啊，我来看一下，那么就是我们把它给到一个具体的具体的变量，叫做AAA啊，我也不知道它应该叫什么，随便给一个AAA吧，我们来看就是AAA中括号引号date，其实应该是叫date塔啊，不知道它为什么叫date塔啊，那是不是一个叫A，不是我们说的那个object，它是IN64类型，那么实际上我们是不是应该想让它成为一个date类型啊啊，日期类型，还有后面的那一个，后面的那个，比如说是AAA中括号引号叫做time啊，它是不是object类型啊，Object类型意味着它可能是一个字符串，对吧？那么如何我们把这两个东西给它变成date类型啊，就是我们后面要所说的这个事情，看，在我们去read的时候，我们可以将这两条数据都变成date类型，我们把它过来。
14:43
好，把它复制过来，来，我们复制过来，那么先把下面这个注释掉，先用上面的这一个来看，这样的话就可以把data塔和date塔二都变成date塔类型，我们给大家可以看一下，这个叫aaa.csv我们那个叫做foo.csv塔是叫s fo吗？没错，它又怎么又搞错了，贝塔和TIME2有什么问题，SKLS啊，这个因为我们这个有S它才能够实现的了啊，所以它应该改掉，你看Z，我们来看一下Z是什么回知道Z看看有没有什么，没有什么问题，这里就是二零，这里叫什么2010201001，那么这个东西是不是就是相当于是把这两个合并了，我想要的不是这个效果啊，我把它删掉啊，来看我们是不是现在就将这两个东西都改成data塔类型了，来看Z里边我们再去判断这里边的贝塔来看。
15:43
看一下它是什么，它是不是就变成date time了，对吧？那么data的数据，这个data的这个数据已经变成date time了，已经是我们想要的那个内容了，可是问题在于说我们的这个第二行叫做time的这个列，它是不是前面加上了20190304呀，所以其实它加的是不对的，它加的是今天的这个这个日期，那么我如果我们想要的是说，其实我们可以把前面的这个date和后面这个time是不是给它组合到一起啊，那么如果要组合到一起，我们就需要给它再加一个。
16:17
列表啊，再加一个列表，就是变成这种列表的形式，变成这个样子，相当于是说我们将这两列的内容合并成一列，合并成一列之后，那么它就变成了一个date的类型，我们再来看一下，如果我们去推现一下啊，就是将data和time这两列变成了一列的内容，这是不是就对了，这就对了，但是注意它的它的这个名字是不是data_TIME2呀，也就是说这两列的一个组合，那么这个两列之所以还留着，是因为我们这里边有个叫做keep date column，如果我们把它注释掉的话，大家来看就没了，相当于是就没有了，那么或者是我们把它注释打开，这个地方改成false是不是也可以啊，也相当于是没有了，那么如果说我们觉得这个名字并不太好，我们先给它去，呃，先取一个名字的话，我们可以用字典来实现，那么就是这种方式啊，以用这种方式来去实现，来，我们把它打开。
17:17
把它打开，把这个pass this上面的这个给它关掉，那么用这种方式就能够去实现说给它改名字叫做S，来看它是不是改改了个名字叫S呀，那么如果我们想要把S当做是索引链，那么就可以加一个叫做index column，那么把S当做它的索引链，我们来看S就是它的索引链，剩下的就是这些个time name和AOK，那么这样的话我们就说完了啊，说完了这个时间的内容，那么下面这些呢，就是还有去存和取Excel的内容，我把Excel的内容说完啊，今天就结束啊，那么Excel的内容就是我们有这个需要安装这两个库啊，需要安装这这两个库啊，但是他说了安康达，如果你们用的是安康的话，它就已经自带了，那么为了判断它到底装没装上，我们也不知道，才赶紧讲完这个完事。
18:12
那么我们是不是可以用之前的命令叫做叹号，叹号如果他装了那就装了，如果没装就让他装是吧？看一下已经装了是不是requirement already satisfied已经装了，那么已经装了之后，我们就可以去叫做写入，这个叫做Excel，那么我们可以来CTRV，那么DF是不是我们上面那个data frame呀，那个data frame写入Excel叫做负XML，我们直接是生成一下，那么这边应该就能够看得到，这个叫做foo.xi，这XLX可以点开啊，这个东西不支持打开，不支持这么打开啊，那么呃，我去在这个叫做我们这个桌面里面，我们那个地方在18期的对18期数据的代码的这个地方，对吧，我们可以通过这个地方来，那么这就是我们的那个叫做叫做什么来着，呃，Exl的一个格式啊，Excel的一个格式，我们来看Excel的一个格式，并且它的。
19:12
当前的这一个标签里面叫什么？叫SHEET1吧，SHEET1，这是组SHESHE啊，Sheet就是跟我们的那个sheet是不是一个意思，这个叫做she，你能听出来这两个发音有区别吗？一个叫she，一个叫做shit，真的是不一样啊，外国人能听出来，我们可能有的时候听不出来来，那么这个东西就包含了，那么后面的话，他会给我们说，如果我们要去改这个名字怎么办，这种还是把这个值，就是把这个data放到SHE1里面，那么这个的话是说把这frame母放到呃什么什么上面，我们可以给它改一个名，后面改一个名，比如说我们叫它叫做这个是she，那么骂人的sheet是不是这个shitet，然后我们来看一下，改一下这个名啊，改一下名，改一下名，怎么还出错了，Formation denied，为什么？因为我们这边把它开启了啊，关掉就可以了，来，那么我们再来开启一遍看一下啊。
20:08
那么再把它打开一遍，应该它的名字就变成了叫做shift一块，就这个这个这个这个这个水箱卡啊，我它关掉，那么后续的话还有一些个操作，就是我们已经写上去了，写上去了之后，如果我们要写入的是多个工作表，多个工作表是不是就是多个shift呀？啊多个工作表就是多个shift，那么你就可以用这样的方式去写啊，我们就啊，我们来把这个执行一下试一下吧啊执行一下给大家去看一下试一下，呃，好，执行一下试一下，比说C这东西大家后续的话列习一下，就我们有没有A这个东西，有有没有PG这个东西，有那么直接来写，那么写完的话，我们可以到这边来看一下，我们这个S要负2F是吧，点开来看它变名了吗？看一眼啊。它叫做output来找output shit1shit2啊shit shit2，那么SHIFT1里面是我们DF里面的内容，SHIT2里面应该就是用在A里，这些都是能够写进去的，那么能够写进去一样也能够读出来，就是你看我们拍摄写这东西这么方便，是不是特别爽啊，我感觉特别爽啊，我以前我给大家说我以前做过有关Excel，就是这个叫做呃，Excel有关的读取和呃叫做读取和读取和写入的操作啊，极其的麻烦，他需要先拗一个什么什么样的对象，然后再写一个什么什么样的东西，一条一条的去获取出来，这个真的是好麻烦啊，所以有了这个Python这个东西之后，真的是好简单，所以好好看一看，就是这东西能够怎么样呢？就是最差，最差我跟大家说能够你去找一个，比如说你到一个财务部门是吧，他们有很多的Excel表格处理，要处理，处理不了。
22:00
你就可以去给他用这种方式，因为Excel大概是到6万还是几万，它的速度就非常慢了，那么如果你用这种呃，Python的方式给他读到Python那边去执行的话，那么就会快很多啊，能够增加他们的工作效率，以前我们这有的人在毕业的时候干的工作就是这个，去什么人事啊，什么财务呀，去搞这些个办公软件相关的一个就是加快速度的工作，比如说他们想做，想要对某些个东西做某些个求和的工作，如果你们之前做过这方面工作的话，会知道你修改一个数，他要花好久的时间，然后全部都计算一遍之后，你才能再修改下一个，我应该没做错吧，啊，就是Excel相关的内容特别恶心，我曾经见过这个，所以我们用Python来去做这个的话，就会好用很多啊，那么来再来就是我们一样可以去read Excel啊，一样可以去read Excel，那么read Excel的时候，我们就可以去这样子去获取到。
23:00
Excel里的的内容，那么来看它本身就是一个read Excel的一个函数，然后呃，读取的就是out good的这个文件，然后后面给的是SHEET2这个东西啊，我们来看一下是不是SHEET2啊，那如果给的是SHEET1呢，SHE1，那么如果给的是ET1，是不是就应该是这个样啊，那么后面的话就是我们也可以去这么样子去读取啊，也可以这样去读取，来读取一下SHEET1，那么诶啊，因为我们不叫SHEET1了，我们是不是把它叫做shit一样啊，那么其实我们不写也行啊，不写也行，来看一下多了个引号，哎，太慢了，我实在受不了了，不写也行，但是没有啊，气真气人，你说那么后面的话还有一些个这个操作，其实它跟CSV的操作有的时候是很像的，什么hier啊，什么index column啊，什么roses呀，SK row啊，Skip footer啊，Na value啊，什么这个keep deat na value啊，这些东西。
24:00
都是几乎是一样的，我们就可以拿去一个一个做演示了。

展开

我来说两句

0 条评论

登录后参与评论

作者

学习猿地

Python 人工智能数据分析库 19 pandas的使用以及二项分布 7 pandas读取数据原创

我来说两句

作者

相关推荐

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Python 人工智能 数据分析库 19 pandas的使用以及二项分布 7 pandas读取数据原创

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Python 人工智能数据分析库 19 pandas的使用以及二项分布 7 pandas读取数据原创