一、前言
前几天在Python私教群【Emma】问了一个Python
读取数据的问题,一起来看看吧。上一篇文章讲到【Emma】的Python环境已经安装好了,现在要开始进阶学习了,一起来看看吧。
这个pkl数据是她自己的作业,现在要完成相应的数据读取和处理,看上去要做一次词云处理。
这样的数据格式,直接打开的话,一般都会乱码的,如下图所示:
还得是需要使用Pandas来进行读取和查看,代码如下:
import pandas as pd
pd.read_pickle("你的文件名")
【Emma】给的代码中,文件名忘记。用引号括起来了,所以会报错,加上引号之后,就可以解决这个问题了。
加上去了,这个问题解决,但是又来了一个新问题,然后粉丝就麻了,从报错来看,文件不存在,说明文件不在当前代码的同级目录下,需要加绝对路径才行。
她的文件就是在下载里,就是在Safari下载里,那么在mac中怎么看是在哪呢?
把红框里的点开,就能看到文件路径了,但是【Emma】在操作的时候,还是不太懂。
后来在finder里面找到了它,然后定位到具体的路径,如下图所示:
然后拷贝或者剪切到你的pycharm这个项目里,如下图所示:
直接粘贴,会有个弹出框,确认就行了。
看上去粘贴过来的时候,文件多了个尾巴,需要把【的副本】这三个字删除才行,不然的话,代码肯定又会报错的,说文件找不到。
虽然这样操作理论上来说,应该没啥问题,但是实际上还是有点问题,因为【Emma】是直接打开的,直接打开肯定是乱码,而是需要用Python库来进行读取。
目前【Emma】的文件问题已经解决了,下一步她要开始导入数据了,读取数据了,下一篇文章继续一起来看看【Emma】接下来会遇到什么问题吧,敬请期待!
大家好,我是皮皮。这篇文章主要盘点了一个Python
库安装和导包基础问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
往期精彩文章推荐:
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!