首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python如何打开pkl的sample text?(上篇)

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

昨夜闲潭梦落花,可怜春半不还家。

大家好,我是皮皮。

一、前言

前几天在Python私教群【Emma】问了一个读取数据的问题,一起来看看吧。上一篇文章讲到【Emma】的Python环境已经安装好了,现在要开始进阶学习了,一起来看看吧。

二、实现过程

这个pkl数据是她自己的作业,现在要完成相应的数据读取和处理,看上去要做一次词云处理。

这样的数据格式,直接打开的话,一般都会乱码的,如下图所示:

还得是需要使用Pandas来进行读取和查看,代码如下:

【Emma】给的代码中,文件名忘记。用引号括起来了,所以会报错,加上引号之后,就可以解决这个问题了。

加上去了,这个问题解决,但是又来了一个新问题,然后粉丝就麻了,从报错来看,文件不存在,说明文件不在当前代码的同级目录下,需要加绝对路径才行。

她的文件就是在下载里,就是在Safari下载里,那么在mac中怎么看是在哪呢?

把红框里的点开,就能看到文件路径了,但是【Emma】在操作的时候,还是不太懂。

后来在finder里面找到了它,然后定位到具体的路径,如下图所示:

然后拷贝或者剪切到你的pycharm这个项目里,如下图所示:

直接粘贴,会有个弹出框,确认就行了。

看上去粘贴过来的时候,文件多了个尾巴,需要把【的副本】这三个字删除才行,不然的话,代码肯定又会报错的,说文件找不到。

虽然这样操作理论上来说,应该没啥问题,但是实际上还是有点问题,因为【Emma】是直接打开的,直接打开肯定是乱码,而是需要用Python库来进行读取。

目前【Emma】的文件问题已经解决了,下一步她要开始导入数据了,读取数据了,下一篇文章继续一起来看看【Emma】接下来会遇到什么问题吧,敬请期待!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个库安装和导包基础问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【Emma】提问,感谢【狂吃山楂片】给出的思路和代码解析,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些ChatGPT机器人交流群和高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O2rflaX1NS8dMZv10J6a6aWQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券