前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python如何打开pkl的sample text?(上篇)

Python如何打开pkl的sample text?(上篇)

作者头像
Python进阶者
发布2023-08-31 08:53:03
1860
发布2023-08-31 08:53:03
举报
文章被收录于专栏:Python爬虫与数据挖掘

一、前言

前几天在Python私教群【Emma】问了一个Python读取数据的问题,一起来看看吧。上一篇文章讲到【Emma】的Python环境已经安装好了,现在要开始进阶学习了,一起来看看吧。

二、实现过程

这个pkl数据是她自己的作业,现在要完成相应的数据读取和处理,看上去要做一次词云处理。

这样的数据格式,直接打开的话,一般都会乱码的,如下图所示:

还得是需要使用Pandas来进行读取和查看,代码如下:

代码语言:javascript
复制
import pandas as pd
pd.read_pickle("你的文件名")

【Emma】给的代码中,文件名忘记。用引号括起来了,所以会报错,加上引号之后,就可以解决这个问题了。

加上去了,这个问题解决,但是又来了一个新问题,然后粉丝就麻了,从报错来看,文件不存在,说明文件不在当前代码的同级目录下,需要加绝对路径才行。

她的文件就是在下载里,就是在Safari下载里,那么在mac中怎么看是在哪呢?

把红框里的点开,就能看到文件路径了,但是【Emma】在操作的时候,还是不太懂。

后来在finder里面找到了它,然后定位到具体的路径,如下图所示:

然后拷贝或者剪切到你的pycharm这个项目里,如下图所示:

直接粘贴,会有个弹出框,确认就行了。

看上去粘贴过来的时候,文件多了个尾巴,需要把【的副本】这三个字删除才行,不然的话,代码肯定又会报错的,说文件找不到。

虽然这样操作理论上来说,应该没啥问题,但是实际上还是有点问题,因为【Emma】是直接打开的,直接打开肯定是乱码,而是需要用Python库来进行读取。

目前【Emma】的文件问题已经解决了,下一步她要开始导入数据了,读取数据了,下一篇文章继续一起来看看【Emma】接下来会遇到什么问题吧,敬请期待!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python库安装和导包基础问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

往期精彩文章推荐:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 二、实现过程
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档