带有Pandas .pipe()的Pandas类

、、、

pandas .pipe()函数来将方法链接在一起。在DataCleaner类中，我有一个方法process_all，它包含类内的其他清理方法。我希望将它们链接在一起，并使用多个方法一次性处理数据帧。将这个链接方法保留在DataCleaner类中会很好，这样我所要做的就是从另一个类或文件中调用它一次，例如DataProcessor中的process_all。问题是process_all在抱怨：TypeError: 'Data

浏览 53提问于2021-07-20得票数 4

回答已采纳

4回答

使用Python导入R脚本的输出

、、、、

我在这个堆栈溢出中的第一个帖子！:)import os command = 'C:/，通过我的Python脚本。'], stdout=subprocess.PIPE) as proc:

浏览 13提问于2020-09-15得票数 1

1回答

对数据集中的URL计数

、

我有一个包含token和entity列的数据集。在token列中有一个单词和一个URL。我想要获取token列中的URL编号。但是我没有找到合适的源代码。我找到了一种删除URL的方法。有没有办法计算数据集中URL的数量？如何计算数据集中的URL数量？

浏览 6提问于2021-02-07得票数 0

2回答

保存文本数据的大型Pandas df到磁盘崩溃Colab，因为耗尽了所有的RAM。有解决办法吗？

、

我有一个非常大的Pandas数据帧，我想把它保存到磁盘上，以便以后使用。数据帧仅包含字符串数据。然而，无论我使用哪种格式，保存过程都会导致我的Google Colab环境崩溃，因为除了CSV之外，所有可用的RAM都会用完，CSV甚至在5小时后都不会完成。我尝试过to_json、to_feather、to_parquet、to_pickle，它们都会使环境崩溃。create_engine engine = sqlalchemy.creat

浏览 2提问于2019-05-29得票数 2

2回答

如何从特定操作系统的python脚本中安装和导入pandas？

、、

python有没有办法检测操作系统，然后从文件中安装pandas，然后导入它？基本上，我需要我所有的pandas代码在他调用.py文件时运行。请帮帮我！import pandas as pd df = pd.read_csv(excel_file

浏览 28提问于2019-05-30得票数 0

回答已采纳

1回答

如何使用ML sklearn管道进行预测？

我已经使用sklearn_pandas和sklearn创建了一个ML管道。它看起来像这样。features = ['ColA','ColB','ColC'] ('ColB',sklearn.preprocessing.StandardScaler()), ('ColC',sklearn.preprocessi

浏览 4提问于2015-04-30得票数 2

回答已采纳

1回答

如何在python中筛选数据帧时获取字符串而不是对象

、、、

我是一个数据过滤器，它的列是：'pandas.core.series.Series‘，列的每个元素都是字符串'str’而不是我想得到的元素。people_pipe.Empresa[people_pipe['Correo electrónico']=='dae@mrboho.com']1 Mrboho名称:

浏览 0提问于2020-08-12得票数 1

回答已采纳

2回答

如何在Seaborn中绘制Pandas .groupby()对象-使用方法链接

、、

如果有任何关于如何通过管道将Pandas .groupby()对象导入Seaborn的建议，我将不胜感激 agg({'pop' : ['sum'], reset_index().\ pipe

浏览 7提问于2020-03-09得票数 0

1回答

read_csv熊猫功能的输入

、、

我需要给熊猫喂食read_csv，这是我用Popen执行的一个命令的输出。p = subprocess.Popen(cmd,stdout=subprocess.PIPE,stderr=subprocess.PIPE)pandas.read_csv(stdout,index_col=0) 但是很明显，stdout是一个字符串，它被解释为一个路径。在API文档中，它指出“任何具有read()方法(例如文件句柄或StringIO)的</

浏览 5提问于2017-10-04得票数 7

回答已采纳

1回答

在列中解析字典时，字符串索引必须是整数。

、、

当我试图用充满字典类型的类型列拆分电影数据集(csv文件)时遇到了一些问题，例如{"id"：28，"name"："Action"}，{"id"：12，"name"："Adventure"}，.我想得到所有的import pandasimport json data = pandas.read_csv('Downloads/t

浏览 0提问于2018-09-24得票数 0

回答已采纳

1回答

星火3.2 -NLP.pipe - pd.Series.iter()上的熊猫没有实现

、、、、

目前，我正在尝试将一些过程从python迁移到(熊猫上) some，以衡量性能，直到现在，一切都进行得很顺利：nlp定义为：nlp = spacy.load_).lower() for tok in doc] preproc_pipe = []for doc in nlp.pipe(texts, batch_size=20):

浏览 9提问于2022-03-09得票数 1

2回答

如何将pandas* groupby parts通过管道发送到seaborn distplot？*

、、

我正在学习在pandas中使用.pipe方法，并且想知道我们是否可以使用它来绘制每组groupby的距离图。MWE问题<code>A1</code>输出与for-loop相同，但使用pandas管道。

浏览 39提问于2020-06-08得票数 3

回答已采纳

1回答

创建pandas虚拟变量并将其附加到管道

、、

我正在尝试创建一个Pandas管道，它创建虚拟变量并将列附加到现有的数据帧中。不幸的是，我不能让附加的列在流水线结束时保持不变。pass a = pd.get_dummy(df['col']) return b (df.pipe(function) .p

浏览 16提问于2021-03-23得票数 1

回答已采纳

1回答

pandas数据框中元素的数据类型与实际数据类型不一致

、、、

我有一个带有"datetime“列的pandas数据帧，当我对它运行df.info()时，Dtype显示为Object。然而，如果我检查每个值，它们都是<类datetime.datetime>，为什么它不一致，我如何才能使其成为datetime或理想的<类pandas.

浏览 43提问于2021-07-14得票数 0

3回答

导入awswrangler时出错: AttributeError:模块“”multiprocessing“”没有属性“”connection“”

、

我有一个使用lib awswrangler的python脚本。今天我的scrpit开始在导入库的时候给出错误，我不知道发生了什么。import Pandas from awswrangler.pandas imp

浏览 40提问于2020-03-29得票数 1

回答已采纳

1回答

Json序列化具有Pandas* Dataframe属性的类: TypeError：'DataFrame‘类型的对象不是JSON可序列化的*

、、、

嗨，我有一个带有pandas数据帧属性的类。我如何编码成json，这样pandas的dataframe属性也能被正确序列化？_propsDataFrame = None # Pandas dataframeprint(json.dumps(machine_objects[0].

浏览 2提问于2021-04-10得票数 0

1回答

Python:导入库/模块后打印自定义消息

、

例如，如果用户的代码如下所示import os那么输出应该是：You have imported osYou have imported PIPE 用户的代码可以是动态的，并且可以实际导入任何库。

浏览 0提问于2018-02-27得票数 0

2回答

确保导入Python包的最低版本

、、

大多数Python包遵循的惯例是，版本是在[package_name].version.version中作为字符串提供的。让我们以Numpy为例。在Python标准库的范围内导入包之前，是否有一种方法来检查包的版本？我正在寻找一个用requirements.txt代码编程的解决方案，告诉我使用requirements.txt或pip install并不能回答这个问题。编辑以添加上下文:将此包添加到我的requirements.txt中并不有用，因为导入的包应该是一个可选

浏览 2提问于2020-10-09得票数 1

1回答

Python嵌套类定义导致无休止的递归..。我在这里做错了什么？

、、、

我正在用Python编写一个程序，它打开输入文件，做一些简单的文本解析，并输出。输入是一个ASCII文件，带有几个类似格式的文本块。所以，我想我应该利用这个机会来掌握如何定义我自己的类。我有一个父类pFrame，我想继承pandas.DataFrame类的属性。由于我的输入文本文件包含两种类似(但不完全相同)的列文本类型，所以我定义了另外两个类(pFrameA和pFrameB)，每

浏览 3提问于2014-02-01得票数 1

回答已采纳

1回答

将linux命令输出发送到熊猫数据

、、、

然而，我将这样做的大列表的大文件，我不想创建虚拟的test.csv文件，每次我猫文件在一起。有没有办法直接将这些文件的猫输出到熊猫数据文件中，而不是创建csv文件？

浏览 8提问于2022-08-17得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Python导入R脚本的输出

对数据集中的URL计数

保存文本数据的大型Pandas df到磁盘崩溃Colab，因为耗尽了所有的RAM。有解决办法吗？

如何从特定操作系统的python脚本中安装和导入pandas？

如何使用ML sklearn管道进行预测？

如何在python中筛选数据帧时获取字符串而不是对象

如何在Seaborn中绘制Pandas .groupby()对象-使用方法链接

read_csv熊猫功能的输入

在列中解析字典时，字符串索引必须是整数。

星火3.2 -NLP.pipe - pd.Series.iter()上的熊猫没有实现

如何将pandas* groupby parts通过管道发送到seaborn distplot？*

创建pandas虚拟变量并将其附加到管道

pandas数据框中元素的数据类型与实际数据类型不一致

导入awswrangler时出错: AttributeError:模块“”multiprocessing“”没有属性“”connection“”

Json序列化具有Pandas* Dataframe属性的类: TypeError：'DataFrame‘类型的对象不是JSON可序列化的*

Python:导入库/模块后打印自定义消息

确保导入Python包的最低版本

Python嵌套类定义导致无休止的递归..。我在这里做错了什么？

将linux命令输出发送到熊猫数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐