腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
带有
Pandas
.
pipe
()
的
Pandas
类
、
、
、
pandas
.
pipe
()函数来将方法链接在一起。在DataCleaner
类
中,我有一个方法process_all,它包含
类
内
的
其他清理方法。我希望将它们链接在一起,并使用多个方法一次性处理数据帧。将这个链接方法保留在DataCleaner
类
中会很好,这样我所要做
的
就是从另一个
类
或文件中调用它一次,例如DataProcessor中
的
process_all。问题是process_all在抱怨:TypeError: 'Data
浏览 53
提问于2021-07-20
得票数 4
回答已采纳
4
回答
使用Python导入R脚本
的
输出
、
、
、
、
我在这个堆栈溢出中
的
第一个帖子!:)import os command = 'C:/,通过我
的
Python脚本。'], stdout=subprocess.
PIPE
) as proc:
浏览 13
提问于2020-09-15
得票数 1
1
回答
对数据集中
的
URL计数
、
我有一个包含token和entity列
的
数据集。在token列中有一个单词和一个URL。我想要获取token列中
的
URL编号。但是我没有找到合适
的
源代码。我找到了一种删除URL
的
方法。有没有办法计算数据集中URL
的
数量?如何计算数据集中
的
URL数量?
浏览 6
提问于2021-02-07
得票数 0
2
回答
保存文本数据
的
大型
Pandas
df到磁盘崩溃Colab,因为耗尽了所有的RAM。有解决办法吗?
、
我有一个非常大
的
Pandas
数据帧,我想把它保存到磁盘上,以便以后使用。数据帧仅包含字符串数据。然而,无论我使用哪种格式,保存过程都会导致我
的
Google Colab环境崩溃,因为除了CSV之外,所有可用
的
RAM都会用完,CSV甚至在5小时后都不会完成。我尝试过to_json、to_feather、to_parquet、to_pickle,它们都会使环境崩溃。create_engine engine = sqlalchemy.creat
浏览 2
提问于2019-05-29
得票数 2
2
回答
如何从特定操作系统
的
python脚本中安装和导入
pandas
?
、
、
python有没有办法检测操作系统,然后从文件中安装
pandas
,然后导入它?基本上,我需要我所有的
pandas
代码在他调用.py文件时运行。请帮帮我!import
pandas
as pd df = pd.read_csv(excel_file
浏览 28
提问于2019-05-30
得票数 0
回答已采纳
1
回答
如何使用ML sklearn管道进行预测?
我已经使用sklearn_
pandas
和sklearn创建了一个ML管道。它看起来像这样。features = ['ColA','ColB','ColC'] ('ColB',sklearn.preprocessing.StandardScaler()), ('ColC',sklearn.preprocessi
浏览 4
提问于2015-04-30
得票数 2
回答已采纳
1
回答
如何在python中筛选数据帧时获取字符串而不是对象
、
、
、
我是一个数据过滤器,它
的
列是:'
pandas
.core.series.Series‘,列
的
每个元素都是字符串'str’而不是我想得到
的
元素。people_
pipe
.Empresa[people_
pipe
['Correo electrónico']=='dae@mrboho.com']1 Mrboho名称:
浏览 0
提问于2020-08-12
得票数 1
回答已采纳
2
回答
如何在Seaborn中绘制
Pandas
.groupby()对象-使用方法链接
、
、
如果有任何关于如何通过管道将
Pandas
.groupby()对象导入Seaborn
的
建议,我将不胜感激 agg({'pop' : ['sum'], reset_index().\
pipe
浏览 7
提问于2020-03-09
得票数 0
1
回答
read_csv熊猫功能
的
输入
、
、
我需要给熊猫喂食read_csv,这是我用Popen执行
的
一个命令
的
输出。p = subprocess.Popen(cmd,stdout=subprocess.
PIPE
,stderr=subprocess.
PIPE
)
pandas
.read_csv(stdout,index_col=0) 但是很明显,stdout是一个字符串,它被解释为一个路径。在API文档中,它指出“任何具有read()方法(例如文件句柄或StringIO)
的</
浏览 5
提问于2017-10-04
得票数 7
回答已采纳
1
回答
在列中解析字典时,字符串索引必须是整数。
、
、
当我试图用充满字典类型
的
类型列拆分电影数据集(csv文件)时遇到了一些问题,例如{"id":28,"name":"Action"},{"id":12,"name":"Adventure"},.我想得到所有的import
pandas
import json data =
pandas
.read_csv('Downloads/t
浏览 0
提问于2018-09-24
得票数 0
回答已采纳
1
回答
星火3.2 -NLP.
pipe
- pd.Series.__iter__()上
的
熊猫没有实现
、
、
、
、
目前,我正在尝试将一些过程从python迁移到(熊猫上) some,以衡量性能,直到现在,一切都进行得很顺利:nlp定义为:nlp = spacy.load_).lower() for tok in doc] preproc_
pipe
= []for doc in nlp.
pipe
(texts, batch_size=20):
浏览 9
提问于2022-03-09
得票数 1
2
回答
如何将
pandas
groupby parts通过管道发送到seaborn distplot?
、
、
我正在学习在
pandas
中使用.
pipe
方法,并且想知道我们是否可以使用它来绘制每组groupby
的
距离图。MWE问题<code>A1</code>输出与for-loop相同,但使用
pandas
管道。
浏览 39
提问于2020-06-08
得票数 3
回答已采纳
1
回答
创建
pandas
虚拟变量并将其附加到管道
、
、
我正在尝试创建一个
Pandas
管道,它创建虚拟变量并将列附加到现有的数据帧中。不幸
的
是,我不能让附加
的
列在流水线结束时保持不变。pass a = pd.get_dummy(df['col']) return b (df.
pipe
(function) .
p
浏览 16
提问于2021-03-23
得票数 1
回答已采纳
1
回答
pandas
数据框中元素
的
数据类型与实际数据类型不一致
、
、
、
我有一个
带有
"datetime“列
的
pandas
数据帧,当我对它运行df.info()时,Dtype显示为Object。然而,如果我检查每个值,它们都是<
类
datetime.datetime>,为什么它不一致,我如何才能使其成为datetime或理想
的
<
类
pandas
.
浏览 43
提问于2021-07-14
得票数 0
3
回答
导入awswrangler时出错: AttributeError:模块“”multiprocessing“”没有属性“”connection“”
、
我有一个使用lib awswrangler
的
python脚本。今天我
的
scrpit开始在导入库
的
时候给出错误,我不知道发生了什么。import
Pandas
from awswrangler.
pandas
imp
浏览 40
提问于2020-03-29
得票数 1
回答已采纳
1
回答
Json序列化具有
Pandas
Dataframe属性
的
类
: TypeError:'DataFrame‘类型
的
对象不是JSON可序列化
的
、
、
、
嗨,我有一个
带有
pandas
数据帧属性
的
类
。我如何编码成json,这样
pandas
的
dataframe属性也能被正确序列化?_propsDataFrame = None #
Pandas
dataframeprint(json.dumps(machine_objects[0].
浏览 2
提问于2021-04-10
得票数 0
1
回答
Python:导入库/模块后打印自定义消息
、
例如,如果用户
的
代码如下所示import os那么输出应该是:You have imported osYou have imported
PIPE
用户
的
代码可以是动态
的
,并且可以实际导入任何库。
浏览 0
提问于2018-02-27
得票数 0
2
回答
确保导入Python包
的
最低版本
、
、
大多数Python包遵循
的
惯例是,版本是在[package_name].version.version中作为字符串提供
的
。让我们以Numpy为例。在Python标准库
的
范围内导入包之前,是否有一种方法来检查包
的
版本?我正在寻找一个用requirements.txt代码编程
的
解决方案,告诉我使用requirements.txt或pip install并不能回答这个问题。编辑以添加上下文:将此包添加到我
的
requirements.txt中并不有用,因为导入
的
包应该是一个可选
浏览 2
提问于2020-10-09
得票数 1
1
回答
Python嵌套
类
定义导致无休止
的
递归..。我在这里做错了什么?
、
、
、
我正在用Python编写一个程序,它打开输入文件,做一些简单
的
文本解析,并输出。输入是一个ASCII文件,
带有
几个类似格式
的
文本块。所以,我想我应该利用这个机会来掌握如何定义我自己
的
类
。我有一个父
类
pFrame,我想继承
pandas
.DataFrame
类
的
属性。由于我
的
输入文本文件包含两种类似(但不完全相同)
的
列文本类型,所以我定义了另外两个
类
(pFrameA和pFrameB),每
浏览 3
提问于2014-02-01
得票数 1
回答已采纳
1
回答
将linux命令输出发送到熊猫数据
、
、
、
然而,我将这样做
的
大列表
的
大文件,我不想创建虚拟
的
test.csv文件,每次我猫文件在一起。有没有办法直接将这些文件
的
猫输出到熊猫数据文件中,而不是创建csv文件?
浏览 8
提问于2022-08-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas的groupby问题
Pandas中高效的“For循环”
pandas的Series常用方法
2573页的《Pandas权威指南》
Anaconda配置Pandas模块的方法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券