腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Python
Pandas
Dataframe
:
清理
和
操作
数据
的
快速
方法
?
python
、
pandas
、
dataframe
、
data-manipulation
、
data-cleaning
我有多个时间序列
数据
帧,其中我必须不断地做相同
的
事情,例如:命名列、删除列、添加列、对列执行
操作
、对列执行numpy.select
操作
、删除列(最近,我一直在对现在不需要
的
列使用第二个
数据
帧)。有没有什么办法,我可以创建一个函数来做这些事情,而不需要一直复制
和
粘贴代码来准备我
的
数据
?df = pd.read_csv('data.csv',sep='\t',names=cols) dcol=[
浏览 51
提问于2021-01-19
得票数 1
2
回答
用NA替换
pandas
数据
框中所有出现
的
值
的
快速
方法
python
、
pandas
我正在使用
python
脚本来
清理
和
连接许多大型.csv文件。具体地说,我正在使用
pandas
read_csv函数读取文件,然后将它们作为
dataframe
对象进行处理,这非常有效。这是我第一次使用
pandas
,所以我仍然在习惯它包含
的
所有令人难以置信
的
有用功能。 我正在读取
的
csv文件使用-99.9作为标记值来表示NA/NaN。由于这与我在其他地方表示丢失
数据
的
方式不同,因此我希望将-9
浏览 0
提问于2013-07-05
得票数 2
回答已采纳
1
回答
向量化
Python
Pandas
Dataframe
python
、
pandas
、
data-cleaning
我有csv文件,我正在将其读入
Python
Pandas
Dataframe
。我想对
操作
进行矢量化,以便使用针对某些列
的
一组用户定义函数对列运行
数据
清理
,并将结果附加到
数据
帧中。我可以读取记录并逐个处理它们,但我想通过
Pandas
使用一个函数对1整列进行
操作
来向量化
操作
。输入
数据
帧0 a b c d 1 t f h e
浏览 3
提问于2019-11-01
得票数 1
1
回答
将dask
dataframe
转换为
dataframe
太慢,使用它并行处理时不会节省时间。
pandas
、
dask
import
pandas
as pd import dask.
dataframe
as dd import timewarnings.simplefilter=1)d_data = dd.from_
pandas
{} sec'.format(time.time()-start))结果是: 花费时间
浏览 0
提问于2018-09-29
得票数 0
回答已采纳
2
回答
将R转换为
Python
管道-过滤器、选择
和
排序
python
、
pandas
我正在
清理
R中
的
数据
集,并试图在
Python
中找到与我下面的
清理
过程相当
的
内容。df =
dataframe
%>% select(product) %>% 我知道如何在
Pandas
中进行过滤,我可以执行df[df‘’var‘!= ' string ']之类
浏览 7
提问于2018-05-11
得票数 3
回答已采纳
1
回答
初学者用
Python
还是应用
数据
科学?
machine-learning
、
python
、
coursera
我是
数据
科学
的
新手,我想深入研究它。我
和
python
一起对Udemy进行了一次关于ML
的
调查。由于我已经是一名程序员,我知道大部分
的
基本知识,我只需要熟悉这个脚本以及它是如何用
python
编写
浏览 0
提问于2020-07-25
得票数 0
1
回答
将字典保存到.XLSX中
python
、
excel
、
dictionary
使用
Python
+
Pandas
,是否有一种
快速
简便
的
方法
将Dict (由键
的
文件名
和
值
的
几列
数据
组成)保存到.XLSX文件中?经过一些研究之后,我尝试使用以下代码将其转换为
Pandas
DataFrame
(因为我知道您可以使用
Pandas
DataFrame
编写一个.XLSX文件): import
pandas
as pdglob.glob
浏览 4
提问于2015-10-09
得票数 3
3
回答
Python
Pandas
to R
dataframe
python
、
r
、
pandas
、
rpy2
我将在R中将
Python
pandas
dataframe
转换为
dataframe
。我找到了几个库来解决这个问题 但我找不到保存或转移到R
的
方法
。首先我试了下"to_csv“df_R.to_csv(direc+"/qap/detail_summary_R/"+"distance_"+
浏览 0
提问于2014-06-07
得票数 17
回答已采纳
2
回答
pyspark.
pandas
和
熊猫有什么区别?
pandas
、
pyspark
开始在Databricks上使用PySpark,我看到我可以在
pandas
的
同时导入pyspark.
pandas
。有什么不同吗?我想这不像koalas,对吧?
浏览 13
提问于2022-09-20
得票数 0
2
回答
有没有办法自动
清理
pandas
DataFrames
的
数据
?
python
、
pandas
、
data-cleaning
我正在为一个机器学习项目
清理
我
的
数据
,
方法
是分别用“Age”
和
“for”列
的
零和平均值替换缺少
的
值。mean = train_data['Fare'].mean() 由于我必须对其他
数据
集多次执行此
操作
,因此我希望通过创建一个泛型函数来自动化此过程,该泛型函数将<
浏览 26
提问于2021-10-11
得票数 0
2
回答
如何将单个列中
的
数据
拆分为新行(其他列在新行中保持不变)
python
、
pandas
我有一个项目的枪支暴力
数据
集。其中一列包括参与者类型,无论是受害者还是主体/嫌疑人。参与者列中包含事件中
的
每个参与者
的
多个值。import
pandas
as pddata.head() incident_id我想带着每个参与者,在保持incident_id
和
日期不变
的
同时,给他们自己
的
行: incident_id
浏览 2
提问于2019-11-20
得票数 0
回答已采纳
1
回答
JuliaDB或
DataFrame
比平面数组快吗?
julia
我想知道普通数组与JuliaDB或
DataFrame
在对大型
数据
集(大型但仍然适合内存)上
的
计算性能是否存在差异?我可以使用简单
的
数组
和
算法来进行排序、分组、缩减等等,那么为什么我需要JuliaDB或
DataFrame
呢?我有点理解
Python
为什么需要
Pandas
--因为它将缓慢
的
python
转化为
快速
C,但是为什么Julia需要JuliaDB或
DataFrame
-- Jul
浏览 0
提问于2018-03-26
得票数 10
回答已采纳
1
回答
有没有办法将
Pandas
dataframe
作为文件处理程序直接读取?
python
、
pandas
、
dataframe
、
filehandler
我使用
pandas
从dataSource.cvs文件加载
数据
:在
pandas
中,我可以
清理
数据
,比如用0填充缺失
的
值。接下来,我使用DF.to_csv('temp.csv', sep=',')将DF编写为临时cvs文件,然后使用
python
文件处理程序再次打开该文件。解析
数据
并关联来自其他
数据
表
的
浏览 10
提问于2016-07-25
得票数 0
1
回答
使用teradatasql包将
数据
框插入teradata
python
、
sql
、
teradata
我使用teradatasql包作为
python
和
Teradata之间
的
连接器,它是Teradata
的
本地解决方案,用于从DB加载
数据
。但是,我想将我在
python
中创建
的
数据
框插入回DB。是否可以使用teradatasql包将
数据
帧写入
数据
库? 谢谢
浏览 14
提问于2020-07-13
得票数 1
回答已采纳
1
回答
如何在csv文件中写入/覆盖
python
、
csv
、
python-3.7
所以我创建了这个
数据
库,我试图输入这个人
的
ID,这样我就可以更新person手术了。新
的
编码
和
python
,但不知道如何得到这一点,因为上半年
的
工作,但下半部分只是删除整个
数据
库。这很困难,因为我知道如何添加行,但不知道如何编辑/添加特定
的
单词到某一行。任何帮助都将不胜感激。
浏览 8
提问于2019-11-27
得票数 0
回答已采纳
2
回答
在
python
中读取庞大
的
sas
数据
集
python-3.x
、
pandas
、
sas
我有一个50 gb
的
SAS
数据
集。我想在
pandas
dataframe
中阅读它。
快速
读取sas
数据
集
的
最佳
方法
是什么?我使用了下面的代码,它太慢了:df = pd.read_sas("xxxx.sas7bdat", chunksize = 10000000) dfs.append(chunk) df_final =
浏览 1
提问于2019-10-30
得票数 2
1
回答
在Power中设置API从网站中提取
数据
python
、
api
、
powerbi-desktop
我对
python
和
API还比较陌生,基本上,我在吴福奥中有一个表单,我目前正在手动将
数据
导出到excel文档中,以便构建一个Power报告。我一直试图建立一个网络连接,直接到吴福,所以我不再需要做手动
数据
拉。我尝试使用Power中
的
get
数据
,并输入URL:)更新子域并使用表单
的
散列作为标识符,并将格式设置为json我在下面用
Python
构建了
浏览 4
提问于2021-08-28
得票数 0
回答已采纳
1
回答
我可以使用没有括号
的
python
方法
吗?
python
、
pandas
、
methods
我是
Python
新手。我使用head()
方法
快速
检查
数据
。import
pandas
as pddf.head()df.head 在使用
方法
时,带括号
浏览 3
提问于2020-05-27
得票数 0
回答已采纳
3
回答
在
python
pandas
dataframe
中将列
数据
从“姓氏,名字”改为“名字姓氏”
python
、
pandas
、
dataframe
、
split
、
reverse
我有
python
pandas
dataframe
,它由用于执行
python
脚本
的
power bi
数据
源转换支持,其中一列由lastname, firstname组成,我需要它由firstname lastname我尝试了以下拆分、反转、连接
方法
,该
方法
适用于独立
的
字符串参数,但当我尝试对
pandas
数据
帧中
的
列
数据
使用该
方法
时,会生成Attri
浏览 62
提问于2020-06-17
得票数 2
回答已采纳
1
回答
PySpark:带有标量
Pandas
的
无效returnType
apache-spark
、
pyspark
、
apache-arrow
我正在尝试从
pandas
_udf返回一个特定
的
结构。它在一个集群上工作,但在另一个集群上失败。我尝试在组上运行udf,这需要返回类型为
数据
框架。from pyspark.sql.functions import
pandas
_udfimport numpy as np oneCar.loc[1:, &
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
这十二个用于Python 数据操作的 Pandas 方法你还不知道?
交互式数据分析和处理新方法:pandas-ai=Pandas+ChatGPT
Python与数据分析《一》
这几个方法颠覆你对Pandas缓慢的观念!
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券