腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
另一个
文件
对
数据
帧
值
执行
操作
python
、
pandas
、
dataframe
我有一个这样的csv
文件
,里面有一堆
值
- Time,metric_A,metric_B,metric_C1,3,4,5new_metric_A=metric_A/metric_B new_metric_B=metric_A-metric_B
浏览 11
提问于2019-07-02
得票数 1
回答已采纳
2
回答
Apache Spark当调用repartition($" key ")时,当每个键的所有记录的大小大于单个分区的大小时会发生什么?
scala
、
apache-spark
、
apache-spark-sql
、
apache-spark-sql-repartition
假设我有一个10 c1的
数据
帧
,其中一个列的"c1“对于每条记录都有相同的
值
。每个单独的分区最大为128 MB(默认
值
)。
浏览 34
提问于2021-09-23
得票数 2
回答已采纳
3
回答
使用R将多个
数据
帧
写入.csv
文件
r
、
export-to-csv
、
lapply
我已经使用lapply将一个函数应用于许多
数据
帧
:然后根据它们的主题编号(例如,100)来标记列表中的每个结果
数据
帧
:我想要做的是将每个新
数据
框保存为
基于
其主题编号的单个.csv
文件
。通常情况下(对于单个
数据
帧
),我只需要这样写(其中x是<em
浏览 1
提问于2014-11-03
得票数 9
回答已采纳
1
回答
pandas
数据
帧
连接类
操作
python
、
join
、
pandas
、
dataframe
我有一个包含以下内容的pd.Dataframe:
另一个
数据
帧
包含:我想要对这两个
数据
执行
“连接”,这样我得到的
数据
帧
将包含以下内容:但我也希望它是
基于
双键(student_id,course_id)连接的,这在我的
数据
帧
中是唯一的。我该如何
浏览 0
提问于2015-11-18
得票数 2
1
回答
基于
列
值
高效地从宽Spark
数据
帧
中删除列
scala
、
apache-spark
、
apache-spark-sql
如果我有一个只包含IP地址的宽
数据
帧
(200m cols),并且我想删除包含空
值
或格式不佳的IP地址的列,那么在Spark中
执行
此
操作
的最有效方法是什么?我的理解是Spark并行地
执行
基于
行的处理,而不是
基于
列的处理。因此,如果我尝试在列上应用转换,将会有大量的混洗。首先转置
数据
帧
,然后应用筛选器删除行,然后重新转置是利用spark并行性的好方法吗?
浏览 11
提问于2019-10-31
得票数 1
1
回答
基于
第一次出现在
另一个
数据
框中的
值
,将
数据
帧
行中的剩余值替换为NA
r
、
dataframe
、
apply
、
mapply
我有两个
数据
帧
,其中一个具有表示时间序列的数值行子集,
另一个
是与初始
数据
帧
中的时间点相关的1和0的
数据
帧
。
基于
布尔
数据
帧
,我想在布尔
数据
帧
中第一次出现0的时间点将初始
数据
帧
中的
值
替换为NA。2 3 4.5 0 1 11 1 1
浏览 10
提问于2020-09-21
得票数 1
回答已采纳
2
回答
Python -在不同变量的循环中运行相同的代码块
python
、
pandas
、
loops
我有下面这组代码,在这些代码中,我在从名为df的源
数据
帧
中提取一些
数据
后,
执行
一些
基于
操作
的
操作
。Customer_data.append(Customer) Customer = pd.DataFrame(Customer_data.append, columns = ['Customer']) 我正在尝试
对
变量集重复上面的代码,其中我将用
另一个
变量替换变量Customer。
浏览 10
提问于2021-01-18
得票数 0
1
回答
将一个
数据
帧
拆分为多个
数据
帧
,并
对
这些
数据
帧
并行
执行
过程
python
、
multithreading
、
python-multiprocessing
我有一个
数据
框dfA。其中包含超过一百万条记录。我想根据'GROUP_ID‘将
数据
帧
拆分成多个
数据
帧
,然后
对
这些
数据
帧
执行
一些
操作
。此循环将
基于
唯一的组id创建
数据
帧
。
浏览 1
提问于2018-01-31
得票数 0
1
回答
将
数据
从S3读取到pandas的最佳方法
python
、
pandas
、
amazon-web-services
、
amazon-s3
、
amazon-ec2
我有两个CSV
文件
,一个大约60 GB,
另一个
在S3中大约是70 GB。我需要将这两个CSV
文件
加载到pandas
数据
帧
中,并对
数据
执行
连接和合并等
操作
。我有一个EC2实例,它有足够的内存供两个
数据
帧
一次加载到内存中。 从S3到pandas
数据
帧
读取这么大的
文件
的最佳方式是什么?另外,在我对
数据
帧
执行
了所需的<
浏览 5
提问于2020-05-06
得票数 0
1
回答
通过pandas保留Excel下拉列表
python-3.x
、
pandas
、
excel-2013
我有一个excel
文件
,其中的标题有下拉列表,可用于根据特定的列
值
选择行( where语句所做的正是如此)。我将这个
文件
导入到pandas中并
执行
一些
操作
。假设我删除
基于
"emp_id“列的重复
值
” data = data.drop_duplicates(['emp_id']) 然后我把这个
数据
帧
保存到excel中, data.to_excel("new_data.xlsx") 但是,
浏览 135
提问于2020-01-15
得票数 2
回答已采纳
2
回答
如何
对
Apache中的两个独立
数据
执行
算术
操作
?
scala
、
apache-spark
、
apache-spark-sql
我有两个
数据
文件
,如下所示,它们每个只有一行和一列。两者都有两个不同的数值。请帮帮忙。
浏览 3
提问于2017-09-01
得票数 1
回答已采纳
1
回答
if/then/else的Python/pandas习惯用法
python
、
pandas
在对整个pandas
数据
帧
执行
计算后,我需要返回并
基于
另一个
变量的
值
覆盖变量计算(通常设置为零)。有没有一种更简洁/更惯用的方式来
执行
这种
操作
?
浏览 1
提问于2013-06-16
得票数 18
回答已采纳
1
回答
有没有办法将csv
文件
导入到pandas中,使用字典中的
值
作为
数据
帧
的名称?
python
、
pandas
、
csv
、
dictionary
我刚开始使用python,目前正在尝试导入多个csv
文件
作为
数据
帧
。虽然有一些类似的问题,但它们似乎
对
我的问题没有帮助。csv
文件
具有相同的结构,并且名称不是我希望它们作为
数据
帧
导入时的名称。字典列表包含
数据
帧
的名称(应该是怎样的)以及csv
文件
的名称。由于我需要对不同的
文件
夹多次
执行
此
操作
,因此我尝试创建一个公式: def import_csv(CSVdict)
浏览 10
提问于2021-03-01
得票数 1
回答已采纳
1
回答
简化
基于
一个
数据
帧
中的
值
对
另一个
数据
帧
执行
操作
的函数
r
、
function
、
dplyr
我有两个
数据
帧
dat1和dat2 dist = repdata.frame(id = c("a","b","c"),dat2中的value列包含我想要在dat1中进行子集的
值
的索引我编写了
浏览 12
提问于2020-05-15
得票数 0
回答已采纳
1
回答
在python中进行迭代的有效方法是什么?
python-3.x
、
pandas
、
list
、
tuples
它的
值
存在于Pandas
数据
帧
中。我必须首先在
数据
帧
中找到它的
值
,然后
对
它
执行
一些关节炎
操作
。并再次将其存储在
另一个
Pandas
数据
帧
中。但它需要太多的时间才能完成。因此,我将
值
存储在元组中,性能有所提高,但并不像预期的那样。有什么方法可以优化这一点吗?下面是我完成的示例代码。
浏览 22
提问于2020-04-07
得票数 0
3
回答
如何根据时间是否在某个范围内来创建由1或0填充的数组/
数据
帧
?
python
、
pandas
、
loops
、
time
基本上,我有一个
数据
帧
,它有两列,这两列都是小时: +-----+----+ +-----+----+ +--我想创建
另一个
dataframe,它的列标题为'1‘到' 24’(
基于
24小时周期的小时),如果小时时间在该范围内(包括该范围),则上面的
数据
帧
的每一行显示1,如果在该范围之外,则显示0。因此,例如,上述
数据
帧
的第二行如下所示: 1
浏览 42
提问于2018-05-31
得票数 1
3
回答
Pandas groupby独刊
python
、
pandas
我有一个
数据
帧
'region_group‘。如下所示,此
数据
帧
在“城镇/城市”列中没有“ARTHOG”
值
。但是,当我在此列上
执行
groupby优先时,此
值
将弹出。我正在试图理解为什么会发生这种情况。注意: region_group
数据
帧
基于
另一个
数据
帧
,该
数据
帧
在“城镇/城市”列中的
值</e
浏览 11
提问于2018-02-09
得票数 1
回答已采纳
2
回答
如何根据同一
数据
框列中的唯一
值
列表
对
该
数据
框子集?
python
、
loops
、
dataframe
、
filter
我有一个简单的
数据
帧
,看起来像这样。我想要能够选择所有的行,其中LOC是纽约,子集这个
数据
帧
,并标记为一个变量,我可以用来附加纽约的行,我已经创建的电子邮件使用win32的联系人。我希望随着LOC
值
的变化,这是动态的。 Contact LOC ...
浏览 10
提问于2019-04-23
得票数 0
1
回答
如何在转换后过滤spark
数据
帧
中的坏行或损坏行?
pyspark
、
pyspark-sql
| spark| 1|+-------+-------+-----+ 在将Score转换为int并将hits转换为float之后,我得到了以下
数据
帧
我只想在现有的
数据
帧
上
执行
这些
操作
。请帮助我,如果有任何内置的方式,以获得糟糕的记录后,演员。 请同时考虑这是示例
数据
帧
。该解决方案应适用于任何数量的列和任何场景。我尝试将空记录从两个
数据
帧
中分离出来,并
对
浏览 9
提问于2019-05-15
得票数 0
1
回答
使用相同的函数在
数据
框中创建多个新列
r
、
dplyr
、
tidyr
假设我有一个
数据
帧
“测试”,它原来有三个字段: Col1,Col2,Col3。 在单个列上
执行
此函数并输出单个列非常容易: Test <- Test %>% mutat
浏览 0
提问于2019-10-30
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
10招!看骨灰级Pythoner如何玩转Python
GhostTunnel复现之路
Python 字节码介绍 Linux 中国
pandas系列学习(五):数据连接
python中的生成器函数是如何工作的?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券