腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
非常大
的
制表符分隔
的
文本文件
的
列
选择
、
、
我正在处理一个非常大
的
以制表符分隔(大约20000行* 30000
列
)
的
.txt形式
的
表,这使得文件大于20 tab。我检查了桌面的内存,似乎无法直接使用R
中
的
read.delim或python
中
的
pandas
来读取该文件。我目前正在考虑
基于
列
的
过滤器制作表
的
一个小
子集
,新
的
文本文件将是20000行* 1200
列</em
浏览 34
提问于2020-10-19
得票数 0
回答已采纳
3
回答
在
pandas
中
从较大
的
数据
帧
中
删除较小
数据
帧
中
的
值
、
、
我在
pandas
中有一个非常大
的
数据
帧,其中一
列
被标记为"Col2“,该
列
的
行值包含一个长字符串。我从这个
数据
框
中
解析出
另一个
较小
的
数据
框
,其中包含我想要从原始
数据
框
中
删除
的
列
"Col2“值。基本上,我希望遍历原始
数据
帧,并根据与
浏览 0
提问于2015-11-19
得票数 0
1
回答
无法
子集
Pandas
dataframe
中
的
数据
、
、
、
基于
某些条件,我尝试从
Pandas
dataframe创建一个
子集
。我可以创建两个
子集
,但在尝试创建
另一个
子集
时出现语法错误。
数据
框
是具有
列
标题
的
.csv文件:编号、环境、阶段、类型、计划结束日期、关闭代码、结束子类别、由更改引起
的
事件、待定更改。我应该尝试使用“计划结束日期”创建一个
子集
,其中计划结束日期离今天日期超过4天
的
记录应该在不同
的
<e
浏览 1
提问于2019-11-21
得票数 0
1
回答
基于
另一个
数据
框
中
的
列
的
子集
pandas
数据
框
、
、
我有两个不同
的
数据
集。根据column values in these 2 data frames
的
一个条件,我想创建一个新
的
数据
集。10000 4 61 Day_2 5000 如果这些条件满足真temp=d1[d1.ID.isin(d2.ID) & d1['Period']<=d2['Period']],则temp将是
子集
ValueError: Can only compare identically-labeled Se
浏览 10
提问于2020-07-27
得票数 1
回答已采纳
1
回答
如何获取
pandas
数据
框
中
列
的
子集
?
、
、
我得到了一个具有多
列
的
pandas
数据
帧和一个具有
列
索引(0,1,...,n)
的
列表,该列表索引
数据
帧
的
列
的
子集
。如何创建恰好包含这个列
子集
的
新
数据
框
?
浏览 3
提问于2021-11-30
得票数 0
1
回答
如何打印一串
数据
帧
的
输出?帮助我改进代码
、
、
我正在努力提高我
的
蟒蛇技术。我能做些什么来使我
的
代码更有效率?我在k_frames中有10个
数据
集,如何将它们分别设置为新
的
数据
帧并打印输出。
浏览 0
提问于2018-04-22
得票数 0
1
回答
如何在dataframe
中
创建
基于
列名
的
变量?
、
、
、
、
我想在python
中
根据我
的
dataframe
的
列名创建变量。我不确定这是否可能,因为我是Python
的
新手。假设我
的
df是这样
的
: ID Date Name Counts2 05/04/2018 1XMK 223 05/04/2018 N2IS 130 如何创建一个变量来引用此
数据
帧
中</e
浏览 18
提问于2019-04-04
得票数 0
1
回答
我正在尝试从一行
中
获取多
列
数据
,如果该行
中
的
一
列
等于today date
、
、
、
import
pandas
file = "BT_Schedule_04_27_2020_PM.xlsx"site = df["BLC ID"] if date == today: print(date) 这就得到了我想要
的
日期,大概是5000行
中
的
8行。我希望能够
浏览 28
提问于2020-04-28
得票数 0
回答已采纳
1
回答
Pandas
-连接多个名称不同但
数据
类型相同
的
excel文件
、
、
我想将一个特定
的
工作表连接到
pandas
DataFrame
中
(所有工作表
的
名称都相同)。我遇到
的
问题是,每个工作表
中
的
列名称并不完全相同。我使用
pandas
编写了一段代码,但它
的
工作方式是将所有值连接到
pandas
数据
框
中
的
同一
列
中
,但
基于
列
的
名称。所以举
浏览 29
提问于2021-08-10
得票数 0
1
回答
更新R
中
的
列
我有一个
数据
框架:为此,我添加了一个离散变量我给他们起了一些有意义
的
名字:现在,我想创建一个新变量,它是第一个变量+ 10 --但前提是我
的
离散变量
的
值为1 df$new_var <- as.numericdf$discrete == 1]
浏览 3
提问于2017-06-02
得票数 0
2
回答
在
pandas
数据
框
中选择唯一
的
观测值
、
我有一个包含uniqueid
列
的
pandas
数据
框
。我想从
基于
此列
的
数据
框
中
删除所有重复项,以便所有剩余
的
观测值都是唯一
的
。
浏览 0
提问于2013-11-01
得票数 7
回答已采纳
1
回答
根据
Pandas
中
的
条件过滤重复行
、
我有下面的
数据
框
,其中有
基于
列
“原因”
的
重复行。Reason 123 -345 -546 Poor feedback我试图遍历上面的行
子集
,并仅当相应重复行
的
“原因”都丢失或任何一个丢
浏览 2
提问于2021-04-13
得票数 3
2
回答
当
列
包含因子时,使用OR将
数据
框
子集
、
我想在R
中
创建一个
数据
框
的
子集
,它
基于
一
列
因子
中
的
一个或
另一个
值,但似乎我不能对因子值使用|。显然,我
的
实际
数据
框
的
因子
列
中有3个以上
的
值,因此仅使用!= "c"是行不通
的
。
浏览 0
提问于2011-04-16
得票数 18
回答已采纳
3
回答
获取
基于
列名
的
pandas
数据
框
的
子集
、
、
我有一个包含140个样本(
列
)和大约27000个SNP(行)
的
pd.DataFrame。每个列名都有一个人口名称和一个数字(例如'FLFL04‘或'MI03’)具有6个不同
的
种群和不同数量
的
种群
中
的
样本。我希望
基于
种群名称
的
各个种群
的
子集
用于进一步
的
计算(Hardy-Weinberg精确测试);我可以使用循环和正则表达式进行计算,但希望有更快
的
解决方案。有没有一
浏览 3
提问于2013-04-21
得票数 2
回答已采纳
4
回答
从其他
数据
帧
的
子集
中获取随机样本
、
、
我有一个100,000行
的
大
数据
框
,我想添加一个
列
,其中值是
基于
数据
框
中常见名称
的
另一个
数据
框
的
子集
的
样本。用例子来解释可能更容易。colB = c('x','x','y','y','x','y','y',&
浏览 24
提问于2017-05-24
得票数 1
回答已采纳
1
回答
rowSums为0
的
子集
行数
基于
条件寻找
数据
框
(所有
列
都是数字)
的
子集
。我希望将rowSum =0
的
行设置为
子集
。只能找到一个解决方案来
子集
不等于0
的
行!提前谢谢。
浏览 1
提问于2021-02-10
得票数 0
4
回答
如何从
pandas
数据
框
中选择包含非重复项
的
列
、
我想从
pandas
数据
框
中选择包含非重复项
的
列
,并使用这些
列
组成一个
子集
数据
框
。例如,我有一个这样
的
数据
框
: x y zb 1 2 2d 4 2 3
列
"x“和"z”具有非重复值,因此我希望将它们挑选出来并创建一个新
的
数据
框</em
浏览 26
提问于2019-03-22
得票数 3
回答已采纳
2
回答
根据另一
列
的
值向python
pandas
数据
框
添加
列
、
我有一些
pandas
数据
框
,我想添加一
列
,这是一
列
的
差异,
基于
第三
列
的
值。下面是一个玩具示例: import numpy as np d = {'one' : pd.Series(range(4), index'] == i]['two'][j + 1] - df[df['three
浏览 1
提问于2014-08-26
得票数 0
2
回答
Pandas
,如何使用带有多索引
数据
帧
的
子集
来丢弃NA值?
、
、
我有一个包含多个索引
列
的
数据
框
。 从这个
数据
框
中
,我需要删除
列
的
子集
中具有NaN值
的
行。 我尝试使用pd.dropna
的
subset选项,但我无法找到指定列
子集
的
方法。在下面的示例
中
,我需要获得最后一行
的
乘车。import
pandas
as pd a = [1, 1, 2, 2
浏览 34
提问于2019-09-11
得票数 3
回答已采纳
1
回答
如何使用Python和
Pandas
创建十进制
列
和五分之一
列
来根据大小对
另一个
变量进行排名?
、
、
我有一个
数据
框
,它
的
列
包含Investment,它表示交易员
的
投资金额。我想在
数据
框
中
创建两个新
列
;一个
基于
Investment大小给出十进制排名,
另一个
给出五分之一排名。我希望1代表投资最大
的
十进制,10代表最小
的
。简单地说,我希望1代表投资最大
的
五分位数,5代表最小
的
。 我是
Pandas
的
浏览 0
提问于2014-10-22
得票数 18
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python更改数据框中的指定列
Python中如何去掉数据框的前两行数据
R的数据类型:向量与数据框
Excel数据有效性的设置下拉列表框
R与Python手牵手:数据框的构建、读取与基本描述
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券