不确定这是否可能。
我有一个大约有90列的数据帧。我需要将这些列的特定数量(~50)重命名为不同的名称。这些列将分布在整个数据帧中(即不是前50列或后50列)。
有没有一种快速的方法可以做到这一点,而不使用pandas (下面的例子)给出的方法?
df.rename(index={0: "x", 1: "y", 2: "z"})
A B
x 1 4
y 2 5
z 3 6
Edit:这是用于创建数据帧的代码:
# Function to import data from ARIC json file to dataframe
我想找出pandas数据帧中的哪些列具有不连续的数据。所谓“不连续”,我的意思是这些值从某个值变为零,然后再有一些值。
[0,0,0,1,2,3,4,5,0,0,0] # continuous
[0,0,0,1,2,0,4,5,0,0,0] # not continuous
我已经设法实现了一些可以做到这一点的代码,使用for循环来迭代数据帧的每一列。我在下面制作了一个工作代码片段来说明我的意思:
import numpy as np
import pandas as pd
def find_discontinuous(series):
switch = 0
for inde
我使用python和pandas调用带有元组Time、Name、Good、Bad的Excel数据。 我想将数据帧重新处理为满足特定条件的另一个数据帧。 具体地说,我想打印出一个数据帧,它存储了整个时间内每个名称的好数据和坏数据的总和。 请帮助我谁知道蟒蛇,熊猫。 enter image description here
我想使用pandas数据帧中的第一列作为行索引,所以我尝试使用来实现,但这样做的副作用是添加了额外的列索引。
(运行选项InteractiveShell.ast_node_interactivity = "all"的jupyter notebook代码):
import pandas as pd
df = pd.DataFrame([[l+r*10 for l in range(1, 5)] for r in range(1, 5)])
df # before
df.set_index(0, inplace=True)
df # after
set_index()之前的
假设我有一个数据帧,它可以表示为: pd.DataFrame(columns=['X', 'Y'],index=['A','B'])
X Y
A 1 2
B 3 4 然后,我想对每个单元格应用函数,以获得每个行的数据帧、具有列名和索引的单元格的值,如下所示: Col1 Col2 Value
1 X A 1
2 Y A 2
3 X B 3
4 Y B 4 我知道我可以循环它来得到结果,但我希望有一个更好的像
如果我想使用熊猫更改数据帧中的变量名,可以不使用pandas.df.rename()函数,而是使用applymap()来更改名称吗?
Registrar Enrolment Agency State District Sub District Pin Code Gender
Allahabad Bank Tera Software Ltd Jharkhand Ranchi Namkum 834003 M
Allahabad Bank Tera Software Ltd Jharkhand Ranchi Ranchi 834004
我首先垂直生成一些数据,但希望将它们转置为行数据,然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr','en','ir','ab')和3行的熊猫数据帧的最终结果?
# coding=utf-8
import pandas as pd
from pandas import DataFrame, Series
import numpy as np
import nltk
import re
import random
from random import randint
import csv
import
我在pandas中将列名分配给一个数据帧,但是列名正在创建新的列,我该如何解决这个问题?
现在的数据帧是什么样子的:
abs_subdv_cd abs_subdv_desc
0 A0001A ASHTON ... NaN
1 A0002A J. AYERS ... NaN
2 A0003A NEWTON ALLSUP
我有两个数据帧: Reprex:
DF1
X
Yes
No
Maybe
DF2
Y
Yes
No
Maybe
import pandas as pd
import numpy as np
train = pd.DataFrame(np.hstack([DF1,DF2]))
火车
0 1
Yes Yes
No No
Maybe Maybe
为什么我的报头会从X和Y更改。列车df应该保留两个df的原始报头。我试着制作axis=1和headers=true,但它不起作用。pd.concat是无效的,因为我最终得到的行数比我原始df中的行数多。
我也试过了
df.reset_index()
但即使
我在Pandas中有一个这样的数据帧: # https://www.datasciencemadesimple.com/reshape-long-wide-pandas-python-pivot-function/
import pandas as pd
import numpy as np
from platform import python_version
print(python_version()) #3.7.7
#Create a DataFrame
d = {'countries':['A','B','C'
我正在尝试计算数据帧中每一列的最大和最小长度,该数据帧中有一些缺失值。Pandas将这些缺失值视为"NaN“,并将长度计为3。如何在计算最大和最小长度时完全忽略缺失值?下面是我的代码: import pandas as pd
columnname=[]
maxColumnLenghts = []
minColumnLenghts=[]
for colname in df.columns:
columnname.append(colname)
for col in range(len(df.columns))
这段代码的目的是收集一些数据表,将它们转换为pandas数据框,删除一些不必要的列并确定日期。
每个数据帧有2列,第一列在每个数据帧中被称为(‘发布日期’),而另一列对于每个数据帧具有不同的名称。
然后将这些表连接到单个统一的数据框架中,并将“发布日期”列作为索引,因此同时发生的事件必须在同一行。
当我尝试这段代码时:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from sel