我有一个数据帧,我需要按照规则更改3d列
1)如果第2列的i+1行和第i行的差值大于1,则3d列+1
我写了一个使用循环的代码,但是这个代码是永远有效的。
我用纯python写了一段代码,但肯定有更好的方法用pandas来做这件事。那么,如何用pandas重写我的代码来减少时间呢?
old_store_id = -1
for i in range(0,df_sort.shape[0]):
if (old_store_id != df_sort.iloc[i, 0]):
old_store_id = df_sort.iloc[i, 0]
我有一个从csv文件读取的数据帧y,它有两列,一列用于文本,另一列用于投票
>>> y = pd.read_csv("./path/to/my/doc.csv",encoding="utf-8")
>>> y
<class 'pandas.core.frame.DataFrame'>
Int64Index: 43977 entries, 2 to 72308
Data columns:
vote 43977 non-null values
text 43977 non-null va
感谢您的阅读。很抱歉,我相信这是一个简单的问题要回答。
我有一些数据
df:
Entry Found
0 Dog [1,0]
1 Sheep [0,1]
2 Cow "No Match"
3 Goat "No Match"
我想返回一个新的dataframe,它只包含在No Match列中包含Found的条目(并保持其索引顺序),即:
输出:
Entry Found
0 Cow "No Match"
1 Goat "No M
我正在使用Pandas操作一个包含多个行和列的csv文件,如下所示
Fullname Amount Date Zip State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 .
我有一个有1.5亿行的Pandas数据。其中大约有100万组,我想做一些非常简单的计算。例如,我想取一些现有的列'A',并在组中创建一个新列,'A_Percentile',它将'A'‘的值表示为百分位数。这里有一个小函数可以实现这个功能:
from scipy.stats import percentileofscore
def rankify(column_name,data=my_data_frame):
f = lambda x: [percentileofscore(x, y) for y in x]
data[colu
我有一个有7列的表,每隔几行,就有6列保持不变,只有7列变化。我想将所有这些行合并成一行,并将第7列的值合并到一个列表中。
所以如果我有这个数据
A B C
0 a 1 2
1 b 3 4
2 c 5 6
3 c 7 6
我想将其转化为:
A B C
0 a 1 2
1 b 3 4
2 c [5, 7] 6
因为A和C列的值在第2行和第3行是相同的,所以它们会折叠成一行,B的值将合并成一个列表。
熔化,爆炸和枢轴似乎没有这样的功能。如何使用Pandas来实现这一点?
我有一个由数千个条目组成的dataframe df,其中列"group“的值重复了2到10次。dataframe有七列,其中一列名为“url”,另一列名为“标志”。所有这些都是字符串。
我想用Pandas来穿行这些团体。对于每个组,我希望在"url“列中找到最长的项,并在对应于该项的”标志“列中存储"0”或"1“。我试过以下几种方法,但我无法使它起作用。我希望1)去掉下面的循环,2)能够通过df.apply(.)比较组中的所有项。
all_groups = df["group"].drop_duplicates.tolist()
for i
我正在尝试将列绑定,并对满足索引条件的行进行求和。
下面是我正在使用的DataFrame的一个例子:
df
A B C D
a aa 0 1
a aa 1 2
a aa 2 10
a bb 0 4
a bb 1 5
a bb 2 60
b aa 0 7
b aa 1 8
b aa 2 90
b bb 0 10
b bb 1 11
b bb 2 12
我想做的是首先将特征C列(即0,1
我使用sql查询查看表中的数据:
SELECT created, name, surname, phone, email, address
FROM jos_registration_form
ORDER BY created DESC
这将返回表前面的列表,其中包含创建的第一列名称、第二列名称、第三列名称,等等。
是否有一条sql语句可以只在前面将列名更改为其他(而不是mysql数据库中的)?
例如,在前面查看创建的第一个列名,希腊语Δημιουργία,第二个列名,希腊语Όνομα等等。
我知道这可以用php等来完成,但是我想用sql来完成。
我希望在给定特定条件的情况下,将Pandas的DataFrame中的列聚合为1。这个想法是为了节省DF中的空间,并将一些列聚合成一个列,前提是它们满足特定的条件。举个例子可能会让它更容易解释:
import pandas as pd
import seaborn as sns # for sample data set
# load some sample data
titanic = sns.load_dataset('titanic')
# round the age to an integer for convenience
titanic['age_