循环pandas数据帧的每一行_将数据帧插入到pandas中的每一行_在pandas数据帧的每一行上应用函数 - 腾讯云开发者社区

python、pandas、file、dataframe、text

到目前为止，我的代码如下： import pandas as pd with open("input.txt") as f: data = f.readlines() for line in data: data = {'col1': [line[':']], 'col2': [line[':']], 'col3': [line[':']], 'col4': [line[':']]} df = pd.

浏览 17提问于2020-04-30得票数 1

2回答

将空字符串替换为列的模式

python、pandas

我有以下pandas数据帧： df = pd.DataFrame([["hitesh","","HAIK"],["hitesh","red","ll"],["haikent","red","tt"],["","","HAIK"]]) 我正在尝试将数据帧的空字符串替换为每列的相应模式。我在努力 df= df.replace("" , df.mode()[0]) 但这只是用第一列模式替换了数

浏览 9提问于2017-03-10得票数 2

回答已采纳

2回答

python -2Dnumpy数组，来自具有分隔范围的pandas数据框行

python、numpy、dataframe

我是python的新手，我将csv中的大数据加载到了pandas数据帧中。但是，我找不到一种方法来为dataframe的每一行创建一个2d数组，其中新np数组的每一行对应于X范围的值。例如，在我的代码中： import pandas as pd import numpy as np data = pd.read_csv("categorization/dataAll10Overfit.csv",header=None) #print(data) rec = data.iloc[:,0:3968] # outputs i rows x 3969 columns 在数据帧的每一行

浏览 17提问于2017-08-15得票数 2

回答已采纳

2回答

我需要分析数据帧中的所有行，并检查任何列中是否存在值

python、dataframe

我目前正在尝试检查数据帧的每一行中是否存在一个值，如果是这样，则应更改一个变量值。我在想这样的事情： import pandas as pd d1 = {'1': ['1.1.1.1', '2.2.2.2'], '2': ['molear', 'laurylh'], '3': ["131", "132"], '4': ["3", "4"], '5': ["133", &

浏览 12提问于2020-09-15得票数 1

1回答

解析每个文件夹以提取python中的信息

python、pandas、opencsv

我有一个目录，每个客户都有一个文件夹。在每个客户文件夹中都有一个名为surveys.csv的csv文件。我想打开每个客户文件夹，然后从csv中提取数据并进行连接。我还想创建一个包含该客户id的列，该id是文件夹的名称。 import os rootdir = '../data/customer_data/' for subdir, dirs, files in os.walk(rootdir): for file in files: csvfiles = glob.glob(os.path.join(mycsvdir, 'surveys.csv

浏览 1提问于2020-09-09得票数 1

3回答

循环遍历每列

python-3.x、pandas

我有一个有n列的dataframe，我正在尝试创建一个递归遍历这些列的函数。例如，假设我有以下数据帧： | left | center | right | |:---- |:------:| -----:| | One | Two | Three | 我想运行一个函数，它使用左列，然后是左列和中列，然后是左列、中列和右列。所以基本上，在每一步，我使用前面的列+ 1。在pandas中有一个有效的方法来做到这一点吗？

浏览 9提问于2020-12-10得票数 0

1回答

如何在Dask中获取从拼图文件读取数据帧的单行值？

python、dask

问题: DASK数据帧 loc[concrete_row, concrete_column] 返回多行的pandas数据帧，每行都有相同的索引： 0 [1,2,3] 0 [1,2] 0 [3] 而不是一个行值。 0 [1,2,3] 我正在阅读许多拼图文件： dd.read_parquet(dataset_dir+'/train/date*/*.parquet') 拼图文件中的每一行都有一个数组！似乎在调用具体行时，dask data

浏览 48提问于2019-06-05得票数 0

2回答

通过合并多个长度未知的数据帧来创建数据帧

python、pandas、dataframe、concat

我正在尝试对棒球场地的F/x数据进行一些分析。所有的俯仰数据都存储在一个pandas数据帧中，其中包含像“俯仰速度”和“X位置”这样的列。我有一个包装器函数(使用pandas.query)，对于给定的音高，它将找到具有类似速度和位置的其他音高。此函数返回未知大小的pandas数据帧。我想在大量的投球上使用这个函数；例如，查找与在一场比赛中投出的投球相似的所有投球。我有一个函数可以正确地做到这一点，但它相当慢(可能是因为它不断地调整resampled_pitches的大小)： def get_pitches_from_templates(template_pitches, all_pitches

浏览 1提问于2015-03-07得票数 0

1回答

将Pandas数据帧放入具有特定格式的字典列表的最有效方法

python、pandas、list、dictionary

我有一个Pandas数据框架，其中包含一个列和一个时间戳索引。数据帧的代码如下所示： import pandas as pd indx = pd.date_range(start = '12-12-2020 06:00:00',end = '12-12-2020 06:02:00',freq = 'T') df = pd.DataFrame(data = [0.2,0.4,0.6],index = indx,columns = ['colname']) 我想以某种方式从df行创建一个字典列表。对于数据帧的每一行，我希望创建一个具有

浏览 5提问于2020-12-18得票数 1

回答已采纳

1回答

连接pandas数据帧时的意外行为

python、pandas、csv、dictionary

我有一个相对简单的任务:我有N个pandas数据帧，每个数据帧有3行数据。大多数列名与所有N个数据帧匹配(有些数据帧可能缺少1到2列)。我想创建3个包含N行的新数据帧，以便通过连接这些行来形成它，使得第i个新数据帧将包含来自所有N个数据帧的行索引i中的所有行。下面是我的尝试。 listOfRows1 = listOfRows2 = listOfRows3 = [] for i in range(N): dfN = pd.read_csv("filename"+str(i)+".csv") dfN["Index"] = range(1,

浏览 14提问于2021-03-14得票数 0

回答已采纳

2回答

如何在python中将整个列表写入数据结构

python、class、pandas、data-structures

因此，我面临的问题是，我想创建一个数据结构，其中包含来自我的熊猫数据帧的46个项目。因此，我有了完整的列名列表和pandas dataframe。所以有没有办法把每一行pandas都转换成我的数据结构的一个对象。所以说：我有一个很棒的地方列X Y A 1 2 B3 4 C5 6 所以我想把每一行都转换成一个对象考虑到我有46列和100,000行，有什么好方法可以做到这一点吗？

浏览 1提问于2015-10-31得票数 0

1回答

根据另一个数据帧中的值将数据帧拆分为6个数据帧

python、pandas、dataframe

我正在尝试根据另一个数据帧中的值将一个数据帧的行分成6个列表。在python中使用pandas包。trainX =数据帧形状(7352,561)和trainY =数据帧形状(7351，1) 我想要的是根据trainY中相应行的值，将trainX的每一行排序到6个新的数据帧中。如果trainY中的第1行表示"1"，那么trainX中的第1行应该转到dataframe class1。如果trainY中的第2行表示"2"，那么trainX中的第2行应该转到dataframe class2。依此类推，直到trainX中的所有7351行都划分为类1到6。我用for循环

浏览 1提问于2021-11-26得票数 0

4回答

pandas中的多列分解

python、pandas、enumeration、data-cleaning

pandas factorize函数将序列中的每个唯一值分配给一个从0开始的顺序索引，并计算每个序列条目所属的索引。我想在多个列上实现pandas.factorize的等价物： import pandas as pd df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]}) pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0] 也就是说，我想要确定数据帧的几列中的每个唯一值元组，为每个值分配一个顺序索引，并计算数据帧中的每一行属于哪

浏览 0提问于2013-05-09得票数 12

回答已采纳

1回答

避免在迭代时引用下一个索引时出现索引错误

python、pandas、indexing

所以我有一个pandas dataframe，我使用iterrows()遍历每一行，对它做一些复杂的操作。其中一部分涉及从下一行的坐标中减去当前行的坐标，所以我这样做了 sqrt(((row[5] - df.iloc[index+1, 5])**2) + ((row[4] - df.iloc[index+1, 4])**2)) < .1 问题是当我完成对所有行的迭代时，最后一行将给我一个索引错误，因为我将引用不存在的下一个索引。我正在考虑只在数据帧的末尾添加一个虚拟行。有没有更优雅的解决方案来解决这个问题？编辑： for index, row in df.iterrows():

浏览 0提问于2018-07-04得票数 1

1回答

如何将数据帧中的每一行转换为具有属性的节点？

python-3.x、pandas、networkx

给出一个样本数据帧df import pandas as pd df = pd.DataFrame({ 'id': [1, 2, 3, 4, 5], 'a': [55, 2123, -19.3, 9, -8], 'b': ['aa', 'bb', 'ad', 'kuku', 'lulu'] }) 现在我想将这些数据“上传”到一个图表中。每一行都应该是一个具有id、a和b属性的节点。我尝试过用from_pandas_dataframe Ne

浏览 4提问于2022-02-22得票数 3

回答已采纳

2回答

获取列表中嵌套数据帧的汇总统计信息

python、list、dataframe

我有一个数据帧列表，我希望将该列表中每个数据帧的摘要统计信息返回到一个新的数据帧中-能够选择每个初始数据帧中的列(值)来返回摘要统计信息。输出数据帧中的每一行对应于初始列表中的每个数据帧。我可以使用for循环获得汇总统计信息输出，但它只会给我列表中最后一个数据帧的汇总统计信息，而不是列表中的所有数据帧。下面是一个for循环示例，它为我提供了列表中最后一个数据帧的输出统计信息。 for i in step2: step3=i.describe() #gives me a single df of the last item (dataframe) in my list 下面是我的列表

浏览 8提问于2019-09-14得票数 0

回答已采纳

2回答

如何使用应用于每行多个切片的函数来转换pandas中的DataFrame？

python、pandas

我想将函数f应用于pandas DataFrame的每一行中的许多切片。例如，DataFrame df将如下所示： df = pandas.DataFrame(np.round(np.random.normal(size=(2,49)), 2)) 因此，我有一个2行乘49列的数据帧，并且我的函数需要应用于两行中7个数据点的每个后续切片，以便结果数据帧看起来与输入数据帧相同。我是这样做的： df1=df.copy() df1.T[:7], df1.T[7:14], df1.T[14:21],..., df1.T[43:50] = f(df.T.iloc[:7,:]), f(df.T.iloc[

浏览 9提问于2014-11-16得票数 1

2回答

从Pandas中的apply函数返回多个对象

python、pandas、dataframe

我正在练习将apply与Pandas数据帧一起使用。因此，我制作了一个简单的数据帧，其中包含日期和值： dates = pd.date_range('2013',periods=10) values = list(np.arange(1,11,1)) DF = DataFrame({'date':dates, 'value':values}) 我有第二个数据帧，它由原始数据帧的3行组成： DFa = DF.iloc[[1,2,4]] 因此，我想使用第二个数据帧DFa，并从每一行获取日期(使用apply)，然后查找并汇总原始数据帧中之前出现的任何

浏览 0提问于2015-06-11得票数 1

1回答

Pandas DataFrame中的反转行值

python、pandas、dataframe

我正在处理一个pandas数据帧，我希望在每一行中找到最远的非空值，然后颠倒这些值的顺序，并输出一个行值颠倒的数据帧，而不会在第一列中留下空值。本质上颠倒了列的顺序并将非空值向左移位。在： 1 2 3 4 5 1 a b c d e 2 a b c 3 a b c d 4 a b c 输出： 1 2 3 4 5 1 e d c b a 2 c b a 3 d c b a 4 c b a

浏览 43提问于2019-08-24得票数 2

2回答

如何使用循环填充零列的空pandas数据帧的单元格？

python、pandas、dataframe

我需要抓取数百个页面，而不是存储每个页面的整个json，我只想将每个页面中的几列存储到pandas数据帧中。然而，在数据帧为空的一开始，我遇到了一个问题。我需要填充一个没有任何列或行的空数据帧。所以下面的循环不能正常工作： import pandas as pd import requests cids = [4100,4101,4102,4103,4104] df = pd.DataFrame() for i in cids: url_info = requests.get(f'myurl/{i}/profile') jdata = url_info.

浏览 23提问于2021-10-28得票数 0

回答已采纳

2回答

Python-循环trhough df并输出与行一样多的dfs

python、pandas

我的python代码生成了一个pandas数据帧，如下所示： enter image description here 我需要将其转换为另一种格式以实现以下目的:循环遍历数据帧中的每一行，并输出与表中的行一样多的数据帧。每个dataframe都应该有一个额外的列: timestamp，并且命名为"Type“列中的值。举个例子，我会有 enter image description here 我正在为从哪里开始而苦苦挣扎-我希望这里有人能给我一些建议？

浏览 23提问于2021-06-21得票数 0

2回答

删除基于pandas数据帧行的条件

python-2.7、pandas、dataframe

我的pandas dataframe有一个列，其中每一行都是一个对应于一个文件名的字符串。我从JSON文件中读取数据并提取列，如下所示： df = pd.read_json("mergedJSON.txt",lines=True,orient='columns') df2 = df.set_index("subject") for key,value in some_dict.iteritems(): df2.loc[value,"file_name"].to_csv(outfile,index=False, header=F

浏览 11提问于2017-08-23得票数 2

回答已采纳

2回答

Neo4j使用py2neo从pandas数据帧创建节点和关系

python、pandas、neo4j、cypher、py2neo

使用py2neo从Neo4j数据库的密码查询中获取熊猫数据帧的结果非常简单，如下所示： >>> from pandas import DataFrame >>> DataFrame(graph.data("MATCH (a:Person) RETURN a.name, a.born LIMIT 4")) a.born a.name 0 1964 Keanu Reeves 1 1967 Carrie-Anne Moss 2 1961 Laurence Fishburne 3

浏览 0提问于2017-08-17得票数 10

回答已采纳

1回答

tf.keras (RNN)层运行model.fit()时出现问题

python、pandas、keras、recurrent-neural-network、tensorflow2.0

我正在构建一个RNN来分析运动捕获(MoCap)数据，使用TensorFlow、Pandas和Keras。关于我的数据：数据是通过pandas.read_csv获得的，形状为(832,165) 每一行表示移动序列中的整个数据帧(832帧)。每一列表示一个关节的旋转数据(总共165个关节)。我试着一次在一行中输入数据。输出应该是运动序列中的下一个帧。在运行model.fit时，我经常会遇到不同类型的错误。我附上了一系列的照片，代表不同的尝试使模型工作。如果有人能提供一些指导，为什么它不工作，以及如何修复，我将非常感激它。另外，我的代码的每个版本都是不同的。只要它能

浏览 0提问于2020-02-28得票数 1

3回答

使用gzip数据帧，我如何逐行读取/解压缩此文件？

python、pandas、memory-management、dataframe、gzip

我有一个非常大的数据帧另存为gzip文件。在保存数据之前，还需要对其进行大量操作。您可以尝试将整个gzip数据帧转换为文本格式，将其保存到变量中，解析/清理数据，然后通过pandas.read_csv()保存为.csv文件。然而，这是非常耗费内存的。我想逐行读取/解压缩这个文件(我认为这将是最节省内存的解决方案)，解析它(例如，使用正则表达式re或pandas解决方案)，然后将每一行保存到pandas数据帧中。 Python有一个gzip库来实现这一点： with gzip.open('filename.gzip', 'rb') as input_file:

浏览 0提问于2016-08-12得票数 0

1回答

熊猫用其特定的阈值计算每一列

python、pandas、dataframe

如果我有以下数据帧： A B C D E 1 1 2 0 1 0 2 0 0 0 1 -1 3 1 1 3 -5 2 4 -3 4 2 6 0 5 2 4 1 9 -1 T 1 2

浏览 9提问于2019-10-17得票数 1

回答已采纳

2回答

如何将Python Dataframe转换为列表列表？

python、pandas、casting

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

7回答

Pandas更新sql

python、postgresql、pandas

有没有办法在不遍历每一行的情况下从数据帧中执行SQL update-where？我有一个postgresql数据库，要从数据帧更新数据库中的表，我将使用psycopg2并执行以下操作： con = psycopg2.connect(database='mydb', user='abc', password='xyz') cur = con.cursor() for index, row in df.iterrows(): sql = 'update table set column = %s where column = %s&

浏览 16提问于2015-08-13得票数 68

1回答

如何将字典列表转换为单个pandas数据帧？

python、pandas

我之前的代码是pandas数据帧列表列表，如下所示 rowResults = [ [df, df, df], [df, df, df], ... [df, df, df] ] results=results.append(rowResults) 因为所有的数据帧都有完全相同的列，所以当我追加上面的列表时，它将整个数据结构转换为单个数据帧，其中的列与单独的数据帧相同。现在，由于性能问题，我已经将小数据帧转换为字典。如果我创建了大量的数据帧，我发现在存储由pandas数据帧使用的元数据信息时存在某种类型的内存泄漏。当我使用字典时，这不会发生。我的新代码如下所示 rowResults = [ [

浏览 0提问于2013-01-23得票数 4

回答已采纳

1回答

导入多个excel文件并合并为单个pandas df，源名称为列

python、excel、pandas、dataframe

我正在尝试用python将一堆xlsx文件合并成一个单一的pandas数据帧。此外，我还想包含一个列，它列出了每一行的源文件。我的代码如下： import pandas as pd from pandas import ExcelWriter from pandas import ExcelFile import glob import os # get the path for where the xlsx files are path = os.getcwd() files = os.listdir(path) files_xlsx = [f for f in files if f[-4

浏览 12提问于2019-11-09得票数 1

回答已采纳

1回答

NaT上的groupby优先与groupby中的NaN不同

pandas

我有一个数据帧，我想首先使用groupby方法来收集每列的第一个时间戳。 import pandas as pd from pandas import DataFrame import datetime as dt ts1 = dt.datetime.now() ts2 = dt.datetime.now() ts3 = dt.datetime.now() DFdate=DataFrame([{'timestamp1':ts1,'ID':'A'},{'timestamp2':ts2,'ID':'A

浏览 0提问于2015-07-13得票数 2

1回答

Pandas如何打开带有表情图标的csv

python、pandas

就像标题所说的那样简单... 我有一个csv有测试的表情符号，如：?，?，❄️等。每当您尝试使用pandas方法read_csv()打开数据帧时标题##ParserError:标记化数据时出错。C错误：我确信在尝试处理表情符号时会出现错误，因为如果排除了带有表情图标的标题，我就不会收到该消息。所以..。我已经尝试过了： error_bad_lines ->几乎清除了每一行，留下了一个空的数据帧。更改unicode？是的，做到了！得到相同的错误... 我的熊猫read_csv行看起来是这样的： df = pd.read_csv(filepath_or_buffer='my.

浏览 14提问于2018-02-20得票数 1

1回答

如何在数据帧中分隔类的各个成员，然后按名称返回它们？

python、class、dataframe

我从下面的excel表格创建了一个数据帧：每一行都是一个单独的"mon“，有它自己的特定统计信息。我为mons创建了一个类，但现在我不确定如何将它们分开，并按名称分别调用它们。最终，我希望能够调用Mon1和Mon2，并创建一个新的类，它将包含它们基于其统计数据进行战斗的逻辑。 import pandas as pd df = pd.read_excel(r'C:\Users\ericb\Desktop\Simulator.xlsx') for row in df.itertuples(index=False): print(row)

浏览 1提问于2019-12-20得票数 0

2回答

根据另一列的值向python pandas数据框添加列

python、pandas

我有一些pandas数据框，我想添加一列，这是一列的差异，基于第三列的值。下面是一个玩具示例： import pandas as pd import numpy as np d = {'one' : pd.Series(range(4), index=['a', 'b', 'c', 'd']), 'two' : pd.Series(range(4), index=['a', 'b', 'c', 'd'

浏览 1提问于2014-08-26得票数 0

2回答

有循环可以用来整理这些代码吗？

r、loops

replace.value(zdata, c(1), DL[1], 0) replace.value(zdata, c(2), DL[2], 0) replace.value(zdata, c(3), DL[3], 0) replace.value(zdata, c(4), DL[4], 0) replace.value(zdata, c(5), DL[5], 0) replace.value(zdata, c(6), DL[6], 0) replace.value(zdata, c(7), DL[7], 0) replace.value(zdata, c(8),

浏览 0提问于2018-10-31得票数 0

回答已采纳

1回答

Pandas:从循环内的计算中提取数字

python、pandas、dataframe

我正在尝试从一个pandas数据帧中的多个列在一个循环中进行计算。我希望输出只是一个数字，但它的格式是index number dtype: int64。看起来应该很容易就能得到这个数字，但我想不出来。以下是一些数据和基本计算的简单示例 import pandas as pd # create a little dataframe df = pd.DataFrame({ 'A': [1,2], 'B': [3,4] }) # create a list to hold results l1 = [] # run a loop to do a si

浏览 7提问于2021-02-19得票数 0

回答已采纳

1回答

groupby.filter工作在系列上，而不是数据格式？(熊猫)

python、pandas

在IPython中，我在常规数据框架上执行groupby： grouped Out[356]: <pandas.core.groupby.DataFrameGroupBy object at 0x7f0e78578750> 但是它上的filter似乎是获得了Series而不是数据帧： ...: def print_obj(x): ...: print type(x) ...: return True ...: e=grouped.filter(print_obj) <class 'pandas.core.s

浏览 3提问于2014-01-02得票数 2

回答已采纳

1回答

以更具Pythonic风格的方式更改列数据类型

python-3.x、pandas、label

请帮我变得更有攻击性：我正在用Pandas对所有分类特征进行编码。我知道使用Sklearn也可以做到这一点，但我想单独使用Pandas或Python。我首先选择了“obj”类型的所有列，这些列恰好是cat (我正在处理一个小的数据帧，所以我可以肯定地知道这一点)。然后，我使用for循环来转换每一列。我知道通过避免for循环，我绝对可以做到这一点。蟒蛇越多越好： cat_cols = df.select_dtypes(include='object').columns for col in cat_cols: df[col] = df[col].astype(&

浏览 9提问于2019-01-22得票数 1

回答已采纳

2回答

将Dataframe导出到多个excel文件中

python、excel、pandas、histogram

我在excel文件中有一个大约27列的小型数据帧。实际上，我对编码非常陌生，需要帮助才能根据数据帧的列号将一个数据帧分成不同的excel文件。我尝试了一个小代码，它给出了同样的错误： import pandas as pd import numpy as np import matplotlib.pyplot as plt import openpyxl from pandas import ExcelWriter data = pd.read_excel('/Users/jorge/Desktop/Data/Book1.xlsx') counts, bins, patche

浏览 30提问于2017-06-28得票数 0

1回答

如何在Python/Pandas中将循环的垂直列转换为行，然后将它们堆叠在一起？

python-2.7、pandas、dataframe、transpose、data-manipulation

我首先垂直生成一些数据，但希望将它们转置为行数据，然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr'，'en'，'ir'，'ab')和3行的熊猫数据帧的最终结果？ # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk import re import random from random import randint import csv import

浏览 1提问于2015-10-20得票数 2

1回答

如何使用.loc和.contains设置列值

python、pandas、numpy、loc

.loc和.contains函数都返回一个dataframe对象。pandas文档指出，要为列中的每一行重新赋值，我应该使用.loc，但当与.contains结合使用时，我会收到以下警告：正在尝试对DataFrame中切片的副本设置值。尝试使用.locrow_indexer，col_indexer = value，请参阅文档中的注意事项：但是，这个过程是有效的，并且我得到了数据帧的列中每一行所需的值重新赋值。如何避免此警告？ #works df.loc[df["matchType"]=='duo',["matchType"]]='du

浏览 0提问于2019-04-15得票数 0

2回答

如何将几行附加到现有的pandas数据框中，其中的行数取决于理解列表

python、pandas、append、intervals

我试图通过一次添加几行来填充pandas中的现有数据帧，行数取决于一个理解列表，因此它是可变的。初始数据帧按如下方式填充： import pandas as pd import portion as P columns = ['chr', 'Start', 'End', 'type'] x = pd.DataFrame(columns=columns) RANGE = [(212, 222),(866, 888),(152, 158)] INTERVAL= P.Interval(*[P.closed(x, y) for x

浏览 31提问于2021-08-06得票数 0

1回答

这个矩阵运算的正式名称(矩阵列乘以列向量)？

python、matrix、multiplication、nomenclature

我已经编写了以下Python/Pandas代码，将M行x N列数据帧(A)的每一列乘以M x 1数据帧(b)，得到M x N数据帧C： def multiply_columns(A, b): C = pd.DataFrame(A.values * b.values, columns=A.columns, index=b.index) return C 换句话说，它将矩阵的每一列乘以长度相等的列向量。代码运行良好，但是我想不起这个操作的正式名称了。有什么想法？

浏览 12提问于2015-03-17得票数 1

2回答

从数据帧的行中生成和保存绘图

python、pandas、matplotlib、row

这里是Python新手。我的问题如下。我有这个(80,1002) DataFrame的连续数据从一个.csv文件加载。我的目标是遍历此df (80)的每一行，并在基本pyplot.plot上绘制每一行。在这个df中，前2列被用作标题，因此每个情节都有它的特定名称(这里是记录的时间和电极的名称)。我为一排画的情节是： import matplotlib.pyplot as plt import pandas as pd Location = r'/pathtothefile/name.csv' df=pd.read_csv(Location,sep=';')

浏览 0提问于2018-04-10得票数 0

回答已采纳

2回答

pyspark数据帧中所有列的总计数为零

python、dataframe、pyspark

我需要找出pyspark dataframe中所有列中0的百分比。如何在数据帧中找到每一列的零计数？附言:我尝试过将数据帧转换为pandas数据帧，并使用了value_counts。但是，对于大型数据集来说，推断它的观察值是不可能的。

浏览 0提问于2018-08-20得票数 4

1回答

不能在pyspark中使用python eval()作为pandas udf，但在python udf中使用相同

python、pandas、apache-spark、pyspark、user-defined-functions

我是pyspark中的pandas udf的新手，需要帮助为大型数据帧(>1亿行)中的每一行应用udf。我的dataframe中有一列，其中包含使用dataframe中的列的多个条件。对每一行应用条件的最好方法是使用python eval。当在python udf中使用python eval时，它工作得很好，但是运行起来需要很长时间，因为我有几百万行。同样，在Pandas udf中尝试运行失败时，会抛出Python异常"PythonException:从UDF抛出异常：'TypeError: eval() arg1必须是字符串、字节或代码对象‘“ 示例代码如下，此代码不

浏览 29提问于2021-06-25得票数 0

2回答

如何为数据帧的每一列运行ARIMA模型？

python、pandas、time-series、prediction、arima

我预测了5个地区的商品价格。数据被组织为Pandas数据帧。当我分开为每一列运行autoARIMA时，它是正常的(例如，对于data_frame["Region_name"])。 def __trainArima(self, actual_values, periods): fitted_model = pm.auto_arima(actual_values, start_p=3, start_q=2, max_p=3, max_q

浏览 18提问于2019-09-02得票数 1

回答已采纳

3回答

如何在pandas中创建datetime索引

python、numpy、pandas

如何创建用于原始数据系列的datetime索引"foo"。(示例是每15秒“foo”和每30秒“foo2”)。如果原始序列可以插入到“基本”数据帧中，我想使用“foo”来重新转换数据帧。如果需要组合df " foo“和df "foo2”的序列，内存命中率会是什么，最好用原始数据序列填充foo索引。编辑:在import pandas之后，datetime.timedelta停止工作

浏览 0提问于2012-04-05得票数 2

1回答

如何将数据帧的每一行转换为2D？

python、dataframe、2d

我将我的数据集设置为.csv，并在python中使用pandas打开它。现在我有了大小为(3259X37)的数据帧。我将标签分开，使我的特征数据帧大小变为3259x36，而标签数据帧大小变为3259x1。我需要将我的特征数据帧的每一行转换成2D，这样我将拥有3259个2D数据，每个大小(Mxn)可以是4x9，这样包含2D数据的每一行都对应于我的标签数据帧中大小为3259x1的等效标签。我该怎么做，请解释一下？

浏览 4提问于2021-09-06得票数 0

1回答

在python中通过循环遍历熊猫数据帧来求解方程。

python、pandas、scipy-optimize

我将csv输入文件中的数据帧作为数据帧。我希望循环遍历数据帧中的每一行，并为每一列分配一个变量。然后，这些变量被包含到一个等式中，最后我想通过包含数据帧的每一行的值来解决这个问题。最后，我希望为数据帧中的每一行提供一个有4个值的解决输出。 df = pd.read_csv('path/testfile.csv', delimiter='\t', header=None) print(df) 0 1 2 3 4 5 0 0.227996 0.337029

浏览 13提问于2022-03-22得票数 1

回答已采纳