循环遍历Pandas数据帧行的有效方法_循环遍历不同的Pandas数据帧_循环遍历Pandas数据帧中的行花费的时间太长 - 腾讯云开发者社区

python、pandas

我正在尝试删除pandas数据帧中某个值后面的百分号，相关代码如下： for i in loansdata: if i.endswith('%'): i = i[:-1] 我在想i= i:-1会设置新值，但它没有。我该怎么做呢？为了清楚起见:如果我在For循环中打印i，则打印时不带百分号。但是如果我打印整个数据帧，它并没有改变。

浏览 1提问于2015-10-29得票数 0

3回答

如何使用for循环从dataframe中删除许多行，这些循环遍历需要删除的值？

python、pandas、loops、dataframe

我正在尝试通过它的名称删除超过数百万行，这是超过1000个唯一值。有一个主数据帧(df_summary)和另一个数据帧，其中包含必须从主数据帧中删除的行的名称。删除一些列不是问题，但是需要删除的唯一值的数量太多了，无法手动执行。因此，我尝试遍历它。 “两个数据帧的整体外观，列后面有许多列” 以下是我尝试过的方法： from pandas import read_csv import pandas as pd df_summary = read_csv ('path.csv', sep=',') rows_to_remove = read_csv ('

浏览 28提问于2019-10-25得票数 0

回答已采纳

1回答

如何在spark中使用pandas split-apply-combine风格策略和scala api？

pandas、scala、apache-spark、split-apply-combine

我有一个scala函数，它接受一个spark dataframe并返回一个单值，也就是说两个值。这个函数很复杂，使用在DataFrame类中定义的聚合，调用其他java库，并且不能用SQL表达。它需要整个数据帧的内容来进行计算，它不能一次添加一行并建立一个结果。我有一个大的dataframe，其中包含一个列，我想用它将dataframe分成小块，并对每个小块执行上述计算。然后，我想返回一个新的数据帧，其中包含每个组的一行和两列，一列包含groupby值，另一列包含结果。使用PandasUDF这将是一个相对简单的任务，但是我不知道如何在Scala中做到这一点。我尝试使用group by列对

浏览 28提问于2020-04-22得票数 0

1回答

如何在Python/Pandas中将循环的垂直列转换为行，然后将它们堆叠在一起？

python-2.7、pandas、dataframe、transpose、data-manipulation

我首先垂直生成一些数据，但希望将它们转置为行数据，然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr'，'en'，'ir'，'ab')和3行的熊猫数据帧的最终结果？ # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk import re import random from random import randint import csv import

浏览 1提问于2015-10-20得票数 2

2回答

从Python dataframe的列的每一行中移除前x个字符

python、string、pandas、dataframe、replace

我有一个大约1,500行15列的Python数据帧。对于一个特定的列，我想删除每行的前3个字符。作为一个简单的例子，这里有一个数据帧： import pandas as pd d = { 'Report Number':['8761234567', '8679876543','8994434555'], 'Name' :['George', 'Bill', 'Sally'] } d = pd.DataFrame(d) 我想

浏览 5提问于2017-02-21得票数 43

回答已采纳

2回答

如何在同一个Pandas dataframe单元格的列表元素之间换行？

python、pandas

浏览 199提问于2019-09-28得票数 0

回答已采纳

1回答

将值逐行写入数据帧太慢

python、dataframe

我有一个这样的数据帧： df1= Customer | Item | Qty ---------------------- 001 |A | 3 001 |B | 3 002 |C | 4 002 |D | 8 ... |... |... 我想把数据帧转换成这样的格式： df2= Customer | A | B | C | D |... ----------------------------- 001 | 3 | 3 | 0 | 0 |... 002

浏览 0提问于2017-12-28得票数 0

1回答

创建多个pandas数据帧作为列表上函数迭代的输出

python、pandas、dataframe、dictionary

我正在尝试使用pytaxize包的函数itis.hierarchy_full，以便从特定Id检索有关生物物种的信息。该函数只接受一个值/Id，并将所有分类信息保存在可供稍后编辑的pandas数据帧中。 import pandas as pd from pytaxize import itis test1 = itis.hierarchy_full(180530, as_dataframe = True) 我有大约800个物种I，我想自动化这个过程来获得800个不同的数据帧。我以某种方式创建了一个带有小列表的测试(请注意，我是一个生物学家，所以代码非常基础，可能效率很低： species =

浏览 0提问于2021-03-03得票数 0

1回答

Python DataFrame使用大型文本文件中的一小部分

python、pandas、file、dataframe、text

到目前为止，我的代码如下： import pandas as pd with open("input.txt") as f: data = f.readlines() for line in data: data = {'col1': [line[':']], 'col2': [line[':']], 'col3': [line[':']], 'col4': [line[':']]} df = pd.

浏览 17提问于2020-04-30得票数 1

2回答

如何使用列数据源获取行的索引？

python、pandas、bokeh

我使用从CSV文件中填充的熊猫数据帧，然后使用Bokeh将该数据帧转换为ColumnDataSource。看上去像是： dataFrame = pandas.read_csv('somefile.CSV') source = ColumnDataSource(dataFrame) 现在我有了所有的列，我想做基于行的计算。例如:我有三列： x, y, colour 它可能有以下内容： 1, 2, blue 2, 5, red 1, 8, yellow 现在，当我在源代码中搜索时，我想在该行中更改一些关联变量，那么我如何做到这一点： # how do i step throug

浏览 1提问于2017-10-10得票数 0

回答已采纳

1回答

如何加快在数据框列中查找重复项的速度

python、pandas、numpy

我希望找到在dataframe列中出现重复值序列的索引。我希望结果是一个列表列表，其中每个子列表都是重复值索引的单个序列。我当前的代码可以工作，但相当慢(10000行数据帧中10%重复的apx 15毫秒)： import pandas as pd import numpy as np import time # Given a dataframe and column, return a list of lists where each sublist # contains indexes of the sequential duplicates def duplicate_ranges(

浏览 0提问于2017-03-03得票数 0

2回答

如何在迭代pandas数据框时创建新列和插入行值

python、pandas、iteration、dataframe

我正在尝试创建一个逐行迭代pandas数据帧的函数。我想基于其他列的行值创建一个新列。我的原始数据帧可能如下所示： df: A B 0 1 2 1 3 4 2 2 2 现在，我想在每个索引位置创建一个用列A-列B的行值填充的新列，结果如下所示： df: A B A-B 0 1 2 -1 1 3 4 -1 2 2 2 0 我的解决方案有效，但仅当我不在函数中使用它时： for index, row in df.iterrows(): print index

浏览 0提问于2015-12-07得票数 19

回答已采纳

1回答

pythonic方法获取pandas数据帧的零记录切片

python、pandas

我有一个pandas数据帧，我想得到一个零记录切片。也就是说，具有相同列但零行的数据帧。我这样做的原因，是因为我想要一个空的dataframe，我在循环中向其中添加来自原始dataframe的行。目前，如果我使用： empty = df[0:0] 这是蟒蛇的方式吗？

浏览 1提问于2015-12-28得票数 2

2回答

Python-循环trhough df并输出与行一样多的dfs

python、pandas

我的python代码生成了一个pandas数据帧，如下所示： enter image description here 我需要将其转换为另一种格式以实现以下目的:循环遍历数据帧中的每一行，并输出与表中的行一样多的数据帧。每个dataframe都应该有一个额外的列: timestamp，并且命名为"Type“列中的值。举个例子，我会有 enter image description here 我正在为从哪里开始而苦苦挣扎-我希望这里有人能给我一些建议？

浏览 23提问于2021-06-21得票数 0

4回答

在Python中循环遍历数据帧的更优雅的方法

python、pandas

对于一个可迭代的对象，我们可以使用 for item in items: 但是，如果我有两个并排的可迭代程序，比如有两列的pandas数据帧，会怎么样呢？我可以使用上面的方法遍历一列，但是有没有一种更优雅的方法同时遍历两列呢？ import pandas as pd df = pd.DataFrame({'col 1': [1,2,3,4,5], 'col 2': [6,7,8,9,10]}) i = 0 for j in df['col 1']: print(j) print(df['col 2'][i])

浏览 15提问于2019-02-15得票数 1

1回答

使用Hive表迭代Spark数据帧

apache-spark、hive、pyspark、apache-spark-sql、hiveql

我有一个非常大的csv文件，所以我使用spark并将其加载到spark数据帧中。我需要从csv上的每一行提取纬度和经度，以便创建folium地图。使用pandas，我可以用一个循环解决我的问题： for index, row in locations.iterrows(): folium.CircleMarker(location=(row["Pickup_latitude"], row["Pickup_longitude"]), radiu

浏览 27提问于2018-05-30得票数 0

2回答

如何将Python Dataframe转换为列表列表？

python、pandas、casting

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

1回答

列表迭代将原始列表更改为无

python、csv、file-io、pandas

我正在读取csv文件，然后进行一些过滤： csv_chunks = pandas.read_csv(filepath, sep = DELIMITER,skiprows = 2, chunksize = 1000, converters = {"A": str, "B": str}) csv_chunks_new = [chunk[(chunk["A"] + chunk["B"]).isin(acids.tolist())] for chunk in csv_chunks] 奇怪的是，当我现在尝试将csv_c

浏览 0提问于2013-07-16得票数 0

回答已采纳

1回答

Pandas优化

python、numpy、pandas

我写了一个函数来处理pandas的数据。使用我的函数的%prun的分析日志张贴在底部(只有几行)。我想优化我的代码，因为我需要调用这个我写了超过4000次的函数。运行此函数一次需要37.7s。似乎最耗时的部分是numpy.ndarray的nonzero。因为我几乎所有的操作都是基于pandas的，所以我想知道pandas中的哪个函数严重依赖于这种方法？我的操作主要包括使用df.ix[]的基于datetimeindex的数据帧切片和使用pandas.merge()的数据帧合并。我知道不发布实际的脚本很难判断，但是脚本太长了，没有意义，而且大多数操作都是临时的，所以我不能把它重写成小脚本在这

浏览 2提问于2014-06-24得票数 0

1回答

Web抓取数据，然后在数据帧上显示和更新数据

python、pandas、dataframe

我正在尝试创建一个数据帧，它可以显示和更新数据帧上的数据。我发现这个方法创建一个循环并输出数据，它看起来像这样： from bs4 import BeautifulSoup import requests import pandas as pd def priceTracker(): url = 'https://finance.yahoo.com/quote/AAPL' response = requests.get(url) soup = BeautifulSoup(response.text,'lxml') price

浏览 9提问于2021-04-02得票数 0

2回答

如何使用循环填充零列的空pandas数据帧的单元格？

python、pandas、dataframe

我需要抓取数百个页面，而不是存储每个页面的整个json，我只想将每个页面中的几列存储到pandas数据帧中。然而，在数据帧为空的一开始，我遇到了一个问题。我需要填充一个没有任何列或行的空数据帧。所以下面的循环不能正常工作： import pandas as pd import requests cids = [4100,4101,4102,4103,4104] df = pd.DataFrame() for i in cids: url_info = requests.get(f'myurl/{i}/profile') jdata = url_info.

浏览 23提问于2021-10-28得票数 0

回答已采纳

1回答

在pyspark中逐行操作或逐行对数据帧执行UDF操作

python、pyspark、row、spark-dataframe

我必须在pyspark中实现pandas .apply(function，axis=1) (以应用行式函数)。由于我是一个新手，我不确定它是否可以通过map函数或使用UDF来实现。我在任何地方都找不到任何类似的实现。基本上，我要做的就是将一行传递给一个函数，执行一些操作来创建依赖于当前行和前一行的值的新列，然后返回修改后的行来创建新的数据帧。pandas使用的函数之一如下所示： previous = 1 def row_operation(row): global previous if pd.isnull(row["PREV_COL_A"])==True o

浏览 33提问于2017-03-05得票数 1

2回答

如何使用两组变量拆分pandas数据帧

python、pandas

我有一张桌子，看起来像这样。从CSV文件中读取，所以没有关卡，没有花哨的索引，等等。 ID date1 amount1 date2 amount2 x 15/1/2015 100 15/1/2016 80 我拥有的实际文件是date5和amount 5。我如何将其转换为： ID date amount x 15/1/2015 100 x 15/1/2016 80 如果我只有一个变量，我会使用pandas.melt()，但是有了两个变量，我真的不知道如何快速完成。我可以手动导出到内存中的sqlite3数据库，

浏览 0提问于2015-11-03得票数 1

1回答

在DataFrame中更改列

python、pandas

我希望在数据帧的列中更改字符串的一部分。但是，我无法让它在数据帧中进行更新。这是我的密码。 import pandas as pd #File path csv = '/home/test.csv' #Read csv to pandas df = pd.read_csv(nuclei_annotations_csv, header=None, names=['A', 'B', 'C', 'D', 'E', 'F']) #Select Data to update paths

浏览 0提问于2018-09-28得票数 0

回答已采纳

2回答

基于唯一值将数据帧子集成小数据帧子集并同时写入csv文件的有效方法

python、r、pandas、dataframe、csv

根据唯一/过滤条件将大型数据帧df子集划分为较小子集的最有效方法是什么？例如，我有一个维度为22050行、5列的数据集，如下所示 id, nationality, age, gender, income 10001, France, 20, M, 45007 13328, UK, 52, F, 72308 11654, USA, 57, F, 95645 11765, UK, 39, M, 77343 10081, UAE, 41,M, 83117 10503, France, 22, F, 25665 在整个数据集中有15个独特的国家，我想根据这15个独特的国家将数据集子集为15个数据帧

浏览 38提问于2020-09-28得票数 4

回答已采纳

2回答

从现有数据框架的每一行创建新数据框架的Pythonic方法

python、dataframe

请推荐一种从现有数据框的每一行创建新数据框的pythonic方法。该建议必须考虑到现有数据帧的行数是随机的，因此提供的解决方案必须考虑到这一点。(对于下面的示例，原始数据帧包括3行，但是，原始数据帧中的实际行数将是随机的。)原始数据框的列将保持不变。原始数据帧： import pandas as pd from numpy.random import randn df = pd.DataFrame(randn(3,3), columns=['column 1', 'column 2', 'column 3'], index = [

浏览 20提问于2021-09-28得票数 1

回答已采纳

4回答

pandas中的多列分解

python、pandas、enumeration、data-cleaning

pandas factorize函数将序列中的每个唯一值分配给一个从0开始的顺序索引，并计算每个序列条目所属的索引。我想在多个列上实现pandas.factorize的等价物： import pandas as pd df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]}) pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0] 也就是说，我想要确定数据帧的几列中的每个唯一值元组，为每个值分配一个顺序索引，并计算数据帧中的每一行属于哪

浏览 0提问于2013-05-09得票数 12

回答已采纳

2回答

如何使用EMGU提取视频的一部分

c#、emgucv

我正在尝试创建C#的小应用程序，将加载视频文件，例如有600帧。我想要显示帧，并设置开始帧(例如帧号100)和结束帧(例如帧号500)，应用程序的输出应该是从起点到终点的新视频。我是EMGU的新手，所以任何人都可以帮我做到这一点。我计划创建简单的用户界面，将使用户能够移动开始标记(关于开始帧位置)以及结束标记(关于结束帧位置)。

浏览 3提问于2013-08-21得票数 0

3回答

在R中将数字转换为逻辑数据帧

r、dataframe

我有一个与下面类似的存在/缺席数据帧： Cu Zn Mn 1 0 1 0 0 1 1 0 1 0 1 1 我希望将其转换为逻辑(真/假)数据帧。有没有办法做到这一点？我使用了as.logical命令，但是数据帧失去了它的结构。此外，我也尝试过replace，但它似乎不适用于数据帧。会有什么东西将整个数据帧转换为逻辑值吗？谢谢!

浏览 18提问于2019-01-23得票数 2

2回答

在Pandas中迭代数据帧中的行:使用df.index和df.iterrows()作为迭代器有什么区别吗？

python、pandas、dataframe

在Pandas中迭代数据帧中的行时，使用以下方法是否存在性能上的差异： for index in df.index: .... 和： for index, row in df.iterrows(): .... ？哪一种是最好的？

浏览 9提问于2021-12-04得票数 1

回答已采纳

1回答

创建数据帧的问题

python、pandas、dataframe

我正在尝试使用for循环来创建一个数据帧。它可以工作，但数据帧的输出不正确。数据帧的每个单元包含所有数据。我可以知道怎样才能修好它吗？代码如下： from pandas_datareader import data import datetime from math import exp, sqrt import pandas as pd records = [] test = ['AAPL','AAL'] for i in test: stock_price = data.DataReader(test,

浏览 11提问于2021-04-16得票数 0

回答已采纳

3回答

如何重塑/“颠覆”熊猫数据帧

python、pandas

对于我想要的操作，Topple很可能是错误的名称，但我想不出更好的名称。我有N个形状为(100,3)的数据帧，原始数据帧的每一行都是测试的名称及其产生的两个结果。我希望将单个数据帧重塑为(1,200)形状，并将测试的所有值作为一行。之后，我将把所有N个数据帧附加到一个单独的数据帧中，并以(N,200)个数据帧结尾。下面是一个使用虚拟数据的示例： import pandas as pd import numpy as np import random import string np.random.seed(42) tests = np.random.choice(list(string.

浏览 13提问于2018-12-12得票数 0

回答已采纳

6回答

如何在Pandas中获取数据帧中的行号和列号？

python、pandas

如何使用Pandas获取包含特定值的dataframe中的行数和列数？例如，我有以下数据帧： ? 例如，我需要知道"Smith“的行和列(行1，列LastName)。

浏览 125提问于2020-12-18得票数 0

1回答

Python3:使用dataframe字典时的KeyError 0

python、pandas

使用下面的代码，我尝试将n-DataFrames插入到MSSQL表中。 for file in os.listdir(): print('# Inserting ' + file + ' . . .') df = pd.read_csv(file) df = df.fillna('NULL') if(len(df)>1): dfs = partDF(df , lim) for k in dfs.keys(): print('\t' + str(int(

浏览 328提问于2018-07-28得票数 0

2回答

Pandas:如何使列行依赖于它以前的行，可能有一个函数？

python、function、pandas、rows

我试图根据A列和B列以前的数据计算B列，一个简单的函数例子是例如B(n) = A(n-1) + B(n-1)，其中n是Pandas数据帧的索引。我不需要使用dataframe索引。在本例中，我从B(1) =0开始，并以连续的方式添加A行。 n A(n) B(n) ---------------- 1 1 0 2 0 1 3 2 1 4 9 3 这种数据结构的一个示例将在Pandas中定义为 d = {'A' : pd.Series([1, 0, 2, 9],), 'B

浏览 2提问于2015-01-13得票数 1

回答已采纳

1回答

如何将python生成器转换为pandas dataframe

pandas、generator、python-3.7

我是python和pandas数据帧的新手，我正在努力地思考如何将python生成器转换为pandas数据帧。我想要做的是用这个函数将一个大表分成块，生成一个生成器： def fetch_data_into_chunks(cursor, arraysize=10**5): while True: results = cursor.fetchmany(arraysize) if not results: break for result in results: yield result 然后

浏览 35提问于2018-07-19得票数 0

回答已采纳

1回答

Python:绘制系列类型的panda数据帧

python、pandas、numpy、plot、series

我有一个包含10行的数据帧(df)，如下所示 -2.00 [-24.4907, -24.4594, -24.4321, -24.4012, -24.3... -1.75 [-23.8154, -23.7849, -23.7601, -23.7326, -23.7... -1.00 [-23.7131, -23.6954, -23.6767, -23.6616, -23.6... -0.75 [-22.7675, -22.7505, -22.741, -22.7173, -22.70... -0.50 [-22.0693, -22.0718, -22.0481, -

浏览 0提问于2017-09-18得票数 0

1回答

获取pandas数据对象的x，y样式坐标

python、pandas

我想知道是否有可能在pandas数据帧中搜索值，如果找到了，则返回行名和列名样式坐标。例如，如果在下面的数据框中搜索mat字符串，将返回(3，C)。 A B C 0 20 32 bat 1 30 234 cat 2 10 23 rat 3 40 23 mat 4 50 42523 etc 我已经通读了文档，我找到的最接近的解决方案是index.get_loc()，尽管它只返回基于命名索引的loc。 pandas版本0.22.0

浏览 4提问于2018-01-30得票数 1

回答已采纳

1回答

Python:我如何才能将一行熊猫数据帧转换为数据帧？

python、pandas、dataframe

我有一个熊猫数据框架： type(df_s1) Out[362]: pandas.core.frame.DataFrame 这是它的一行。它是一个系列，而不是一个数据帧。但我希望它是一个数据帧。我该怎么做呢？ type(df_s1.iloc[(j+2), 0:n_s]) Out[363]: pandas.core.series.Series 对于数据帧中的多个行，这不是问题。 type(df_s1.iloc[(j-1):(j+2), 0:n_s]) Out[364]: pandas.core.frame.DataFrame

浏览 7提问于2020-04-22得票数 0

3回答

pandas排序lambda函数

python、pandas、sorting

给定具有3列、A、B、C和3行数值的数据帧a。如何使用comp运算符仅使用A[i]*B[i]的乘积对所有行进行排序。似乎pandas排序只接受列，然后是排序方法。我想使用下面这样的比较函数。 f = lambda i,j: a['A'][i]*a['B'][i] < a['A'][j]*a['B'][j]

浏览 2提问于2016-09-16得票数 20

3回答

Pandas系列命名为series

python、pandas

我正在访问pandas数据帧行，因此我得到了pandas系列。我的解析例程接受命名元组。是否可以将pandas序列转换为命名元组？

浏览 2提问于2018-02-14得票数 3

1回答

连接pandas数据帧时的意外行为

python、pandas、csv、dictionary

我有一个相对简单的任务:我有N个pandas数据帧，每个数据帧有3行数据。大多数列名与所有N个数据帧匹配(有些数据帧可能缺少1到2列)。我想创建3个包含N行的新数据帧，以便通过连接这些行来形成它，使得第i个新数据帧将包含来自所有N个数据帧的行索引i中的所有行。下面是我的尝试。 listOfRows1 = listOfRows2 = listOfRows3 = [] for i in range(N): dfN = pd.read_csv("filename"+str(i)+".csv") dfN["Index"] = range(1,

浏览 14提问于2021-03-14得票数 0

回答已采纳

1回答

在python中只遍历特定范围的对象索引。

pandas、loops、object、indexing、append

我正在尝试基于该数据帧中的两个预先存在的列来附加一个pandas数据帧。我遇到的问题是pandas数据帧的索引是对象格式，而不是整数格式。让事情变得更复杂的是，我只想附加一定范围的数据帧，将新列中的剩余单元格保留为'NaN‘。为了仅附加到数据帧的特定范围内，我将不得不使用"for“循环。这是我的问题:当我有一个对象索引时，我如何遍历数据帧的某个范围？我最初的pandas数据帧很简单... import pandas as pd dates = ['2005Q4','2006Q1','2006Q2','2006Q3&#

浏览 0提问于2017-09-21得票数 0

1回答

如何删除由python代码创建的所有pandas dataframe

python、r、pandas

我正在使用python 3.x。我想删除我的python代码创建的所有pandas dataframe。我知道有一个选择 del df 要删除dataFrame df，请执行以下操作。但是我看起来有点像R命令 rm(list=ls()) 删除由我的代码创建的所有可用数据帧。你能建议一下吗？

浏览 32提问于2020-09-07得票数 0

回答已采纳

3回答

Python pandas数据帧拆分

python、pandas、dataframe

我有这样一种dataFrame，我想将其拆分成独立的数据帧： A B C Mark 3 5 6 T 4 5 2 T 3 4 5 B 5 6 7 B 3 4 5 T 2 5 2 T 例如，上面的表格应该被分成三个pandas数据帧。第一个数据帧将两行标记为"T“作为一个数据帧，第二个数据帧将下两行标记为"B”，第三个数据帧将最后两行标记为"T“。 df1 A B C Mark 3 5 6 T 4 5 2 T df2 A B C Mark 3 4 5 B 5 6 7 B df3 A B C Mark 3 4 5 T 2 5 2 T

浏览 21提问于2019-02-14得票数 2

回答已采纳

3回答

如何创建多个数据框并将其合并到一个大数据框中，以避免创建多个变量

python、dataframe

我正在抓取一个HTML并将数据存储在一个pandas数据帧中。我需要一个循环，因为html中的数据在多个url中。我的第一个想法是创建与url一样多的数据帧，创建许多变量，但我读到这不是一个好主意。我读到的解决方案是创建一个字典，但我不知道如何使用数据帧来做到这一点。我只想要一个包含从第一个数据帧的第一行到最后一个数据帧的最后一行的信息的最终数据帧。到目前为止，这是我的代码 # To simulate I am a browser and send request to get the body of the response. header = { "User-Agent

浏览 27提问于2021-03-14得票数 0

回答已采纳

2回答

从pandas df更新数据库中的现有行

python、postgresql、pandas

我有一个PostgreSQL数据库。Pandas有一个“to_sql”函数，可以将数据帧的记录写入数据库。但我还没有找到任何文档，说明在我使用完dataframe时如何使用pandas更新现有的数据库行。目前，我可以使用pandas read_sql_table将数据库表读取到数据帧中。然后，我会根据需要处理数据。但是，我还不能弄清楚如何将该数据帧写回数据库以更新原始行。我不想覆盖整个表。我只需要更新最初选择的行。

浏览 73提问于2015-04-13得票数 25

2回答

Pandas dict to dataframe -列无序？

python、pandas

我进行了搜索，但没有看到与这个特定问题有关的任何结果。我有一个Python字典，正在将我的字典转换为pandas数据帧： pandas.DataFrame(data_dict) 它可以工作，但有一个问题-我的pandas dataframe的列与我的Python字典的列的顺序不同。我不确定熊猫是如何重新排序的。如何保留排序？

浏览 2提问于2015-04-15得票数 1

2回答

如何将几行附加到现有的pandas数据框中，其中的行数取决于理解列表

python、pandas、append、intervals

我试图通过一次添加几行来填充pandas中的现有数据帧，行数取决于一个理解列表，因此它是可变的。初始数据帧按如下方式填充： import pandas as pd import portion as P columns = ['chr', 'Start', 'End', 'type'] x = pd.DataFrame(columns=columns) RANGE = [(212, 222),(866, 888),(152, 158)] INTERVAL= P.Interval(*[P.closed(x, y) for x

浏览 31提问于2021-08-06得票数 0

5回答

将Python字典重塑为Pandas数据帧

python、pandas、dictionary

我给出了一个Python字典，看起来像这样： myDict = {'A':['a','b','c','d','e'], 'B':['f','g','h']} 我想将其转换为具有以下结构的Pandas数据帧： key val 0 B f 1 B g 2 B h 3 A a 4 A b 5 A c 6 A d 7 A e 我不能使用标准方法将字典输入到

浏览 29提问于2019-01-25得票数 2

回答已采纳