将pd数据帧转换为列表_将pd.read_html列表转换为数据框_将列表列表转换为数据帧 - 腾讯云开发者社区

python、python-3.x、pandas、list、dictionary

我一直在尝试将特定键的值存储到pandas数据帧中，该数据帧来自具有字典列表的另一个数据帧。有人能教我怎么做吗？？ source data frame result data frame

浏览 11提问于2021-02-08得票数 0

2回答

如何将Python Dataframe转换为列表列表？

python、pandas、casting

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

1回答

根据列值添加行

python、pandas、list、dataframe、validation

数据帧 l=['apple', 'banana'] 从另一个数据帧列中提取，我从列水果中提取列的唯一值。fruits.unique()，其结果是数组()获取项目列表，只需遍历索引值并将其存储在列表中循环列表，以检查列表中的值是否显示在数据帧的列中。如果存在，则为匹配列标题的值添加1，否则为匹配的值添加0。在上述情况下，匹配后的数据框架应该如下所示： 234 apple banana orange 0 1 1 0

浏览 6提问于2022-03-04得票数 0

1回答

从具有True的列的列表的字典创建pandas数据帧

python、pandas、dictionary、dataframe

我想要一本'item': [list_of_True_column_labels]字典，看起来像这样： pre_df = {'item1':['a','b','c'], 'item2':['c','d'], 'item3':['a', 'c', 'd', 'e'], 'item4':['e']} 并将其转换为bool的熊猫数据帧，如下所示： index

浏览 2提问于2016-12-07得票数 3

2回答

从列表中的pandas数据框值中生成(列id，值)元组

python、pandas、dataframe

我想将pandas数据帧中的每个值转换为以下形式的元组：(col_id, val)，其中col_id是列的整数顺序，val是该位置的值，并以列表的形式输出，该列表忽略其val==0的元组。示例： 0 1 2 3 document0001 48 0 3 0 document0002 0 4 0 0 输出： [[(0,48), (2,3)], [(1,4)]] 我认为我可以使用apply迭代或编写一个自定义函数来生成元组，但必须有更好的方法。

浏览 0提问于2020-08-13得票数 1

2回答

获取列表中嵌套数据帧的汇总统计信息

python、list、dataframe

我有一个数据帧列表，我希望将该列表中每个数据帧的摘要统计信息返回到一个新的数据帧中-能够选择每个初始数据帧中的列(值)来返回摘要统计信息。输出数据帧中的每一行对应于初始列表中的每个数据帧。我可以使用for循环获得汇总统计信息输出，但它只会给我列表中最后一个数据帧的汇总统计信息，而不是列表中的所有数据帧。下面是一个for循环示例，它为我提供了列表中最后一个数据帧的输出统计信息。 for i in step2: step3=i.describe() #gives me a single df of the last item (dataframe) in my list 下面是我的列表

浏览 8提问于2019-09-14得票数 0

回答已采纳

3回答

python/pandas/一维数据框架

python、pandas

创建2维数据帧效果很好： y = np.array([[1,2],[3,4]]) df = pd.DataFrame( y, index=[1,2], columns=["a","b"] ) print (df) 但是，如果我尝试创建一个一维数据帧，我会得到一个错误消息： z = np.array([5,6]) df2 = pd.DataFrame( z, index=[3], columns=["a","b"]) print (df2) Error message: Shape of passed values is (1,

浏览 0提问于2018-09-15得票数 1

2回答

pandas将分组的数据帧作为行添加到另一个数据帧

python、pandas、dataframe

我得到了以下数据帧： category_name amount Blades & Razors & Foam 158 Diaper 486 Empty 193 Fem Care 2755 HairCare 3490 Irrelevant 1458 Laundry 889 Oral Care 2921

浏览 0提问于2016-05-14得票数 0

1回答

如何在python中遍历多个dataframe并向新dataframe添加值

python、pandas、dataframe

我有4个数据帧： df1 = pd.read_csv('values1.csv') df2 = pd.read_csv('values2.csv') df3 = pd.read_csv('values3.csv') df4 = pd.read_csv('values4.csv') 每一个都有如下的结构： ? 我想创建一个新的数据帧，以便它具有所有数据帧中每个类别的聚合值。因此，新数据框应具有使用以下公式计算的值:- Total['values'][0] = df1['values'][0] /

浏览 75提问于2019-09-23得票数 1

回答已采纳

1回答

根据名称合并行，并根据原始熊猫数据帧中的外观标记它们的组

python、pandas、dataframe、python-2.7

浏览 8提问于2021-10-06得票数 1

回答已采纳

2回答

Pandas将列表的列拆分为多个新列

python-3.x、pandas

我正在尝试将列表值的列分解成不同的列。你们能给我一些指导如何做到这一点吗？感谢在原始数据帧中，没有列名(Column1 Column2)。我命名它只是为了更好地理解这个问题。 Before: Column 1 Column2 A ['2.49', '-2.18', '-3.79'] B ['2.56', '-3.02', '-4.92'] C ['-0.09', '-1.73', '-3.47'

浏览 0提问于2020-06-23得票数 0

1回答

pandas数据帧行使用sklearn进行缩放

python、python-3.x、dataframe、scikit-learn

如何将sklearn缩放器应用于pandas数据帧的所有行。这个问题与相关。如何将sklearn缩放器应用于一行的所有值？注意:我知道对于特性缩放来说，在列中包含特性和按列缩放特性是很正常的，就像refenced问题中那样。然而，我想使用sklearn标度器来预处理可视化数据，在我的例子中，按行扩展是合理的。

浏览 11提问于2019-11-13得票数 1

回答已采纳

1回答

将具有3列通用头的数据文件的列表导出到Excel

python、excel

我有一个数据列表，其中已经有一个列标题，我想知道如何导出到excel，它显示了三列的另一个公共标题，即q1，它是第一个带有索引的数据帧，等等。 colnames=['q1','q2','q3'] table=[pd.DataFrame([['tom', 10], ['nick', 15], ['juli', 14]], columns = ['Name', 'Age']),pd.DataFrame([['Nick', 10], ['Al

浏览 1提问于2021-04-16得票数 1

回答已采纳

1回答

使用列表列表创建数据帧

python、pandas

我有一个列表，其中包含来自商店的一些值(例如:收入、净利润和销售价格)，但我有99个商店需要收集这些值并使用than创建数据帧。我正在使用'for‘的WebScraping部分和一个要收集的函数。我的问题是如何使用pandas将一个包含其他列表的列表移动到数据帧中。

浏览 11提问于2020-09-02得票数 0

回答已采纳

1回答

将单级DataFrame与三级DataFrame合并

python、python-3.x、pandas

单级DataFrame： data1 = {'Sr.No.': Sr_no, 'CompanyNames': Company_Names, 'YourChoice1': Your_Choice, 'YourChoice2': Your_Choice} df1 = pd.DataFrame(data1, columns = pd.Index(['Sr.No.', 'CompanyNames','YourChoice1','YourCh

浏览 1提问于2019-01-07得票数 0

2回答

将列表从独立变量转换为数据帧

python、pandas

如果我有5个来自不同变量的单独列表，如下所示。如何将它们转换为熊猫数据帧。 a = [1.4, 1.3] b = [0.8, 0.8] c = [2.4, 1.6] d = [3.6, 2.9] e = [2.8, 2.5] 预期的数据帧 x,y 1.4, 1.3 0.8, 0.8 2.4, 1.6 3.6, 2.9 2.8, 2.5

浏览 0提问于2020-11-07得票数 0

3回答

如何将数据框导出为现有的格式化csv文件？

python、pandas、csv

我正在尝试将数据帧导出到现有的格式化csv文件中，但数据帧一直以垂直的形式附加，并附加了应该是水平的附加标头。 A B C D E F 1 2 3 4 5 6 #=-> This is the format I have in my exisiting csv file A B C D E F 1 2 3 4 5 6 x x x x x x #-> This is how I want to do it A B C D E F 1 2 3 4 5 6 A 1 B 2 C 3 D 4 #-> This is what's currently happen

浏览 2提问于2019-08-24得票数 2

1回答

将函数数组应用于数据访问

python、function、pandas、dataframe、apply

假设您有一个函数数组。每个函数返回一个具有相同索引和大小的pandas.Series对象。每个函数都接受相同的输入，即主数据df。我正在寻找一个输出，该输出将本系列的每一项都作为结果数据帧的列。目前，我有以下几点： df_result = [f(df) for f in f_arr] df_result = pd.DataFrame(df_result) 这需要很长时间(列表操作似乎有一些开销)，由此产生的数据就是我所需要的转换。我觉得应该有一个干净的地图/应用的方式来做到这一点。

浏览 3提问于2017-05-25得票数 0

回答已采纳

1回答

查看字符串是否包含数据框中的其他字符串

python、regex、pandas

如何使用pandas将一个数据框中的行映射到另一个数据框中的值？我当时在做一个市场分析项目。这个想法是编写一个函数来识别URL是否是“官方”URL。有两个数据帧数据帧1将是URL列表： Url ---- https://twitter.com/abcd/1223343 https://twitter.com/fegh/3232 https://twitter.com/qwer/w2234 https://facebook.com/ssdf/w1234 ... 数据框2将是官方句柄的列表： Handle_1 Handle_2 Handle_3 -------- -------- -----

浏览 16提问于2020-12-07得票数 0

1回答

向从列表构建的熊猫数据框添加行的最快方法是什么？

python、pandas、dataframe、optimization、list-comprehension

我正在尝试创建twitter数据的数据框架。使用twitter API，我有一个作为列表(tweets)的twitter对象列表，并希望使用来自这些twitter对象的各种信息填充一个数据帧，并对文本使用一些其他函数。我当前的方法对每个列使用列表理解，每次迭代所有tweet。 df = pd.DataFrame(data=[tweet.all_text for tweet in tweets], columns=["tweets"]) df.loc[:, 'id'] = np.array([tweet.id for tweet in tweets]) df.

浏览 10提问于2021-02-05得票数 1

3回答

如何选择列表元素列表，并在单个数据帧中创建不同的列？

python、pandas

List1 = [[1,A,!,a],[2,B,@,b],[7,C,&,c],[1,B,@,c],[4,D,#,p]] 输出应如下所示：每个不同的列应包含每个子列表元素的1个值，例如 column1:[1,2,7,1,4] column2:[A,B,C,B,D] column3:[!,@,&,@,#] column4:[a,b,c,c,p] 在相同的数据帧中

浏览 0提问于2019-08-16得票数 0

2回答

将值添加到数据框列中的某个索引之后

python、pandas、list、dataframe

我有一个这样的数据帧： No Data Sentence 32 xxx yyyy 45 hhh uuuu . . . . . . 8726 aaa bbbb 在No列是无序的情况下，现在我有了x，这是句子列表，我想将该列表添加到Sentence列的最后一个索引之后。因此，我的新数据帧将如下所示： No Data Sentence 32 xxx yyyy 45 hhh uuuu . .

浏览 26提问于2019-05-02得票数 1

回答已采纳

1回答

Python:如何旋转包含列表的数据帧？

python、pandas

我有一个熊猫数据框架，如下所示 df A B 0 'X1' [3,2,1,5] 1 'X2' [0,-2,1,2] 2 'X3' [5,1,1,-6] 我想得到一个如下的数据帧： df X1 X2 X3 0 3 0 5 1 2 -2 1 2 1 1 1 3 5 2 6

浏览 0提问于2021-06-08得票数 0

1回答

如何迭代具有多个列的多个数据帧的行

python、dataframe

我创建了一个有3个参数输入的函数:x，y，z，我想循环遍历它们。X是具有一列y的数据帧，z要求具有多列的数据帧我试过这个： result = [f(x,y,z) for x,y,z in zip(df1["1com"], df2["1com"], df3["3com"])] Df 1,2,3具有相同的索引长度。这不起作用，因为方法list comp不允许像这样的多个列。我试过很多东西都没成功。顺便说一句，我在这里找到了列表理解方法：How to iterate over rows in a DataFrame in Pandas

浏览 14提问于2020-10-02得票数 1

2回答

如何将字典列表转换为符合一定条件的数据帧？

python、pandas、dataframe

假设我有一个字典列表： list_dict = [{0: 0.1, 1: 0.2, 2: 0.3, 3: 0.4, 'Product': 'A'}, {0: 0.5, 1: 0.6, 2: 0.7, 3: 0.8, 4: 0.9, 'Product': 'B'}, {0: 1.1, 1: 1.2, 'Product': 'C'}] 我想把它变成数据帧，比如， |State | Probability |Product| |---------|---------------|----

浏览 10提问于2020-06-24得票数 1

回答已采纳

1回答

创建一个函数，该函数接受两个名为key和value的列表作为参数，并返回一个dataframe

python、pandas、dataframe

我想创建一个函数，它接受两个名为键和值的列表作为参数，并返回一个数据帧，example:create_dataframe("One"，" two "，["X"，"Y"，"A"，"B"]) ->应该返回一个数据帧 One Two 0 X A 1 Y B 出于这个目的，到目前为止(我正在学习)我已经使用了下面的代码，但是结果只显示了Zero，有人能指导我哪里错了吗？ import pandas as pd def create_dat

浏览 7提问于2020-08-20得票数 0

回答已采纳

1回答

将数组和变量写入Dataframe

python-3.x、pandas、string、numpy

我有一个格式为[27.214 27.566]的数组-可以有几个数字。另外，我还有一个Datetime变量。 now=datetime.now() datetime=now.strftime('%Y-%m-%d %H:%M:%S') time.sleep(0.5) agilent.write("MEAS:TEMP? (@101:102)") values = np.fromstring(agilent.read(), dtype=float, sep=',') 数组的输出是27.214 27.566 现在，我想将其写入到具

浏览 85提问于2020-11-09得票数 0

3回答

从list列表生成pandas数据帧

python、list、pandas、dictionary、dataframe

我想知道如何从列表中生成pd DataFrame，列表的形式如下：输入： A=[['a','b','c'],['c','d','e'],['f','g','h']] 输出：(在数据帧中) No content 0 'a' 0 'b' 0 'c' 1 'c' 1 'd' 1 'e' 2 'f' 2 'g' 2 '

浏览 18提问于2016-07-25得票数 1

回答已采纳

3回答

多索引合并返回空df，但联接应有效

python、pandas、dataframe、merge

我正在尝试连接两个数据帧，其中分别包括按国家代码列出的奥运奖牌总数和按国家代码和年份列出的国家人口。每个都是具有相同多索引(国家/地区、人口)的一列的数据帧。数据帧可能不一定包括相同的国家和年份，例如，奥运会年份不像普通年份那么多，并且人口估计数据集中缺少一些国家代码。以下是几个摘录，用于说明ITA和部分重叠的年份的数据结构： med： Medals Cty Year ITA 1960 88 1964 50 1968 32 1972 25 1976 31 弹出：

浏览 7提问于2018-02-22得票数 1

2回答

将边列表转换为邻接矩阵

python、pandas

我的dataframe表示一个图的边列表，格式如下： node1 node2 weight 0 a c 1 1 b c 2 2 d c 3 我的目标是生成等价的邻接矩阵： a b c d a 0 0 1 0 b 0 0 2 0 c 0 0 0 3 d 0 0 0 0 目前，在构建边的数据帧时，我计算了节点的数量，并创建了一个NxN数据帧并手动填充值。pandas从第一个数据帧生成第二个数据帧的方式是什么？

浏览 0提问于2018-11-11得票数 2

1回答

如何在pandas数据帧中存储DICOM文件的头数据？

python、python-3.x、pandas、dicom、pydicom

我正在尝试使用Python中的pydicom读取DICOM文件，并希望将头数据存储到pandas数据帧中。如何提取用于此目的的数据元素值？到目前为止，我已经在DICOM文件中创建了一个以列作为标记名的数据帧。我已经访问了数据元素，但我只需要存储数据元素的值，而不是整个序列。为此，我将序列转换为字符串，并尝试将其拆分。但是它也不会工作，因为不同标签的长度是不同的。 refDs = dicom.dcmread('000000.dcm') info_header = refDs.dir() df = pd.DataFrame(columns = info_head

浏览 1提问于2019-06-14得票数 2

1回答

将多值字典转换为pandas数据帧

python、pandas、dataframe、dictionary、append

我想把这个dict转换成一个pandas dataframe，其中每个键变成一列，列表中的值变成行： my_dict： {'Last updated': ['2021-05-18T15:24:19.000Z', '2021-05-18T15:24:19.000Z'], 'Symbol': ['BTC', 'BNB', 'XRP', 'ADA', 'BUSD'], 'Name': ['Bitcoin', 'Bi

浏览 8提问于2021-05-18得票数 1

回答已采纳

2回答

获取数据框列表并按变量分组，并将该变量用作字典的关键字

python、list、dictionary、for-loop

我对python编程比较陌生。我有一个熊猫数据帧列表，所有数据帧的列都是'Year‘。我尝试按该列进行分组，并转换为字典，其中字典键是变量' year‘，值是该年的数据帧列表。这在python中是可能的吗？我试过这个： grouped_dict = list_of_csv_files.groupby(by = 'Year').to_dict() 我相信我将不得不遍历每个数据帧？我没有提供任何数据，因为我希望这是一个有点简单的解决方案。我还尝试了这个： grouped_dict = list_of_csv_files.groupby(by = 'Ye

浏览 24提问于2019-04-15得票数 0

回答已采纳

2回答

迭代地连接数据帧

python、pandas、dataframe

我有一个函数可以生成一个10行的数据帧，我的目标是获得135个这样的数据帧。我不想将它们分开，所以我需要将它们连接到一个数据帧中，这样它就有10行和135个标记列，但我希望有效地做到这一点。我最接近我所需要的是： for i in range(len(docs)): for l in labels_list: df = pd.concat([pd.DataFrame({l:(my_func(i)})]) 但很明显，这只返回了数据帧的最后一列... 编辑另一种方式：我将my_func的结果附加到一个列表中，现在我有了一个包含135个列表和每个列表中的10个字符串的列

浏览 31提问于2020-11-26得票数 0

回答已采纳

2回答

将Python数据帧转换为带索引的字典

python、dataframe、dictionary

我正在尝试将dataframe转换为字典(因为它们在过滤key时速度更快)，我目前正在使用 t3 = time() r={} for i in df.index.unique(): r[i]=[] r[i].append(df.loc[i].values) print(round((time()-t3), 1), "s") 这种类型的转换速度很慢。有没有别的选择呢？我希望数据帧的索引作为键，行作为在单个键上具有多个值的值

浏览 19提问于2020-08-22得票数 0

回答已采纳

3回答

有没有一种方法可以用Python将数据帧列表“解压缩”到环境中？

python、pandas

我已经将几个.xlsx文件作为数据帧加载到来自特定文件夹的列表中，并希望将列表中的这些数据帧“解压缩”到环境中。我来自R，在那里list2env()函数可以完成这项工作，但我似乎找不到在python (新手)中的解决方案。 file_names = os.listdir() df = [] for file_names in file_names: df.append(pd.read_excel(file_names)) 如何将'df‘列表中的数据帧解压到环境中？谢谢!

浏览 11提问于2020-10-08得票数 0

回答已采纳

1回答

使用Pandas模块写入Excel文件

python、excel、pandas

如何使用Pandas模块将项目列表[1,2,3,4,5]写入excel文件中的特定选项卡中，从特定的行和列位置开始？是否涉及pandas.DataFrame.to_excel函数?在将list写入excel文件之前，是否需要将其转换为dataframe？我是否要先将列表转换为序列，然后将序列转换为数据帧，然后将数据帧写入excel文件？

浏览 24提问于2016-08-04得票数 0

3回答

如何将python字典转换为所需的格式

python、python-3.x、pandas、for-loop

我有以下字典，它是在对熊猫数据帧应用to_dict()方法时获得的。 { 'name' : { 0: 'abc', 1: 'xyz' }, 'email': { 0: 'abc@abc.com', 1: 'xyz@xyz.com', }, 'category': { 0: 'category 1', 1: 'category 2', } } 如何将其

浏览 19提问于2018-07-17得票数 2

回答已采纳

2回答

Python初学者:提升ValueError(‘必须具有相等的len键和值')

python、pandas、csv、dataframe、dictionary

我想在现有的数据框中填入另一列。该列将包含字典的值。这些值是令牌列表。到目前为止，它还不起作用，有没有办法将它们添加到数据帧中？ df = pd.read_csv(sys.argv[1], na_values=['no info', '.'], encoding='Cp1252', delimiter=';') s = pd.DataFrame(dict1).T.reset_index() print(s) #result ''' index 0 1 2 0

浏览 40提问于2019-07-16得票数 1

2回答

如何访问数据集中列表值的列表

python-3.x、pandas、list、dataframe

在我的DataFrame.I中，我在一个列中有一个列表值列表。例如，我有A、B、C列和我的输出列。在A列中，我的值为12，在B列中，我的值为30，在C列中，我的值列表为0.01、1.234、2.31。当我尝试查找所有列表的均值时，values.It将列表对象显示为无属性mean.How以将所有列表值的列表转换为数据帧中的均值？

浏览 26提问于2021-06-04得票数 0

回答已采纳

1回答

如何将数据帧列表转换为所需的数组形状？

python、numpy、dataframe

我有一个数据帧列表，如图所示。列表长度为200，其中有200个数据帧，每个数据帧的长度为205，有6列。我想以形状(200,205,6)数组的形式列出这个列表我尝试了下面的方法，但我一直得到下面给出的错误。样本(np.array).reshape(200,205，6) 对于这段代码，我得到了一个错误： ValueError:无法将大小为205的序列复制到维度为1的数组轴我还删除了5列，并在所有数据名中只保留了一列，但仍收到相同的错误。有没有办法把它做成所需的形状..

浏览 0提问于2019-06-25得票数 0

1回答

如何将一个列表分组为一个有四列的数据帧？

python、pandas、list

假设我有一个类似于下面的列表： l = ['A','B','C','D','E','F','G','H','I','L','M','N'] 我想创建一个有4列的数据帧，因为列表中每4个对象就是一行。结果应该是具有以下形式的数据帧： Col1 Col2 Col3 Col4 A B C D E F G H I

浏览 7提问于2021-11-15得票数 2

回答已采纳

2回答

使用列表作为值从字典创建DataFrame

python、python-2.7、pandas、dataframe

我有一个字典，想把它转换成一个数据框架。出于一些不重要的原因，在对空状态进行操作之前，数据帧必须存在，因此我使用以下代码： dfResult = pd.DataFrame() d={} d['p1']=123 d['p2']='foo' #d['p3']= [10,10] df = pd.DataFrame(d, index=[0]) #index is irrelevant 我工作得很好，除了当其中一个值是一个列表时，它失败了，并显示以下消息： ValueError: could not broadcast input arr

浏览 5提问于2017-06-23得票数 1

回答已采纳

5回答

如何从字符串中移除十进制后的零，删除所有的零后点

python、pandas

我有一个对象列的数据帧，比如col1，它的值为: 1.00，1，0.50，1.54 我希望输出如下: 1，1，0.5，1.54基本上，如果它在零后没有任何数字，则删除小数后的零。请注意，我需要数据的答案。pd.set_option和work不适合我。

浏览 0提问于2018-10-19得票数 2

回答已采纳

2回答

如何根据字典键从嵌套的字典中创建多个新的数据框列

python、pandas、dataframe、dictionary

以this问题为基础，从以下数据帧开始： import pandas as pd data = {'key':[111, 112, 113, 114],'other_data':[1, 2, 5, 7]} df = pd.DataFrame(data) df key other_data 0 111 1 1 112 2 2 113 5 3 114 7 我希望根据字典键映射多个新列，并在数据帧中映射一个指定的列。 d = { "111": {

浏览 20提问于2021-07-13得票数 0

回答已采纳

1回答

循环遍历pandas列中的字符串列表

python、json、pandas

我有一个JSON文件，我将其转换为pandas数据帧， # Bring in data audit = pd.read_json('audit_2018-03-02.json') 现在，我有一些列，这些列的值是一个字符串列表。 foo [By Audience, By Vendor] [By Month, By Keyword, By Ad Group, By Service] [By Month, By To Date, By Keyword, By Ad Group] 我正在尝试遍历foo列，并从该列创建一个数据框。我试过了， list

浏览 7提问于2018-03-05得票数 0

2回答

保存文本数据的大型Pandas df到磁盘崩溃Colab，因为耗尽了所有的RAM。有解决办法吗？

python、pandas

我有一个非常大的Pandas数据帧，我想把它保存到磁盘上，以便以后使用。数据帧仅包含字符串数据。然而，无论我使用哪种格式，保存过程都会导致我的Google Colab环境崩溃，因为除了CSV之外，所有可用的RAM都会用完，CSV甚至在5小时后都不会完成。但这也破坏了环境。有没有办法把一个大的文本熊猫数据帧保存到磁盘上？我尝试过to_json、to_feather、to_parquet、to_pickle，它们都会使环境崩溃。我还通过使用以下命令尝试了to_sql from sqlalchemy import create_engine engine = sqlalchemy.crea

浏览 2提问于2019-05-29得票数 2

1回答

基于两列值合并两个数据帧

pandas、dataframe、merge

我正在做一个机器学习项目，现在我在做数据处理部分。不管怎么说，我有两个数据帧- Final_Lat Final_Lot Label 0 37.23140 -121.75853 1.0 1 37.34883 -121.88834 1.0 2 37.31835 -121.85878 1.0 3 37.26027 -121.87655 1.0 4 37.30793 -121.79955 1.0 5 37.24895 -121.87519 1.0 TestLat TestLot 0 37.200

浏览 1提问于2018-11-29得票数 1

1回答

从python数据帧绘制图形

python、pandas

我想将转换为这个数据帧，并使用沿x轴的日期绘制matplotlib图。

浏览 3提问于2016-10-21得票数 0

2回答

如何在PySpark中将Pandas的DatetimeIndex转换为DataFrame？

apache-spark、pyspark、pyspark-sql

我有以下代码： # Get the min and max dates minDate, maxDate = df2.select(f.min("MonthlyTransactionDate"), f.max("MonthlyTransactionDate")).first() d = pd.date_range(start=minDate, end=maxDate, freq='MS') tmp = pd.Series(d) df3 = spark.createDataFrame(tmp) 我已经检查了tmp，我有一个熊猫数据帧的日

浏览 80提问于2019-01-02得票数 2

回答已采纳