Pandas:将字典转换为pandas数据帧_将pandas数据帧转换为字典_将Pandas字典转换为数据帧 - 腾讯云开发者社区

、、、、

我一直在尝试将特定键的值存储到pandas数据帧中，该数据帧来自具有字典列表的另一个数据帧。有人能教我怎么做吗？？ source data frame result data frame

浏览 11提问于2021-02-08得票数 0

1回答

将第一行数据转换为字典并删除NaN值

我需要将第一行转换为字典，然后删除所有"nan“值。这行得通..。 pd.Series(df.head(1).T.to_dict()[0]).dropna() 或。这一个..。 df.head(1).dropna(axis=1).T.to_dict()[0] 但是，有没有其他方法可以实现这一点呢？数据帧的类型是稀疏的，如果这很重要的话。 type(df) pandas.core.sparse.frame.SparseDataFrame 我之所以这样问，是因为我不认为它是pythonic式的，我想肯定有一种方法可以做到这一点。

浏览 7提问于2019-08-24得票数 0

回答已采纳

1回答

在Python语言中使用PyMongo在MongoDB中插入文档

、、、、

我使用Python语言中的PyMongo库在MongoDB中插入文档。pandas数据帧有37个字段和60k条记录(数据集链接：)。数据帧中的所有字段都已转换为str类型。我收到以下错误： OverflowError: MongoDB can only handle up to 8-byte ints 当我使用for循环插入2500个文档的块时，错误仍然存在。代码片段： import pandas as pd import pymongo client = pymongo.MongoClient() db = client['patenting_in_psi'] colle

浏览 0提问于2018-02-16得票数 0

1回答

根据某些条件，我必须更新数据帧

、、

我刚接触pandas，我正在尝试更新基于'Id'列的'Text‘列。我的数据是这样的[(1,'One'), (0, 'Zero'), (4,'Four'), (3, 'Three')]我在数据中也有一些丢失的id，对于那些丢失的id，我必须将其留空原始数据帧 Id A Text 0 0 NaN 1 1 NaN 2 2 NaN 3 3 NaN 4 4 NaN 最终数据帧 Id A Text 0 0 Zer

浏览 9提问于2020-05-11得票数 1

回答已采纳

1回答

从具有True的列的列表的字典创建pandas数据帧

、、、

我想要一本'item': [list_of_True_column_labels]字典，看起来像这样： pre_df = {'item1':['a','b','c'], 'item2':['c','d'], 'item3':['a', 'c', 'd', 'e'], 'item4':['e']} 并将其转换为bool的熊猫数据帧，如下所示： index

浏览 2提问于2016-12-07得票数 3

1回答

pandas数据帧行使用sklearn进行缩放

、、、

如何将sklearn缩放器应用于pandas数据帧的所有行。这个问题与相关。如何将sklearn缩放器应用于一行的所有值？注意:我知道对于特性缩放来说，在列中包含特性和按列缩放特性是很正常的，就像refenced问题中那样。然而，我想使用sklearn标度器来预处理可视化数据，在我的例子中，按行扩展是合理的。

浏览 11提问于2019-11-13得票数 1

回答已采纳

1回答

Json序列化具有Pandas Dataframe属性的类: TypeError：'DataFrame‘类型的对象不是JSON可序列化的

、、、

嗨，我有一个带有pandas数据帧属性的类。我如何编码成json，这样pandas的dataframe属性也能被正确序列化？ class MachineObject(dict): def __init__(self, *args, **kwargs): self._MachineName = '' self._propsDataFrame = None # Pandas dataframe 我是这样序列化的： print(json.dumps(machine_objects[0].__dict__)) 但这给了我错误： Ty

浏览 2提问于2021-04-10得票数 0

1回答

通过基于另一个数据框上的条件选择pandas数据框列来创建numpy数组

、、、

我是Pandas的新手，我尝试了几个小时来解决我的问题，但我没有设法解决它。我已经看过几个stackoverflow对话，但没有一个与我的问题类似。我有两个数据帧，具有形状(256，800)的训练和标签(1，800)，每个标签对应于一个数字0-9，我想创建10个数字数组，其中每个只包含i个数字的训练数据。如果第一个训练示例(1*256)具有标签0，则将训练的列(1*256)分配给第一个numpy数组，依此类推。即，基于对另一个数据帧的条件，将一个数据帧分配给一个numpy数组。例如，如果我有89个“零”，“零”数字数组将是256*89。提前感谢

浏览 19提问于2019-03-23得票数 0

3回答

将JSON文件转换为Pandas数据帧

、

我有一个json文件，我将其转换为dict，如下所示： {'DATA': [{'COMPANY_SCHEMA': 'ABC', 'CONFIG_TYPE': 'rtype', 'IM_ID': '44f8d1b4_437e', 'MODIFIED_DATE': 'Unknown', 'ID': 'Test', 'CONFIG_KEY': 'posting_f', 'SYSTEM_N

浏览 9提问于2018-05-08得票数 0

2回答

如何将Python Dataframe转换为列表列表？

、、

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

1回答

Python不断增长的字典或不断增长的数据帧-在循环中追加

、、

我正在尝试编写代码，在循环中从在线来源收集数据，并在每次迭代中使用pandas操作这些数据。最初，我认为我应该在循环外初始化一个dict，获取数据，将dict转换为循环内的dataframe，并对其执行操作。但是，在循环中创建字典而不是仅仅创建一个数据帧并添加到数据帧中，这感觉非常奇怪。但据我所知，pandas并不是真正为逐个细胞更新而“设计”的(而是向量化的)。对此最有效的方法是什么？ import pandas as pd d = {'a':[], 'b':[], 'c':[], 'x':[], 'z'

浏览 15提问于2019-08-09得票数 2

1回答

MongoDB聚合管道vs Pandas聚合

、

我们目前使用了大量的MongoDB聚合管道来做一些数据处理。然而，我们经常遇到一些性能问题。我正在考虑将数据从MongoDB读取到Pandas数据帧中，并使用Pandas数据帧聚合来处理数据。有谁有比较这两种方法的经验吗？另外，MongoDB聚合管道是否利用了内部的某种并行性？

浏览 0提问于2020-05-15得票数 2

1回答

2个Pandas数据帧的条件语句

、、、、

我在解决以下问题时遇到了麻烦：我在熊猫中有两个数据帧，第一个数据帧(df1)是关于我一整年来购买的水果，下一个数据帧(df2)是关于水果的定价。现在的问题在于df1中的一些水果的价格是不正确的。示例如下： df1 = pd.DataFrame({'Fruits Bought Over a Year' : ['Apple', 'Apple', 'Apple', 'Apple', 'Orange', 'Watermelon',

浏览 0提问于2020-10-14得票数 0

1回答

将代码步骤合并到用户定义的函数中

、、

我正在编写一个函数，该函数从基于ID#的API中检索数据，然后将json响应读取到一个pandas数据帧中，对该数据帧进行格式化，最后将每个数据帧编译在一起。目标是将一系列pandas的ID#传递到函数中，以检索数千个ID列表的相关数据。当我手动执行每一步时，这些步骤都可以工作。我得到了一个很好的单行pandas数据帧，其中包含我想要的所有列和值。当我在一个包含for循环的函数中组合所有步骤时，它停止工作。以下是步骤： req = Request('https://gs-api.greatschools.org/schools/3601714/metrics') ##re

浏览 20提问于2021-08-30得票数 0

1回答

使用Pandas读取用HDF5创建的h5py文件

、、、

我有一堆hdf5文件，我想把其中的一些数据转换成拼花文件。不过，我很难把它们读成熊猫/皮亚罗。我认为这与最初创建文件的方式有关。如果我使用h5py打开文件，数据看起来与我所期望的完全一样。 import h5py file_path = "/data/some_file.hdf5" hdf = h5py.File(file_path, "r") print(list(hdf.keys())) 给我 >>> ['foo', 'bar', 'baz'] 在这种情况下，我感兴趣的组“酒吧”，其中有3

浏览 75提问于2022-03-07得票数 1

2回答

从单个pyspark dataframe返回多列

、、、、

我正在尝试解析单个列的columns.My数据帧，并获取具有多个pyspark数据帧的数据帧，如下所示： a b dic 0 1 2 {'d': 1, 'e': 2} 1 3 4 {'d': 7, 'e': 0} 2 5 6 {'d': 5, 'e': 4} 我想要解析dic列并获得数据帧，如下所示。如果可能的话，我期待着使用pandas UDF。我的预期输出如下： a b c d 0 1 2 1 2 1 3 4 7

浏览 40提问于2020-03-01得票数 0

回答已采纳

2回答

如何根据字典键从嵌套的字典中创建多个新的数据框列

、、、

以this问题为基础，从以下数据帧开始： import pandas as pd data = {'key':[111, 112, 113, 114],'other_data':[1, 2, 5, 7]} df = pd.DataFrame(data) df key other_data 0 111 1 1 112 2 2 113 5 3 114 7 我希望根据字典键映射多个新列，并在数据帧中映射一个指定的列。 d = { "111": {

浏览 20提问于2021-07-13得票数 0

回答已采纳

1回答

使用pandas将JSON转换为dataframe

、、

我正在尝试获取数据帧，但在指定文件后，根据我在read.json中指定的参数，不断遇到各种错误消息。我已经浏览了pandas.read_json文档中的许多参数，但是还没有找到解决方案。 import pandas json_file = "https://gis.fema.gov/arcgis/rest/services/NSS/OpenShelters/MapServer/0/query?where=1%3D1&outFields=*&returnGeometry=false&outSR=4326&f=json" pandas.read_j

浏览 6提问于2019-07-10得票数 1

1回答

作为嵌套json的pandas数据帧

、、

我有一个脚本，它将嵌套的JSON作为pandas数据帧读取，并向其中添加一个新列，然后将其保存为JSON。 import numpy as np from pandas.io.json import json_normalize sample_json = { "name": { "emails": [{"address": "clark.kent@example.com"}], "countries": [{"country": "US"

浏览 18提问于2019-06-06得票数 1

2回答

在pandas数据帧中插入sklearn CountVectorizer的结果

、、、

我有一堆14784个文本文档，我正在尝试对它们进行矢量化，这样我就可以运行一些分析。我使用sklearn中的CountVectorizer将文档转换为特征向量。我这样做是通过调用： vectorizer = CountVectorizer features = vectorizer.fit_transform(examples) 其中examples是所有文本文档的数组现在，我正在尝试使用其他功能。为此，我将这些特性存储在一个pandas数据帧中。目前，我的pandas数据帧(不插入文本特征)具有形状(14784, 5)。我的特征向量的形状是(14784, 21343)。将矢量化的特征插入

浏览 0提问于2016-11-02得票数 14

1回答

需要通过只对一列进行分组来将pandas数据帧转换为多索引的帮助。

、、

我有一个熊猫数据帧df，看起来像这样： >>>df group A B C 1 1 2 3 1 2 3 6 1 4 9 9 2 8 1 2 2 5 6 4 3 6 5 7 我希望它是多索引的，这样看起来就像 group A B C 1 1 2 3 2 3 6 4 9 9 2 8 1 2 5 6 4 3 6 5 7 我想访问每个组编号，为我提供该组索引值的数据框架。我的意思是，如果我输入df[0]，那么我会得到 >>>df[0] A B C

浏览 2提问于2018-04-20得票数 1

2回答

如何忽略列长度检查中的NaN

、、

我正在尝试计算数据帧中每一列的最大和最小长度，该数据帧中有一些缺失值。Pandas将这些缺失值视为"NaN“，并将长度计为3。如何在计算最大和最小长度时完全忽略缺失值？下面是我的代码： import pandas as pd columnname=[] maxColumnLenghts = [] minColumnLenghts=[] for colname in df.columns: columnname.append(colname) for col in range(len(df.columns))

浏览 51提问于2020-11-06得票数 1

回答已采纳

1回答

使用Pandas将数字(索引值)转换为字母值

、

我想将数据帧的id转换为基于索引值的字母列表。然后，我需要将这个"alpha“值应用于另一个包含将要列出的数据的数据帧。因此，与显示客户id号的数据不同： 2011-05-13 #483 .... 2011-05-13 #483 .... 2011-05-13 #553 .... 2011-05-13 #555 .... 使用该列表的索引： #483 - Client 1 #551 - Client 2 #553 - Client 3 #554 - Client 4 #555 - Client 5 所以我希望输出的数据是这样的： 2011-05-13 #A ....

浏览 22提问于2018-09-08得票数 0

回答已采纳

2回答

Python:更改pd.DataFrame中的值

、

我有一个pandas数据帧，其中一列包含分类数据，我希望将其更改为数字 le=LabelEncoder() for col in p3data.columns.values: if p3data[col].dtypes=='object': p3data[col]=le.fit_transform(p3data[col]) 当我在pandas dataframe中的一列上使用此代码时，它会更改值非常低=4 低=1 Medium =2 高=0 非常高=3 然而，这是不符合顺序的，我如何手动更改它们以使其符合顺序(即非常低=0 低=1 Medium =

浏览 65提问于2021-01-20得票数 0

1回答

从编程的角度来看，什么是数据帧？

、、

几个数据科学包，例如Python的Pandas，都有一个“数据帧”，所有其他功能都基于这个“数据帧”。从编程的角度来看，到底什么是数据帧？

浏览 1提问于2021-10-20得票数 0

1回答

Python pandas输出浮点数而不是整数

、、

我想要将一个矩阵(非常稀疏，有数百万个零和几个其他数字)作为熊猫数据帧保存到.csv文件中，但是数据帧将0保存为0.0 (浮点数而不是整数)，因此文件变得非常大。所以我想将0.0保存为0，以减小输出.csv文件的大小。我正在尝试类似这样的东西： import pandas table = [[0.88, 4], [0, 0.5]] pd = pandas.DataFrame(table, columns = ['C1', 'C2']) pd.to_csv('output.csv', index = False) pd 并获得输出： C1

浏览 37提问于2020-07-24得票数 0

1回答

如何用列表python包在终端中显示漂亮的表格？

、、、、

我有一个简单的CLI应用程序写在python与argparse模块。基本上，我是通过外部api获取一些加密货币数据，我将其转换为pandas数据帧并使用表格模块打印出来。但我在终端上打印表格时遇到了问题。当我这样做的时候，所有的东西都出错了，表格没有保持正确的结构，最后所有的东西都显示在下面的屏幕上。下面是用于打印pandas数据框的代码片段 # file: example.py import requests from tabulate import tabulate def get_recommendations(): url = "https://min-

浏览 22提问于2021-05-15得票数 1

1回答

使用pandas数据帧修改csv中的数据

、、

我有一个这样的结构；用来创建一个pandas数据帧： my_dict = { 'name' : ["joe", "jack", "jill", "joan", "jesse","jacob", "jonas"], 'age' : [20,27, 35, 55, 18, 21, 35], 'designation': ["VP", "CEO

浏览 6提问于2019-07-15得票数 0

回答已采纳

2回答

如何使用pandas从嵌套字典创建数据帧？

、、、

我有以下嵌套字典： dict1 = {'a': 1,'b': 2,'remaining': {'c': 3,'d': 4}} 我想使用pandas创建一个数据帧，以实现以下目标 df = pd.DataFrame(columns=list('abcd')) df.loc[0] = [1,2,3,4]

浏览 16提问于2021-10-08得票数 0

1回答

从多个数据字典中提取数据

、、

我有一本字典，里面包含大量的数据帧。我想从它中提取所有数据帧，并将这些值存储到一个数据帧中。字典如下：存储在字典中的许多数据文件之一如下所示：我尝试过使用'pd.DataFrame.from_dict'方法，如下所示： wwwwww = pd.DataFrame.from_dict(res, orient='index') 但提交给我的输出被混淆或被废弃，如下所示：因此，我做了进一步的搜索，找到了使用熊猫将字典转换成数据的最简单的方法，并使用了如下所示： data2 = pd.DataFrame(res, index =[0]

浏览 4提问于2020-12-11得票数 0

回答已采纳

1回答

创建多个pandas数据帧作为列表上函数迭代的输出

、、、

我正在尝试使用pytaxize包的函数itis.hierarchy_full，以便从特定Id检索有关生物物种的信息。该函数只接受一个值/Id，并将所有分类信息保存在可供稍后编辑的pandas数据帧中。 import pandas as pd from pytaxize import itis test1 = itis.hierarchy_full(180530, as_dataframe = True) 我有大约800个物种I，我想自动化这个过程来获得800个不同的数据帧。我以某种方式创建了一个带有小列表的测试(请注意，我是一个生物学家，所以代码非常基础，可能效率很低： species =

浏览 0提问于2021-03-03得票数 0

1回答

indexerror:使用iloc的索引越界

、

每当我在mysql中使用pandas sql进行查询时，如果结果只有一行，我就无法从中选择值。我的命令是： result = psql.read_frame("select id,name,age from tb1 where id=1", con=conn) 然后，它返回一个数据帧。然而，我希望能够做到： age = result['age'] 但这是不可能的，因为它是一个数据帧。(它创建了行的索引，所以这里是0)，所以当我这样做时，我想让它成为一个序列或字典： result = result.iloc[0] 我得到了 {'id': 1,

浏览 1提问于2015-05-21得票数 0

2回答

Python初学者:提升ValueError(‘必须具有相等的len键和值')

、、、、

我想在现有的数据框中填入另一列。该列将包含字典的值。这些值是令牌列表。到目前为止，它还不起作用，有没有办法将它们添加到数据帧中？ df = pd.read_csv(sys.argv[1], na_values=['no info', '.'], encoding='Cp1252', delimiter=';') s = pd.DataFrame(dict1).T.reset_index() print(s) #result ''' index 0 1 2 0

浏览 40提问于2019-07-16得票数 1

2回答

使用循环从Pandas列构建Python字典

、、

我有一个这样的熊猫数据框架 **Breed Animal** Orange Tab Cat Tuxedo Cat Tabby Cat Husky Dog Golden Dog Labrador Dog Poodle Dog Koi Fish Fantail Fish GoldFish Fish 并希望创建一个这样的字典 mydict = { "Cat": ['Orange Tab', 'Tuxedo', 'Tabby'],

浏览 2提问于2020-04-21得票数 3

2回答

保存文本数据的大型Pandas df到磁盘崩溃Colab，因为耗尽了所有的RAM。有解决办法吗？

、

我有一个非常大的Pandas数据帧，我想把它保存到磁盘上，以便以后使用。数据帧仅包含字符串数据。然而，无论我使用哪种格式，保存过程都会导致我的Google Colab环境崩溃，因为除了CSV之外，所有可用的RAM都会用完，CSV甚至在5小时后都不会完成。但这也破坏了环境。有没有办法把一个大的文本熊猫数据帧保存到磁盘上？我尝试过to_json、to_feather、to_parquet、to_pickle，它们都会使环境崩溃。我还通过使用以下命令尝试了to_sql from sqlalchemy import create_engine engine = sqlalchemy.crea

浏览 2提问于2019-05-29得票数 2

2回答

如何将Dask DataFrame转换为字典列表？

、、、、

我需要将dask数据帧转换为字典列表，作为API端点的响应。我知道我可以将dask数据帧转换为pandas，然后从那里我可以转换为字典，但最好将每个分区映射到一个字典，然后连接。我尝试过的： df = dd.read_csv(path, usecols=cols) dd.compute(df.to_dict(orient='records')) 我得到一个错误： AttributeError: 'DataFrame' object has no attribute 'to_dict'

浏览 30提问于2020-04-08得票数 2

回答已采纳

3回答

Python pandas数据帧拆分

、、

我有这样一种dataFrame，我想将其拆分成独立的数据帧： A B C Mark 3 5 6 T 4 5 2 T 3 4 5 B 5 6 7 B 3 4 5 T 2 5 2 T 例如，上面的表格应该被分成三个pandas数据帧。第一个数据帧将两行标记为"T“作为一个数据帧，第二个数据帧将下两行标记为"B”，第三个数据帧将最后两行标记为"T“。 df1 A B C Mark 3 5 6 T 4 5 2 T df2 A B C Mark 3 4 5 B 5 6 7 B df3 A B C Mark 3 4 5 T 2 5 2 T

浏览 21提问于2019-02-14得票数 2

回答已采纳

1回答

scrapy -如何使用pandas dataframe中的数据填充项目？

、、

假设CrawlSpider如下： import scrapy from scrapy.loader import ItemLoader from scrapy.spiders import CrawlSpider, Rule from scrapy.linkextractors import LinkExtractor from tutorial.items import TestItem from scrapy.http import HtmlResponse class TestCrawlSpider(CrawlSpider): name = "test_crawl&#

浏览 0提问于2016-06-17得票数 3

1回答

无法使用python以DataFrame格式打印字典

、、

我有包含字典文本文件，当尝试在类中使用pandas导入和打印数据帧时，它显示错误为"ValueError: dataframe构造函数未正确调用！“。但当尝试导入并打印在单元中的jupyter笔记本时。它能够打印数据帧。不知道哪里会出错。数据帧格式如下。 {'id_1' : {'name': 'person1','height': u'150', 'weight': 56, 'age' : 20, 'DOB' : ''02 Aug 2005&

浏览 0提问于2019-03-11得票数 0

2回答

将列转换为pandas.datetime或时间序列

、、

我有一个数据帧，看起来像这样，但有多条记录： ID Date 1 {'day': 20, 'year': 2018, 'month':9} 我正在尝试将Date列中的所有内容都更改为pandas timeseries格式。我试图通过执行以下操作来遍历数据并更改每个条目，但我得到了一个错误，指出格式不匹配。 for index, rows in iterrows: x = row['Date'] pd.to_datetime(pd.Series(x), format = 'day

浏览 0提问于2018-09-21得票数 1

1回答

将数据帧转换为所需的字典格式

、、、、

我正在尝试将以下数据框转换为字典数据帧： import pandas as pd df = pd.DataFrame({'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6], 'c':[4,3,5,5,5,3], 'd':[3,4,5,5,7,8]}) print(df) 示例数据帧： a b c d 0 A 1 4 3 1 A 2 3 4 2 B 5 5

浏览 3提问于2020-09-15得票数 2

回答已采纳

1回答

从pandas ExcelWriter对象读取工作表到数据帧

、、

我有一个包含多个工作表的pandas ExcelWriter对象，这些工作表是从excel电子表格加载的。现在我想读出一张数据表作为数据帧。我知道我可以从原始的excel电子表格中读取它，但我想从ExcelWriter对象中检索数据。正在使用openpyxl加载工作表 testwriter = pd.ExcelWriter(filename, engine = 'openpyxl') testwriter.book = openpyxl.load_workbook(filename) testwriter.sheets = dict((ws.title, ws) for ws

浏览 1提问于2016-04-08得票数 0

3回答

将多个csv文件读取到单独的pandas数据帧中

、、、

我已经看到了一些关于将多个csv文件读取到单独的Pandas数据帧中的答案，但仍然遇到了麻烦。我已经将csv文件和文件名读入字典： path = os.getcwd() file_names = ['file1', 'thisisanotherfile', 'file3'] df_dict = {x: pd.read_csv('{}/{}.csv'.format(path, x)) for x in file_names} 这似乎是可行的：print(df_dict['file1']) 然而，我正在寻找的是一个名

浏览 28提问于2019-07-15得票数 1

回答已采纳

1回答

熊猫df到JSON有重复的键

、、、

我正在尝试将具有唯一密钥的df转换为JSON文件。pandas dataframe看起来如下所示。 import pandas as pd d = {'col1': [1,2,2,2,3,3], 'col2': ['a','b','c','','e','f'], 'col3': ['one','two','three','four','five','six'

浏览 4提问于2020-11-13得票数 0

回答已采纳

1回答

如何将字典列表转换为单个pandas数据帧？

、

我之前的代码是pandas数据帧列表列表，如下所示 rowResults = [ [df, df, df], [df, df, df], ... [df, df, df] ] results=results.append(rowResults) 因为所有的数据帧都有完全相同的列，所以当我追加上面的列表时，它将整个数据结构转换为单个数据帧，其中的列与单独的数据帧相同。现在，由于性能问题，我已经将小数据帧转换为字典。如果我创建了大量的数据帧，我发现在存储由pandas数据帧使用的元数据信息时存在某种类型的内存泄漏。当我使用字典时，这不会发生。我的新代码如下所示 rowResults = [ [

浏览 0提问于2013-01-23得票数 4

回答已采纳

2回答

检查列表中的单词并删除pandas数据帧列中的这些单词

、、、、

我有一个列表，如下所示： remove_words = ['abc', 'deff', 'pls'] 下面是我拥有的列名称为'string‘的数据框 data['string'] 0 abc stack overflow 1 abc123 2 deff comedy 3 definitely 4 pls lkjh 5 pls1234 我想检查pandas dataframe列中remove_words列表中的单词，并在pandas数据帧中删除这些单词。我想要检查单独出现的单词

浏览 0提问于2017-08-02得票数 15

回答已采纳

2回答

为什么熊猫的NaN数据不能作为字典密钥使用？

、、、

我试图在下面的数据帧中使用values列的元素作为字典中的键。 In [1]: import numpy as np ...: import pandas as pd ...: rng = pd.date_range('2021-06-01', periods=4) ...: values = [1, -1, 0, np.nan] ...: df = pd.DataFrame(values, index=rng, columns=['values']) In [2]: df Out[2]: values 2021

浏览 1提问于2021-06-07得票数 2

回答已采纳

1回答

如何将MultiIndex熊猫数据帧转换为Dask数据帧

、、、、

我试图将两个变量(一个ID和一个DateTime变量)为MultiIndexed的熊猫数据帧转换为dask数据帧，但是我得到了以下错误； "NotImplementedError: Dask does not support MultiIndex Dataframes" 我正在使用下面的代码 import pandas as pd import dask.dataframe as dd dask_df = dd.from_pandas(pandas_df) 实际上，我有700多个熊猫数据帧(每个超过100MB)，我计划将每个熊猫数据帧转换为dask，然后将它们全部附加到一

浏览 18提问于2019-07-02得票数 2

回答已采纳

1回答

如何使用Python比较太大而无法放入内存的数据帧？

、、、

我有可能很大的数据帧，大约有10列和1e6行，具有不同的维度。假设行在两个数据帧中都是唯一的。由于这些数据帧不能加载到内存中，我如何找到一个数据帧中存在于另一个数据帧中的所有行？我目前只处理较小的数据帧，但我很快就会弄清楚这一点。我非常喜欢使用pandas，但我愿意使用不同的包(xarray?)如果有显著的好处。如果您推荐一个不同的包，请提供一些代码来进行比较。下面是我如何与内存中适合的pandas数据帧进行比较： import pandas as pd def row_intersection(df1, df2): noNA = df2.fillna(0) retur

浏览 23提问于2021-09-02得票数 0

回答已采纳

1回答