如何将特定的字典值放入dataframe列(pandas)_如何在pandas dataframe中将字典的键作为列值放入？_如何将字典列表放入Dataframe的列中？ - 腾讯云开发者社区

、、

我在pandas dataframe列中有字符串数据。我需要将其转换为可解析的json字符串或dict类型，以便读取/提取其中的值。模拟/示例DataFrame： df = pd.DataFrame({'col1': [6010, 6015, 6020, 6025], 'json_col': ["{'Id': '060', 'Date': '20210908',

浏览 157提问于2021-09-13得票数 0

回答已采纳

1回答

根据DataFrame列名选择变量

、

我刚刚开始使用Python，所以我相信这一定很简单，但我自己还是找不到答案。我正在尝试根据列名对DataFrame中的列应用不同的操作。下面是一个非常简单的例子： import pandas as pd A = 2 B = 4 df = pd.DataFrame([[1, 2],[3, 4]], columns=['A', 'B']) columns = list(df) 现在，我想要做的是使用for循环来迭代每一列，并使用列名来确定要引用哪个变量。如下所示： for item in columns: df[item] = df[item] *

浏览 18提问于2020-06-30得票数 1

回答已采纳

1回答

将字典列表转换为pandas列

、、

我有一个pandas dataframe，它的一个列包含如下字符串： "Hex:6; HexNAc:3; NeuNAc:1}" "Fuc:1; Hex:7; HexNAc:2}" 我编写了以下函数，将此文本转换为具有键值对的字典，如下所示： def create_monosacch_columns(glycan_ident): glycans = glycan_ident.split("}")[0].split("; ") monosaccharides = [] for entry in glycans: key, va

浏览 1提问于2015-08-26得票数 1

1回答

在熊猫的每一行上运行一个函数，并返回字典

、、

我有许多函数，每个函数都返回字典，我想在Pandas DataFrame的每一行上运行这些函数。例如 def calc_a(input): # do calculations return {"x": valuex, "y": valuey, "z": valuez} 显然，我忽略了所有的计算代码，因为它是不相关的。我想我可能可以使用pandas.DataFrame.apply，但我不知道如何将函数返回的字典x、y和z的每个键都指向不同的列。

浏览 4提问于2016-01-27得票数 0

回答已采纳

2回答

如何在数据框某些行的所有列上使用pandas apply函数

、、

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

1回答

将列的数据提取到变量中

、、

我有一个非常大的数据，其中一个列是字典本身。(比方说第12栏)。那本字典是超链接的一部分，这是我想要的。在木星中，我想显示一个具有0和2列的表，以及已完成的超链接。我想我需要：从dataframe中提取字典从中获取一个特定的键值。从提取的值创建完整的超链接复制dataframe并用上面创建的超级链接替换该列让我们来处理第一步，我将为接下来的步骤提出其他问题。如何将数据文件中的值提取到我可以使用的变量中？ import pytd import pandas client = pytd.Client(apikey=widget_api_key.value,

浏览 2提问于2019-08-07得票数 2

1回答

当熊猫列重命名创建列名重复时，该怎么办？

、

如果新列名已经存在，那么当我重命名列时，为什么pandas.DataFrame对象不抱怨呢？这使得将来引用新列时返回pandas.DataFrame而不是pandas.Series，这可能会导致进一步的错误。第二，是否有办法处理这种情况？示例： import pandas df = pd.DataFrame( {'A' : ['foo','bar'] ,'B' : ['bar','foo'] } ) df.B.map( {'bar':'foo','f

浏览 2提问于2015-05-29得票数 0

回答已采纳

2回答

TypeError同时使用Python映射DataFrame列

、、、、

我尝试使用这样的映射将Pandas数据帧的一列转换为int值(包含给定的dataframe: my_dataframe和colum: target_column)： targets = my_dataframe[target_column].unique() map_to_int = {name: n for n, name in enumerate(targets)} 在Pandas中使用Python3.6我想知道为什么 a) my_dataframe['Integer-Column'] = map_to_int[my_dataframe[target_column]] 引

浏览 0提问于2018-07-04得票数 1

回答已采纳

3回答

将int赋值给pandas中列表列中的字符串

、

我有一个Pandas dataframe，其中包含一个带有字符串列表的列。 <code>A0</code> 如何开始为列表中的每个值分配一个唯一的id，使其在整个列中都是相同的？ <code>A1</code>

浏览 35提问于2020-11-16得票数 3

回答已采纳

1回答

使用Pandas解析大型CSV中的JSON列w/嵌套值

、、、、

我有一个巨大的CSV文件(3.5GB，每天都在变大)，它有正常的值，还有一列名为“元数据”的嵌套JSON值。我的脚本如下所示，其目的只是将JSON列转换为其每个键值对的普通列。我正在使用Python3 (Anaconda；Windows)。 import pandas as pd import numpy as np import csv import datetime as dt from pandas.io.json import json_normalize for df in pd.read_csv("source.csv", engine='c',

浏览 0提问于2018-06-22得票数 3

回答已采纳

2回答

当使用Python进行排序时，如何获得数据文件中值的(相对)位置？

、

当每个列的值从低到高排序时，我如何创建一个Pandas DataFrame来显示每个值的相对位置？因此，在这种情况下，如何将'df‘转换为'dfOut'？ import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'A': [12, 18, 9, 21, 24, 15], 'B': [18, 22, 19, 14, 14, 11], 'C': [5, 7

浏览 5提问于2022-02-11得票数 2

回答已采纳

1回答

基于dict创建组合列的熊猫功能

、、、

我试图在pandas.DataFrame中创建一个加权列我有一个python dictionary，键是pandas.DataFrame列名，值是相应的权重。我想创建一个基于dictionary和引用pandas.DataFrame列值加权的新列。考虑到我的dictionary配置会改变并包含“错误配置”，有什么有效的方法来做到这一点呢？为例： import pandas as pd import numpy as np weights = {'IX1' : 0.3, 'IX2' : 0.2, 'IX3' : 0.4, '

浏览 1提问于2019-02-14得票数 3

回答已采纳

1回答

从字典列表中提取熊猫数组

、、、

我有这样的字典清单 [{"Key":[val1,val2,...]}, {"Key2":[val1,val2,...]}, ...] 我想将其转换为csv格式，其中键是列标题，而他的值来自列值。为了做到这一点，我本来打算使用一个pandas数据frame (它很容易导出到csv )，但我无法想出如何将我的值放入数据框架中。我试过了myPanda = pd.DataFrame.from_records(data)，但是没有用。

浏览 1提问于2017-11-26得票数 1

回答已采纳

3回答

如何将meta_data添加到中？

、

我大量使用Pandas数据格式。并且需要将一些数据附加到dataframe，例如记录dataframe的出生时间、数据的附加描述等等。我只是找不到dataframe类的保留字段来保存数据。因此，我更改core\frame.py文件以添加一行_reserved_slot = {}来解决我的问题。我在这里发布的问题只是想知道这样做可以吗？或者是否有更好的方法将元数据附加到dataframe/列/行等？ #---------------------------------------------------------------------- # DataFrame class class

浏览 3提问于2013-04-03得票数 4

回答已采纳

2回答

操作包含列表的pandas数据框列

、

我在pandas中使用了下面的代码和of ()函数来创建一个列，该列包含一个唯一值的列表： import pandas as pd from collections import OrderedDict dct = OrderedDict([ ('referencenum',['10','10','20','20','20','30','30','40']), ('Month',['Jan','Jan'

浏览 16提问于2019-02-06得票数 1

回答已采纳

1回答

我怎样才能绘制一个利克特刻度表呢？

、、、

我有一个excel电子表格如下： data = pd.read_excel(r'survey.xlsx') 每一行都是对一项调查的回应，列是Likert量表中不同的问题(强同意，多数同意，中立，大多数不同意，强烈不同意)。假设对于给定的问题，excel电子表格中的调查信息可以打印为 print(data.iloc[:,9]) 这给 0 Mostly Agree 1 Mostly Agree 2 Mostly Disagree 3 Neither Agree Nor Disag

浏览 7提问于2021-12-02得票数 0

3回答

迭代pandas数据帧中字典列表的字典

、

如何迭代pandas dataframe中字典列表的字典其中一列是Response。 Response = {"query":"hi","intents":[{"intent":"greeting","score":0.941468239},{"intent":"sentinel","score":7.298465E-06},{"intent":"analyticsPage","score":3.7748

浏览 0提问于2018-02-06得票数 0

2回答

替换Pandas Dataframe值运行和崩溃内核

、

我在我的Pandas Dataframe中有这些值，Dataframe本身有大约400000行，其中一列称为"Value“。 S2_2018_targeted.value.unique() array(['Yes', 'No', 'N', 'Y', 'YES', 'NO', 'y', ' No ', ' Yes ', ' ', nan], dtype=object) 我正在运行这段代码来更改这些值，但它使Ju

浏览 6提问于2019-08-06得票数 0

回答已采纳

1回答

如何在spark sql dataframe中映射一列以创建新列？

、、、

在python和pandas中，我可以创建一个新的专栏，如下所示：使用pandas dataframe中的两列来创建字典。 dict1 = dict(zip(data["id"], data["duration"])) 然后，我可以应用这个字典在第二个dataframe中创建一个新列。 df['id_duration'] = df['id'].map(lambda x: dict1[x] if x in dict1.keys() else -1) 如果我有一个数据帧id_duration (有两列：id和duration)和

浏览 38提问于2021-01-22得票数 0

回答已采纳

1回答

如何在Bokeh中导入CSV作为ColumnDataSource，而无需通过Pandas？

要在Bokeh中使用数据集，通常也会导入熊猫，并使用熊猫DataFrame作为数据。也可以从Pandas DataFrame创建ColumnDataSource。但是，有没有可能直接从csv文件(或任何其他表格源数据)转到Bokeh，而不使用Pandas作为桥梁创建，以及如何创建？

浏览 1提问于2017-08-14得票数 0

2回答

以行索引为值的Pandas dataframe到字典？

、、、

如何将pandas df转换为使用其行索引作为值的字典？例如，假设我有一个只有一列的df： df = pd.DataFrame({ 'ID': [3823, 4724,6233,2438], }) 这给了我： ID 0 3823 1 4724 2 6233 3 2438 我想返回一个字典，它将是： {3832: 0, 4724: 1, 6233: 2, 2438: 3} 谢谢!

浏览 5提问于2020-11-10得票数 3

2回答

从两个熊猫系列创建元素级词典( csv列为DataFrame)

、、

我希望做一个逐行字典映射的两列标题多列csv通过pandas DataFrame通过read_csv()读取。换句话说，对于每一行，将列X中的值作为键，Y列中的相应值作为值。由于pandas中的许多操作都是按元素计算的，因此我推测，我可能通过以下一行程序来实现这一点： {df['X'] : df['Y']} 唉，没有这样的运气。 pandas是否公开了它自己的方法？我还将看到类似于.xls和.xlsx的东西。 Python: 2.7.11 熊猫: 0.18

浏览 3提问于2016-05-13得票数 2

2回答

合并两个基于Pandas数据帧的列值

、、

我有两个数据格式定义如下： dataframe1 = pd.DataFrame( [["123", "CTR", "ABC", "DEF", "GHI"], ["123", "RIGHT", "ABC", "DEF", "GHI"], ["123", "LEFT", "ABC",

浏览 1提问于2022-01-24得票数 0

回答已采纳

3回答

将对象列表转换为pandas数据帧

、、

如何将对象列表转换为pandas数据帧？ class Person(object): def __init__(self): self.name = "" self.year = 0 self.salary = 0 例如下面的工作，但是我想要一个person类的列表 import pandas as pd import numpy as np data = {'name': ['Alice', 'Bob', 'Charles', 'David'

浏览 0提问于2017-12-04得票数 24

回答已采纳

2回答

到DataFrame的嵌套JSON

、、

我有一个JSON文件，如下所示 { "AAPL":{ "quote":{ "symbol":"AAPL", "companyName":"Apple, Inc.", "primaryExchange":"SQDNAA", "calculationPrice":"close" } }, "MSFT":{

浏览 20提问于2020-04-05得票数 2

1回答

基于另一列中的文本在pandas中创建列

、、、

我在python中有一个pandas Dataframe，它有一个名为"Description“的列，其中包含一组由"\n”分隔的文本元素。我想通过拆分文本元素在相同的Dataframe中创建新列。例如，我有： Description '\nA: Elephant\nB: Cats\nC:Dog' 我想用关联的元素获得相应的列数，如下所示： Description A B C '\nA: Elephant\nB: Cats\nC:Dog' Elephant

浏览 11提问于2021-01-21得票数 0

2回答

如何将包含字符串值的pandas数据帧的列转换为int/float？

、、

我有一个pandas dataframe，它包含一个非数字值的列。如何将它们转换为整型/浮点型。 eq： Col1 Col2 Lip_GD 267 Gly_hy_68 467 Hint_2 628 Jac+Jac 339 Lip_GD 234 Jac+Jac 267 当我将这些数据读入pandas数据帧时，我将如何将列1转换为int？

浏览 4提问于2015-11-26得票数 3

2回答

Pandas dict to dataframe -列无序？

、

我进行了搜索，但没有看到与这个特定问题有关的任何结果。我有一个Python字典，正在将我的字典转换为pandas数据帧： pandas.DataFrame(data_dict) 它可以工作，但有一个问题-我的pandas dataframe的列与我的Python字典的列的顺序不同。我不确定熊猫是如何重新排序的。如何保留排序？

浏览 2提问于2015-04-15得票数 1

1回答

仅为select列向pandas数据框追加一行

、

我想向pandas DataFrame追加一个新行，但只填充select列。在下面的代码中，我设置了要填充的列列表的子集，并分配一个值列表。 import pandas as pd sampleDF = pd.DataFrame(columns=['Tenant','Industry','Square Footage']) sampleDF = sampleDF.iloc[sampleDF.tail(1).index.item(), ['Tenant', 'Industry']] = ['DE Sha

浏览 19提问于2021-02-01得票数 0

2回答

将.txt文件(以所有数据作为列名的空数据帧)转换为数据帧

、、

在显示.txt文件的内容时，我得到以下输出： Empty DataFrame Columns: [[{'city': 'Zurich, Switzerland', 'cost': '135.74'}, {'city': 'Basel, Switzerland', 'cost': '135.36'}, {'city': 'Lausanne, Switzerland', 'cost&

浏览 11提问于2021-02-16得票数 2

1回答

在Dataframe中作为行附加连续字典

、

我有下面的空数据。 columns = [ 'image_path', 'label', 'nose', 'neck', 'r_sho', 'r_elb', 'r_wri', 'l_sho', 'l_elb', 'l_wri', 'r_hip', 'r_knee', 'r_ank', 'l_hip', 'l_knee',

浏览 11提问于2022-05-20得票数 0

2回答

默认情况下将pandas.DataFrame列分配给Series

、

假设我有一个DataFrame df = pandas.DataFrame({'a': [1,2], 'b': [3,4]}, ['foo', 'bar']) a b foo 1 3 bar 2 4 我想添加一个基于另一个Series的列 s = pandas.Series({'foo': 10, 'baz': 20}) foo 10 baz 20 dtype: int64 如何将该系列分配给DataFrame的一个列，并在DataFrame索引中没有DataFr

浏览 0提问于2018-07-02得票数 2

回答已采纳

1回答

使用DataFrame ()定义在.apply上使用的函数

、、、、

我想定义带有签名的自定义函数，这些签名包括dataframe的一个或几个列。我试图复制文章中提到的解决方案“如何将Pandas 'apply‘函数使用到多个列？”，但我无法理解函数需要以何种方式来接受来自其他列的数据作为输入。我的代码示例： import pandas as pd df=pd.DataFrame({'NAME':['A','B','C','D'],'HOURS':[38, 52, 1040, 28],'ROLE':['Manager',&

浏览 0提问于2018-12-29得票数 1

回答已采纳

2回答

如何将字典附加到pandas数据帧？

、、、、

我有一组包含json文件的urls和一个空的pandas dataframe，其中的列表示jsnon文件的属性。并不是所有的json文件都具有pandas dataframe中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas dataframe，如果json文件没有与dataframe中的列匹配的属性，则必须将其填充为空。我设法创建了如下字典： import urllib2 import json url = "https://cws01.worldstores.co.uk/api/product.php?product_sku=ULS

浏览 2提问于2015-07-29得票数 11

回答已采纳

2回答

在ipython中，如何获得具有特定类型和模式的所有局部变量的列表？

、

例如，我在工作空间中创建了5个pd.DataFrame，它们是： trade_i = pd.DataFrame(np.random.rand(5, 2)) trade_xt = pd.DataFrame(np.random.rand(5, 2)) trade_mmt = pd.DataFrame(np.random.rand(5, 2)) trade_pg = pd.DataFrame(np.random.rand(5, 2)) trade_fg = pd.DataFrame(np.random.rand(5, 2)) 如您所见，这些类型都是pandas.core.frame.DataFram

浏览 4提问于2018-01-14得票数 1

回答已采纳

1回答

如何在Python中引用list来赋值Pandas列值？

、

这个想法是根据列表分配pandas列。 from pandas import DataFrame time_window_order=['268','264','260','256','252','248','244','240'] df =DataFrame ({'time_window':['268','268','268','264','252','252&#

浏览 119提问于2021-02-23得票数 0

回答已采纳

1回答

DataFrame . float64型列的重复行和滚动均值计算

、

我想向Pandas DataFrame添加更多的行。但是，对于类型为float64的列，我需要计算以前的3-观察滚动平均值，而不是简单地重复。在下面的DataFrame Score1列中，类型为float64。对于month列，我需要增加+1。 import pandas as pd df = pd.DataFrame({ 'Month' : [1,2,3], 'Year' : [2021,2021,2021], 'Label'

浏览 0提问于2021-12-22得票数 0

1回答

如何在Python/Pandas中将循环的垂直列转换为行，然后将它们堆叠在一起？

、、、、

我首先垂直生成一些数据，但希望将它们转置为行数据，然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr'，'en'，'ir'，'ab')和3行的熊猫数据帧的最终结果？ # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk import re import random from random import randint import csv import

浏览 1提问于2015-10-20得票数 2

7回答

将Pandas列转换为DateTime

、、

我在pandas DataFrame中有一个字段是以字符串格式导入的。它应该是datetime变量。如何将其转换为日期时间列，然后根据日期进行筛选。示例： DataFrame名称：raw_data 列名：Mycol 列中的值格式:Mycol

浏览 143提问于2014-11-06得票数 362

回答已采纳

2回答

在pandas dataframe中基于另一列创建列

、

我有一个pandas dataframe，其中一列只包含字符串。 df= pd.DataFrame( { "A": [2,4,7,17,39], "B": ["apple","apple","broccoli","rose","apple"] } ) 我想要检查列"B“，并查找字符串包含单词的特定部分的所有时间。然后，我创建了一个新的列"C“，它包含一系列字符串，当"app”出现在行中时，这些字符串就会说“水果”；当"ros“

浏览 0提问于2017-05-01得票数 2

3回答

如何从pandas数据帧中提取单元

、

假设我制作了一个pandas数据帧(我不擅长pandas，这可能效率不高)： import pandas as pd colnames = ['a', 'b'] data = pd.DataFrame(columns=colnames) df_row = ['val1', 'val2'] app = pd.Series(df_row, index=cols) data = data.append(app, ignore_index=True) 我希望以字符串而不是pandas对象的形式访问val1。如果我这样做了： cell =

浏览 2提问于2015-08-25得票数 5

回答已采纳

1回答

Python/Pandas Timedelta只有1位数的小时？

、、、

我有一个Pandas Dataframe (数据)，它的列“工期”表示以小时、分钟、秒为单位的时间，格式如下："1:10:27“ 如何将列转换为Pandas？我尝试过： data['Duration'] = pd.to_timedelta(data['Duration']) 但它说："ValueError:预期的hh:mm:ss格式之前“ 我怀疑这种情况的发生是因为该格式只有1位数，时间长达数小时。行显示"1:30:27“而不是"01:30:27”。或"0:57:23“代替"00:57:23” 我很感谢你的帮助！

浏览 11提问于2022-04-27得票数 0

1回答

Pandas DataFrame.Groupby.Agg字典中的自定义列选择

、、

在选择要插入到Pandas.DataFrame.Groupby.agg中的列时，我遇到了问题。这是获取和准备数据的代码。 # Data Collecting and library import from pandas_datareader import data import pandas as pd symbol = 'AAPL' source = 'yahoo' start_date = '2018-01-01' end_date = '2019-04-24' stock = data.DataReader(symbol

浏览 2提问于2019-10-14得票数 1

回答已采纳

1回答

如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为dataframe？

、、

我在DataFrame上应用了groupby，之后它将DataFrame转换为pandas.core.groupby.groupby.DataFrameGroupBy格式。如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为常规DataFrame，或者如何从pandas.core.groupby.groupby.DataFrameGroupBy数据类型访问单个列？

浏览 7提问于2018-10-27得票数 1

1回答

如何使用另一个dataframe列的值转换dataframe的列值

、、

如何将列"main_category“添加到orig_diff中，以指示子类别属于哪个主类别。例如，价值“电影”的orig_df必须将"main_category“作为”娱乐“，”数学“作为”教育“。 import pandas as pd import numpy as np orig_df = pd.DataFrame({"sub_cat" : ["Movie", "Science", "Maths", "Music", "Songs", "Dance", &#

浏览 0提问于2018-05-04得票数 2

回答已采纳

1回答

用户定义函数以组合CUDF数据基列

、、

根据标题，我试图组合来自不同cudf.DataFrame列的行值。以下代码适用于标准pandas.DataFrame import pandas as pd data = {'a': [1], 'b': [2], 'c': [3], 'd': [4]} df = pd.DataFrame.from_dict(data) def f(row): return {'dictfromcolumns': [row['a'], row['b'], row['c'],

浏览 18提问于2022-09-23得票数 0

回答已采纳

1回答

熊猫ISO格式的时间戳在导入时会导致Exasol错误

、

当将 import_from_pandas(df)用于DataFrame时，具有datetime列的df会抛出一个错误，因为它无法解析dataframe列的ISO格式字符串表示形式。具体来说，"+00:00“最终字符是Exasol无法解析的。我目前的解决办法是将所有的熊猫日期时间列转换为字符串列，但这可能会花费大量的时间。将datetime列从Pandas导入到具有TIMESTAMP列类型的现有Exasol表的正确方法是什么？

浏览 2提问于2019-09-24得票数 2

回答已采纳

1回答

Pyspark:从列表的RDD创建spark数据帧，其中列表的一些元素是对象

、、、、

我正在尝试将pandas.DataFrame代码转换为等效的pyspark DataFrame。我有一个以下格式的RDD。 myRdd = [[1, 'a', {'a':[1, 2]}], [2, 'b', {'c': 1, 'd':3}], [3, 'c', {}]] columnNames = ['sl', 'name', 'params'] 内部列表中的第三个元素没有特定的结构。在pandas数据帧中，我可以

浏览 1提问于2018-04-07得票数 1

2回答

列大小问题: read_csv

、、

我有一个有4列的数据帧。为了在本地计算机上工作，我必须将此数据帧转换为csv。当我将dataframe转换为csv时，我只有一列： df = pd.read_csv("final.csv") print df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 20479 entries, 0 to 20478 Data columns (total 1 columns) 如何将此csv转换为4列的dataframe？

浏览 1提问于2017-10-06得票数 0

1回答

无法将列插入新创建的dataframe ( Pandas)

、

让df成为一个数据格式。我正在尝试将列(一个)放置到另一个名为df2的数据place中 df2.insert(1,'a',df['a']) 从excel加载df2时，一切都进行得很好： df2 = pandas.read_excel(filepath) 然而，当我从头创建df2时，有一个错误： df2 = pandas.DataFrame 该错误如下： insert() missing 1 required positional argument: 'value' 怎么一回事？

浏览 2提问于2020-07-18得票数 0