使用DataFrame列作为id_使用dataframe列值作为列名_如何使用ID作为常用值，使用pandas DataFrame中的值更新DynamoDB列 - 腾讯云开发者社区

python、pandas、dataframe

我有一个dataframe，需要将Custom列行转换为第二个dataframe中的列。这部分我已经做好了，而且效果很好。问题是，我需要将id列的相应值添加到第二个dataframe的相应列中。下面是一个示例：这是第一个dataframe：这是第二个dataframe，已经转换了列。但是，我想将第一个dataframe的id列对应的值添加到第二个dataframe：附件是密码： import pandas as pd Data = { "Custom Field": ["CF1", "CF2", "

浏览 1提问于2022-07-13得票数 1

回答已采纳

1回答

Featuretools从多个列创建索引

featuretools

我正在尝试使用featuretools中的entity_from_dataframe函数从数据帧创建实体。如果索引由多个列组成，有没有办法定义它。我不确定是否需要列表、元组或其他数据结构。代码如下： es=es.entity_from_dataframe(entity_id="credit", dataframe=credit_df, index=["ID1","ID2"] ) 它会生成以下关于哈希性的错误 T

浏览 4提问于2018-07-06得票数 2

1回答

python:熊猫-数据帧的顺序列

python、pandas

我有以下代码来输出dataFrame： output = pd.DataFrame({"id":id_test, "hum":y_pred}) output.to_csv("myOutput.csv", index=False) 然后在myOutput.csv中，我得到了hum作为第一列，id作为第二列。是否有办法将id改为第一列？谢谢!

浏览 1提问于2016-05-26得票数 2

回答已采纳

2回答

根据请求的列获取dataframe (python)的子集

python、pandas、dataframe

我在python中的dataframe有以下问题：我有一个ID列(不是索引)的dataframe和其他列。现在，我想要编写一个代码，它提供一个新的dataframe，它的所有列在列中具有相同的值，就像请求的项ID一样，它还应该包含dataframe的所有列。 def subset(itemID): columnxValue = df[df['ID'] == itemID]['columnx'] subset = df[df['columnx'] == columnxValue] return subset 如果我这样做，我总是会得到错

浏览 5提问于2021-05-04得票数 0

回答已采纳

1回答

根据列和索引头返回值

python、pandas、dataframe

我有一个包含索引和列标题的dataframe，如下所示： Customer ID Email Technique 1 Technique 2 ... 12345 i@me.com 1 0 ... ... 有没有一种方法可以拉取具有相应索引/列的值？在本例中，前两列是索引，第一行是所有标题。是否存在某种方法，使得： dataframe.method(index label, column label) dataframe.method('12345'

浏览 0提问于2018-07-18得票数 0

回答已采纳

3回答

如何基于多个栏和条件来填充大熊猫DataFrame？

python、pandas、dataframe

我目前正在从事一个业余项目，但我被困在熊猫中植入DataFrame。我有三个DataFrames。我的问题：对于DataFrame1中的每个DataFrame1，如果列m等于1，则将列n添加到DataFrame3中的x列中。对于DataFrame1中的每个DataFrame1和DataFrame2将列y设置为1，如果DataFrame1中的列c等于1，或者DataFrame2中的列d等于1。c等于99具有最高优先级，并将y设置为99 有人能帮帮我吗？ DataFrame1 | id | n | m | c | |--------|------

浏览 0提问于2019-04-12得票数 0

回答已采纳

2回答

熊猫分组并创建第25和75百分位数的新列

python、pandas

我有以下熊猫DataFrame： df = pd.DataFrame({ 'id': [1, 1, 1, 2], 'r': [1000, 1300, 1400, 1100], 's': [650, 720, 565, 600] }) 我想聚合DataFrame并创建一个新的列，它是一个r值的范围- 25th和75th百分位数。s列的聚合为mean。如果对一个群体只有一个观察，那么保持观察的原样。预

浏览 6提问于2022-05-16得票数 1

3回答

熊猫在不重叠栏上的分级索引

python、pandas

我有一个dataframe，并将索引设置为dataframe的一个列。这将创建分层列索引。我想把这些列夷为平地。但是，类似于这个问题-- ，列不重叠(即“id”不在层次索引的0级，其他列位于索引的第1级)。 df = pd.DataFrame([(101,3,'x'), (102,5,'y')], columns=['id', 'A', 'B']) df.set_index('id', inplace=True) A B id 101 3 x 102 5 y

浏览 0提问于2016-10-15得票数 4

回答已采纳

1回答

Python / Pandas:如何创建一个多索引的空DataFrame，然后开始填充它？

python、pandas、dataframe、multi-index

我想将本地DataFrames集的摘要存储到使用pd.MultiIndex的"meta DataFrame“中。基本上，行轴有两个层次，列轴也是。在管理DataFrames集合的类中，我将"Meta DataFrame“定义为类变量。 import pandas as pd row_axis = pd.MultiIndex(levels=[[],[]], codes=[[],[]], names=['Data', 'Period']) column_axis = pd.MultiIndex(levels=[[],[]], codes=[[],

浏览 0提问于2020-04-30得票数 2

回答已采纳

2回答

如何用用户定义的字符串对数据进行索引？

database、dataframe、csv、julia

假设:我有一个朱莉娅DataFrame和一个名为article_id的专栏。通常，我可以使用一些语法(如DataFrame )来声明df = DataFrame(CSV.File(dataFileName; delim = ","))。如果我想获得与已知属性相关的列，我可以执行类似于df.article_id的操作。我还可以通过执行df."article_id"来索引该特定列。但是，如果我创建了一个字符串并将其分配给article_id的值(如str = "article_id" )，我就不能通过df.str对数据进行索引:这样做会得到一个错

浏览 9提问于2022-06-25得票数 2

回答已采纳

1回答

‘无法访问'DataFrameGroupBy’对象的可调用属性‘DataFrameGroupBy’，尝试使用'apply‘方法

python、python-3.x、pandas、numpy、group-by

我试图在dataframe中对数字列进行排序，但是得到这个错误的'id‘列在特定的站点上有id的计数。例如2272、2202、1855等 df.sort_values(by=['id']) 但是，我得到了这个错误： ‘无法访问'DataFrameGroupBy’对象的可调用属性‘DataFrameGroupBy’，尝试使用'apply‘方法

浏览 1提问于2018-08-09得票数 3

1回答

需要访问spark dataframe中数组列中的特定元素

apache-spark、apache-spark-sql

我在Spark DataFrame中有一个包含两个元素的数组列，我需要获取具有特定模式的第二个元素，而不是位置id。输入DataFrame： +---+------------+----+ | id| objectid|name| +---+------------+----+ |100|[100, AB100]| ABC| |200|[200, AB200]| CDE| +---+------------+----+ DataFrame架构： root |-- id: integer (nullable = false) |-- objectid: array (nullable

浏览 1提问于2021-05-10得票数 0

1回答

基于其他数据栏更新熊猫数据

python、pandas、dataframe

我有第一个dataframe dffieldnames。它只有一列FIELD_NAME FIELD_NAME MKEY reporting_entity provision_amount ORIG_country RCA_check EWA_check 我有第二个dataframe dfdata，上面的所有行都显示为具有实际值的列。看上去就像下面。可能是第一次数据访问中的字段名可能以第二次数据name中的列形式出现，也可能不会出现。例如，EWA检查只存在于第一次数据中，而不在第二次数据中。 MKEY | reporting_entity |provision_amount | ORIG_cou

浏览 14提问于2022-01-28得票数 0

回答已采纳

2回答

在pyspark中通过一列连接两个数据帧

apache-spark、join、pyspark

我有两个dataframe，我需要连接一列，如果id包含在第二个dataframe的同一列中，则只从第一个dataframe中提取行： df1： id a b 2 1 1 3 0.5 1 4 1 2 5 2 1 df2： id c d 2 fs a 5 fa f 所需输出： df: id a b 2 1 1 5 2 1 我尝试使用df1.join(df2("id")，"left"

浏览 0提问于2017-09-27得票数 1

回答已采纳

1回答

根据从第三列开始的所有列从熊猫数据中删除副本

python、pandas

我有一个50 +列的dataframe，前两个是唯一的ID。由于某些原因，对于不同的ID，来自第三列的数据可以完全相同。我想要实现的是根据从第三列开始的所有列从dataframe删除重复项。如果有超过1行具有不同ID和来自第三列的相同数据，那么我们保留的行都是相同的，它可以是最后一行，也可以是第一行，无论哪一行更容易完成。我对熊猫很陌生，我试过的是这样的： df.drop_duplicates(subset=df.iloc[2:], keep="last")

浏览 13提问于2022-01-18得票数 1

回答已采纳

1回答

如何在SQL中使用枢轴(不是作为DataFrame分组操作符)？

sql、scala、apache-spark、apache-spark-sql

我有这个dataframe，我试图将这个dataframe操作转换成sql使用pivot函数。 val df = Seq( (1, "a,b,c"), (2, "b,c") ).toDF("id", "page_path") df.createOrReplaceTempView("df") df.show() df .withColumn("splitted", split($"page_path", ","))

浏览 0提问于2020-05-11得票数 4

回答已采纳

2回答

无法从另一个dataframe在dataframe中创建列。

python、pandas

浏览 2提问于2020-06-30得票数 0

3回答

对具有列表值的列使用isin()

python、pandas

浏览 0提问于2019-06-15得票数 2

1回答

不正确的dfiloc[:，0]

python、pandas

我的df有下面的列 ID Number Name 11 ccc-456 dfg 45 ggt-56 ggg 33 67889 ttt 当我创建一个新的dataframe时(需要它与另一个dataframe合并) df2 = df[['ID', 'Number']] 我收到一条错误消息，声明索引中没有ID。但是当我打印(Df)时，我确实看到了ID列。当我运行索引df3 = df.iloc[:, 0]时，我在结果中看到前两列ID和Number ID 24 32666 188 33432 401 34341

浏览 1提问于2022-07-11得票数 0

回答已采纳

2回答

DataFrame，如果特定列值在DF1中，则在DF2中的特定行中添加来自DF1的值。

python、pandas

在熊猫的帮助下，我一直在寻找很多东西，但是找不到我要找的东西。我有两个包含这些列的数据文件： Index([u'id', u'date', u'heure', u'titre'], dtype='object') Index([u'article', u'id', u'type', u'rubrique', u'source', u'rebond_global', u'chargement_global

浏览 0提问于2017-01-11得票数 0

回答已采纳

1回答

从pd数据中提取值

pandas

我有一个dataframe列，如下所示。 {"urls":{"web":{"discover":""}}，“颜色”：16734574，"parent_id":11，“名称”：“叙事电影”，"id":31，“位置”：13，“片段”：“电影和视频/叙事电影”} 我想用“子弹”这个词来提取信息。(在这种情况下，它是电影&视频/叙事电影)并将信息存储为一个新的dataframe列。我该怎么做？非常感谢

浏览 1提问于2020-03-21得票数 0

1回答

有效地从存在于小数据仓库中的大数据文件中筛选条目

performance、join、apache-spark、apache-spark-sql

我有一个Spark程序，它读取一个相对较大的dataframe (~3.2 id )，其中包含两个列: id、name和另一个相对较小的dataframe (~20k条目)，其中包含一个列:id 我想要做的是，如果id和名字都出现在小的dataframe中，就从大的dataframe中提取我想知道怎样才能有效地解决这个问题，为什么呢？我想到了几种选择：广播加入两个数据格式广播小数据，并将其收集为字符串数组，然后对大数据进行筛选，并将isin与字符串数组一起使用。还有其他我没提过的选择吗？如果有人也能解释为什么一个特定的解决方案比另一个更有效率，我会很感激的。提前感谢

浏览 0提问于2016-11-21得票数 4

回答已采纳

3回答

Spark/Scala在多个列上使用相同的函数重复调用withColumn()

scala、apache-spark、dataframe、apache-spark-sql、user-defined-functions

我目前的代码中，我通过多个.withColumn链将相同的过程重复应用于多个DataFrame列，并且希望创建一个函数来简化该过程。在我的例子中，我查找的是按键聚合的列的累积和： val newDF = oldDF .withColumn("cumA", sum("A").over(Window.partitionBy("ID").orderBy("time"))) .withColumn("cumB", sum("B").over(Window.partitionBy("ID

浏览 9提问于2016-12-31得票数 21

回答已采纳

4回答

将数据帧列分解为多行

python、pandas、dataframe

我有一个大型的dataframe a，我想分裂或爆炸成为dataframe b (真正的dataframe a包含90列)。我试图查找与此类似的问题的解决方案，但没有找到，因为它与单元格中的值无关，而是与列名有关。任何指向解决方案或使用熊猫图书馆现有功能的指针都将不胜感激。提前谢谢你。 from pandas import DataFrame import numpy as np # current df a = DataFrame([{'ID': 'ID_1', 'A-1': 'a1', 'B-1':

浏览 8提问于2022-01-26得票数 2

回答已采纳

1回答

通过保持一个公共列的完整性，从两个数据帧中删除公共列

python、pandas、dataframe

我有一个包含像'ID', 'A', 'B', 'C', 'D', 'E', 'F', 'G'这样的列的dataframe1。现在，我已经创建了两个数据帧， dataframe2包含'ID', 'A', 'C'，dataframe3包含'ID', 'B', 'E'，现在我想获取一个数据框dataframe4，它提供了dataframe1中的剩余列，但'ID‘应该在d

浏览 13提问于2020-01-25得票数 2

回答已采纳

2回答

具有相同标识符R的独立列堆栈

r、dplyr

是否可以将具有相同标识符的列合并，并将这些列从相同的数据帧堆在一起。还要删除NA值，如所需的DataFrame输出所示？电流DataFrame id Col1 Col2 Col3 1 A NA C 1 NA B NA 2 NA B NA 2 A NA C 3 A NA C 期望DataFrame id NewCol 1 A 1 B 1 C 2

浏览 4提问于2021-11-17得票数 1

1回答

如何在分组的pandas数据帧中堆叠3-D数组？

pandas、numpy、pandas-groupby

我有一个由两列组成的pandas数据帧:一列是字符串标识符，一列是3维数组。数组已按ID分组，如何堆叠每个组的所有数组，使每个ID只有一个堆叠的数组？我的代码如下： df1 = pd.DataFrame({'IDs': ids}) df2 = pd.DataFrame({'arrays':arrays}) df = pd.concat([df1, df2], axis=1) grouped = df['arrays'].groupby(df['IDs']) (我尝试了np.dstack(grouped)，但没有成功。)

浏览 1提问于2020-01-17得票数 1

3回答

R:在特定列上应用函数，保留数据帧的其余部分

r、dataframe、sapply

我想了解如何在不从df中“排除”其他列的情况下，对数据帧的特定列应用函数。例如，我想将一些特定的列乘以1000，而让其他列保持原样。例如，像这样使用sapply函数： a<-as.data.frame(sapply(table.xy[,1], function(x){x*1000})) 我得到了新的数据帧，其中第一列乘以1000，但没有在操作中使用的其他列。所以我尝试这样做： a<-as.data.frame(sapply(table.xy, function(x) if (colnames=="columnA") {x/1000} else {x

浏览 0提问于2012-11-15得票数 14

回答已采纳

1回答

使用数据帧的mysql.connector update语句

python、mysql、pandas、connection

我正在尝试使用dataframe id列(与数据库表中的id相同)和另一列的相应值(例如"text")来更新mysql表，但我无法通过准备好的语句传递正确的列(我尝试了不同的方法，但它只是抛出警告)。有人知道如何解决这个问题吗？我相信这很容易。我已经打开了一个连接，要插入的查询是 query = """ UPDATE user SET extra = ? WHERE id = ? """ 而数据帧是这样的： data= pd.DataFrame({'id&

浏览 17提问于2020-07-03得票数 0

2回答

Python将来自多个数据帧的列合并为单个数据帧

python、pandas、numpy、dataframe、merge

我要合并5个文件。每个文件的某些列名在其他文件中是相同的。我使用来执行concat操作。有一个列在所有文件中都是唯一的，即ID。当我合并这些列时，我注意到后缀(_x，_y)被应用于正在重复的列名的末尾(由于合并功能)。如何将这些列合并为单个列(不考虑空值)。例： Dataframe 1 ID Name Age LAN_NBR 1 ABC 24 G284992 Dataframe 2 ID Name Street City State TYPE 2 John Wacker Chicago IL

浏览 3提问于2020-04-13得票数 2

回答已采纳

2回答

如何显示大熊猫中太多列的所有数据类型

python、pandas

我有一个由115个列组成的dataframe，我需要使用df.info()来显示数据类型和空值，但是当使用代码时，我得到了以下内容： <class 'pandas.core.frame.DataFrame'> RangeIndex: 25979 entries, 0 to 25978 Columns: 115 entries, id to BSA dtypes: float64(96), int64(9), object(10) memory usage: 22.8+ MB 是否有方法显示所有列的详细信息？

浏览 0提问于2021-05-07得票数 1

回答已采纳

1回答

无法过滤从Arrow表创建的DataFrame

dataframe、julia、apache-arrow

我在julia中具有以下功能:读取Arrow文件(使用Arrow.jl)从磁盘读取数据并进行处理： function getmembershipsdays(fromId, toId) memberships = Arrow.Table("HouseholdMemberships.arrow") |> DataFrame filter!([:IndividualId] => id -> id >= fromId && id <= toId, memberships) ... end > Error: ERROR:

浏览 3提问于2021-01-04得票数 4

回答已采纳

2回答

利用熊猫功能与火花放电

python、pandas、pyspark、bigdata、user-defined-functions

我正在尝试用Pyspark重写Python脚本( Pandas )，但我找不到一种更高效地应用Pandas函数的方法：我的职能如下： def decompose_id(id_flight): my_id=id_flight.split("_") Esn=my_id[0] Year=my_id[3][0:4] Month=my_id[3][4:6] return Esn, Year, Month def reverse_string(string): stringlength=len(string) # calculate le

浏览 3提问于2021-06-30得票数 1

回答已采纳

1回答

为什么“Pandas”中的groupby在现有的列名下计算？

pandas、pandas-groupby

我来自R，不了解熊猫的默认群体行为。我创建了一个dataframe和groupby列'id‘，如下所示： d = {'id': [1, 2, 3, 4, 2, 2, 4], 'color': ["r","r","b","b","g","g","r"], 'size': [1,2,1,2,1,3,4]} df = DataFrame(data=d) freq = df.groupby('id').count() 当

浏览 1提问于2017-11-26得票数 1

回答已采纳

2回答

将列表转换为python中的数据

python、list、pandas、dataframe

浏览 3提问于2016-12-21得票数 2

回答已采纳

1回答

如何从dataframe中创建字符串索引而不是数字？

python、pandas、dataframe、indexing

我想从dataframe的列中显示的内容创建唯一的行标识符，而不是索引列。例如, import pandas as pd from pprint import pprint df = pd.DataFrame(columns=["ID", "Animal", "Weight", "Description"]) df["ID"] = ["Qw9457", "gft878"] df["Animal"] = ["Mouse", "Lion"

浏览 26提问于2019-08-06得票数 0

1回答

无论是文本还是空白，我如何按数据there中的一列分组并在另一列上组合？

python、pandas、dataframe、group-by、duplicates

我希望对一个groupby的一列进行Dataframe，然后将第一列(call_ID)的唯一值合并到另一列中的任何文本。代码还应删除任何重复项。我的问题似乎是删除副本。我尝试了下面的代码，但没有成功。 # Dataframe dftest0 = pd.DataFrame(data ={'call_ID':[5423684,5423684,5423684,5423684], 'other_comb_words':['','','inspection','inspection']}) # Change

浏览 2提问于2022-02-18得票数 0

1回答

基于列表的DataFrames列重新排列- DataFrames有不同的列。

python、pandas、dataframe、columnsorting

对我的问题的总结： I有许多列，它们都具有相同的列池(7列，例如column 1:column 7)，但有时缺少一个或多个列(即DataFrame可能有column 1:column 3+column 6:column 7，因此缺少第4和第5列)。每个DataFrame每次都有按不同顺序排列的列(即df1有其顺序，df2有另一个顺序，df3还有其他顺序等等)。我想根据作为基准的列列表(在本例中是从1到7的列列表)来排列每个DataFrame中的列。所需的结果是，所有数据格式都将基于此列表具有相同的列顺序，如果某列缺失，则应保留该列的顺序(即，如果第4和第5列缺失，则列的顺序应为: CO

浏览 2提问于2021-02-16得票数 0

回答已采纳

1回答

Python Pandas:将几个布尔列转换为(可能重复的)由布尔列名称组成的列

python、boolean、dataframe、pandas、multiple-columns

假设我有下面的DataFrame： >>> dfrm = pandas.DataFrame({ "A":[1,2,3], "id1":[True, True, False], "id2":[False, True, False] }) >>> dfrm A id1

浏览 0提问于2012-09-26得票数 1

回答已采纳

1回答

Spark，在Scala中添加具有相同值的新列

scala、apache-spark、spark-dataframe

我在Spark-Scala环境中的withColumn函数有一些问题。我想在我的DataFrame中添加一个新列，如下所示： +---+----+---+ | A| B| C| +---+----+---+ | 4|blah| 2| | 2| | 3| | 56| foo| 3| |100|null| 5| +---+----+---+ 变成了： +---+----+---+-----+ | A| B| C| D | +---+----+---+-----+ | 4|blah| 2| 750| | 2| | 3| 750| | 56| f

浏览 0提问于2016-07-26得票数 16

回答已采纳

1回答

根据另一个数据文件中的id分配数据文件id

python、python-3.x、pandas、dataframe

我有两个数据文件，叫做dataframe A和dataframe B。 A id| column1 |column2 3 | 439 | 2398 41| 498 | 34 2 | 233 | 43 B column1 |column2 439 | 2398 498 | 56 233 | 43 我想根据dataframe A中的id将一个id列分配给dataframe B。如果在dataframe A和datafr

浏览 1提问于2018-10-02得票数 2

回答已采纳

1回答

使用get_as_dataframe读取google_speadsheet

python-3.x、google-sheets-api

我使用get_as_dataframe阅读谷歌电子表格，这是非常类似于excel。A列是浮点数，B列、C列和D列A2 =B2+C2+D2之和。当我使用“get_as_dataframe”将电子表格读取为数据时，A列的值不是浮点数，而是方程'=B2+C2+D2‘的str。怎么解决这个问题？谢谢 from gspread_dataframe import get_as_dataframe, set_with_dataframe df = get_as_dataframe(sh.worksheet('sheetname'), parse_dates=True)

浏览 1提问于2019-11-08得票数 1

回答已采纳

1回答

，尝试更新单元格值

python-3.x、pandas、dataframe

我有两个dataframe，都有一个列日期：我需要在first dataframe中设置第二dataframe中特定列的值，因此，首先，我用以下方法找到了正确的第一行数据： id_row = int(dataset.loc[dataset["time"] == str(searchs.index[x])].index[0]) #example: 910 然后，我想更新此行中列['search_volume']的值：910 我要这样做： dataset['search_volume'][id_row] = searchs[kw_list[0]]

浏览 1提问于2021-04-20得票数 0

11回答

将Pandas DataFrame转换为字典

python、pandas、dictionary、dataframe

我有一个有四列的DataFrame。我想将这个DataFrame转换为python字典。我希望第一列的元素是keys，而同一行的其他列的元素是values。 DataFrame： ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9 产出应如下：字典： {'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}

浏览 12提问于2014-11-03得票数 361

回答已采纳

2回答

如何根据行和列的值更改PySpark数据帧的大小和分布？

python、dataframe、apache-spark、pyspark、apache-spark-sql

我有一个很大的PySpark DataFrame，我想在下面的例子中操作它。我认为想象它比描述它更容易。因此，为了说明的目的，让我们以一个简单的DataFrame df为例 df.show() +----------+-----------+-----------+ | series | timestamp | value | +----------+-----------+-----------+ | ID1 | t1 | value1_1 | | ID1 | t2 | value2_1 | | ID1 | t

浏览 12提问于2021-01-03得票数 1

回答已采纳

2回答

将Excel格式化为DataFrame

python、excel、pandas、dataframe、nan

请看我的excel工作表快照附在左上角.当我从这个工作表创建一个DataFrame时，我的第一列和第一行都填充了NaN。我需要跳过这个空白的行和列来选择用于创建DataFrame的第二行和第二列。 Unnamed: 0 Unnamed: 1 Unnamed: 2 Unnamed: 3 0 NaN ID SCOPE TASK 1 NaN 34 XX something_1 2 NaN 534 SS something

浏览 0提问于2020-12-08得票数 2

回答已采纳

1回答

R:建立一个基于3列[转置]的枢轴表

我有一个dataframe (df)： ID Type Order Revenue 1 apples 1 $100 1 oranges 2 $100 2 grapes 1 $500 2 oranges 2 $500 2 grapes 3 $500 2 grapes 4 $500 我想转换它以获得这个数据，其中列标题是原始数据帧中的"order“列： ID 1 2 3 4 Revenue 1 apples oranges $100 2

浏览 3提问于2015-06-08得票数 0

回答已采纳

2回答

如何将值传递给表中的pyspark变量？

python、pyspark、apache-spark-sql

这可能是一个愚蠢的问题，但我有一个表，其中的每一列都包含要传递给变量的值： object = spark.sql(""" select sfObject from db.tbl where Id = {} """.format(1)) a.show() 我看到的是一个名为sfObject的列，它的预期值为'ValueA‘，我得到一个pyspark.sql.dataframe.DataFrame类型的对象。我试图将每个列的值传递给一个变量，比如object = 'Valu

浏览 1提问于2020-06-10得票数 1

回答已采纳

1回答

python熊猫-在将键与另一个数据帧匹配后创建一个列

python、pandas、dataframe、lookup

我有两个数据帧。为了简单起见，我将在这里提供两个虚拟数据帧。 A = pd.DataFrame({'id':[1,2,3], 'name':['a','b','c']}) B = pd.DataFrame({'id':[1,1,1,3,2,3,1]}) 现在，我想在数据帧B上创建一个列，其名称与ids匹配。在这种情况下，我的期望输出将是： B = pd.DataFrame({'id':[1,1,1,3,2,3,1], 'name':['a','

浏览 2提问于2020-01-25得票数 0

回答已采纳

1回答

pandas -以自定义顺序对列进行排序

python、pandas、sorting

我有一个每天生成的Pandas Dataframe，每次生成时，Dataframe中存在的列的列表可能会有所不同。我正在尝试查看是否可以对列以特定格式存储为Dataframe的最终输出的顺序进行排序。如果存在新的列，则将它们放置在末尾。下面是我试图构建这个最终输出的方式 expected_columns = ['cust_id','cost_id','sale_id','prod_id'] 示例Dataframe列： ['customer_name','cust_id','sale_i

浏览 32提问于2021-10-13得票数 2

回答已采纳