如何编写一个改变DataFrame列顺序的函数？(Python)_在函数中使用一个DataFrame的列- Python_如何将一个dataframe中的列与diff dataframe中的列的顺序对齐？ - 腾讯云开发者社区

python、pandas

我进行了搜索，但没有看到与这个特定问题有关的任何结果。我有一个Python字典，正在将我的字典转换为pandas数据帧： pandas.DataFrame(data_dict) 它可以工作，但有一个问题-我的pandas dataframe的列与我的Python字典的列的顺序不同。我不确定熊猫是如何重新排序的。如何保留排序？

浏览 2提问于2015-04-15得票数 1

2回答

如何在不使用for循环的情况下将给定值与Pandas数据帧值进行比较

python、python-3.x、pandas、dataframe

我有以下示例dataframe： d = {'target': [1, 2, 4, 3, 6, 5]} df = pd.DataFrame(data=d) df 输出： target 0 1 1 2 2 4 3 3 4 6 5 5 我需要一个函数来完成以下工作：让函数的名称为find_index_of_first_hit(value)。这个功能..。将函数输入value与列target的元素进行比较。将搜索大于或等于函数输入value的第一列值。并将返回第一次匹配的dataframe行的index。示例： find

浏览 6提问于2022-02-09得票数 1

回答已采纳

1回答

使用python将列表转换为多个CSV文件

python、pandas、list、csv、glob

我想创建一个可伸缩的代码来导入多个CSV文件，基于colname标准化列号的顺序，并重写CSV文件。 import glob import pandas as pd # Get a list of all the csv files csv_files = glob.glob('*.csv') # List comprehension that loads of all the files dfs = [pd.read_csv(x,delimiter=";") for x in csv_files] A=pd.DataFrame(dfs[0]) B=pd

浏览 18提问于2019-06-01得票数 0

2回答

将DataFrame输出到CSV时头的一致顺序

python、pandas

我正在循环一个JSON响应，并将每个元素附加到Python中的Pandas DataFrame中。在循环结束时，我将DataFrame输出到CSV。然而，每次我输出CSV时，标题都不一致，就像列的顺序一样。如何使每次标题(和列)的顺序保持一致？请参阅下面使用的代码： output = pd.DataFrame() for item in json_resp: json_struct = { 'col_1':json_resp['data'], 'col_2':js

浏览 2提问于2019-10-01得票数 0

回答已采纳

2回答

列在叠加条形图中的变化顺序

python、pandas、data-visualization

我使用下面的代码从Python中的熊猫数据帧(data是DataFrame对象)生成一个堆叠的条形图。 data.plot(kind='bar', stacked=True, figsize=(15, 10), x='Species', fontsize=16, rot=0) 下面是上下文的。我想改变列的顺序。seaborn.barplot函数有x_order参数，这完全符合我的意愿。但是，它不像pandas.DataFrame.plot函数那样直接支持堆叠条形图。重新排序列的最简单方法是什么？

浏览 2提问于2015-08-14得票数 1

回答已采纳

1回答

Pandas写入Excel，根据字母顺序重新排列列

python、excel、pandas

我有一个python字典，它的格式是 dict = { D:"" B:"" A:"" C:"" } 但是，当我在excel中将此字典写入csv文件时，列被重新排列为 A B C D 当我在excel中写东西时，如何在python中保持我的dict顺序？ writer = pd.ExcelWriter('list_of_detected_words.xlsx', engine='xlsxwriter') list_of_d

浏览 0提问于2018-02-15得票数 8

回答已采纳

1回答

如何在PySpark中获取列的最后值

python、pyspark、pyspark-sql

这个问题非常琐碎，但是我在PySpark的世界里是全新的，我面临着很多问题，即使是简单的任务。假设我们有一个带有A列的dataframe df。我想要创建另一个dataframe，它只包含最后一个值为A的一个列(这里的最后一个值是指列A底部的真正记录)。我已经试过了 df["A"][-1]，但我错了。请注意，如果可能的话，我希望可以为PySpark和Pyspark中的Python代码提供一个解决方案。

浏览 1提问于2019-06-21得票数 0

回答已采纳

2回答

在for循环中，如何将索引值追加到dataframe名称的末尾。

python、pandas、dataframe

我想使用Python脚本编写一个'for‘循环(熊猫数据文件)，并希望将索引值附加到dataframe名称的末尾，以区分它们中的每一个，我该如何做呢？例如，我有一个dataframe df，列value为1~5；并且希望将数据集分成5部分，每个value为'1‘/ '2'/ '3'/ '4'/ '5’。我已经尝试了以下似乎有语法错误的方法。我怎么才能改变呢？谢谢 for i in range(1, 5): df_f'{i}' = df.loc[df['value'] == i] 注

浏览 3提问于2022-03-24得票数 0

2回答

可以从Scala调用python函数吗？

python、scala、apache-spark、pyspark、spark-dataframe

我正在创建一个火花作业，它要求使用用python编写的函数将列添加到dataframe中。其余的处理是使用Scala完成的。我已经找到了如何从pyspark调用Java/Scala函数的示例：我发现用另一种方式发送数据的唯一例子是使用pipe。我是否可以将整个dataframe发送到python函数，让函数操作数据并添加其他列，然后将结果数据返回给调用的Scala函数？如果这是不可能的，我目前的解决方案是运行一个pyspark进程，并调用多个Scala函数来操作dataframe，这并不理想。

浏览 3提问于2017-09-15得票数 5

1回答

迭代R中的DataFrame以更改列类型

r、function、for-loop

我来自Python，我不知道如何在R中实现这一点。我想编写一个包含两个参数的函数。A dataframe和a list of column names.我希望遍历dataframe来转换与列表中的列名相匹配的列名。要转换的列名列表，类型为character col.names<-c('Ri','Na','Mg') 我编写了这个函数，但它没有返回所需的输出。 function.convert<- function(df,col.names){ for (i in colnames(df)) { if (i %in%

浏览 3提问于2019-10-15得票数 0

回答已采纳

2回答

根据请求的列获取dataframe (python)的子集

python、pandas、dataframe

我在python中的dataframe有以下问题：我有一个ID列(不是索引)的dataframe和其他列。现在，我想要编写一个代码，它提供一个新的dataframe，它的所有列在列中具有相同的值，就像请求的项ID一样，它还应该包含dataframe的所有列。 def subset(itemID): columnxValue = df[df['ID'] == itemID]['columnx'] subset = df[df['columnx'] == columnxValue] return subset 如果我这样做，我总是会得到错

浏览 5提问于2021-05-04得票数 0

回答已采纳

1回答

将序列分配给Pandas DataFrame的多行

python、pandas

我有一个准备了索引和列的熊猫DataFrame，所有的值都是NaN。现在我计算了一个结果，这个结果可以用于DataFrame的多个行，并且我想一次将它们全部赋值。这可以通过一个循环来完成，但是我非常确定这个赋值可以一次完成。下面是一个场景： import pandas as pd df = pd.DataFrame(index=['A', 'B', 'C'], columns=['C1', 'C2']) # original df s = pd.Series({'C1': 1, 'C2&

浏览 5提问于2017-06-28得票数 10

回答已采纳

2回答

错误:缺少1个必需的位置参数：，‘在索引时出现’

pandas、mutable

我正在尝试用python编写不同的表名，这些表名是根据groupby函数为两列创建的不同数据帧来编写的。 list_dfs=[] TT=Dataframe.groupby(['change','x2']) for group,name in TT: list_dfs.append(group) writer = pd.ExcelWriter('output.xlsx') def dt(_,g): for _,g in Dataframe.groupby (Dataframe.index): print (g)

浏览 31提问于2019-04-15得票数 0

1回答

AttributeError:当尝试使用写操作时，'str‘对象没有属性’key‘

python

试图编写python 刮取器，将数据从网页刮到csv文件。尝试改变编写python文件的方式，如果删除dataFrameCleaned = cleanDataUp(dataFrame) csvData(dataFrameCleaned)行，代码将运行，但是它不会将数据写入csv文件 ''' write data to csv ''' def csvData(dataFrame): with open('threads.csv', 'w+', newline='', encoding=

浏览 2提问于2019-05-19得票数 2

1回答

如何在用一个Python pandas数据帧更新另一个数据帧后恢复初始结构？

python、pandas、dataframe

这是最初的帖子：Python Pandas update a dataframe value from another dataframe df1和df2具有相同的数据结构。原始列顺序: assignee id issuetype键问题是在运行以下代码后： df1.set_index('key',inplace=True) df1.update(df2.set_index('key')) df1.reset_index() df1的列顺序更改为：密钥受让人id issuetype 用一个数据帧更新另一个数据帧后，如何恢复初始结构？谢谢。

浏览 20提问于2020-09-10得票数 2

回答已采纳

1回答

面向对象的数据帧转换设计

python、pandas、oop

我正在尝试将面向对象的设计应用到我的数据科学项目中。对于数据清理，我们通常从一个表(Dataframe)开始，然后对这个dataframe进行转换(例如，基于现有列创建一个新列，将两个列相加在一起等等)。我最初的想法(在python中)基本上是创建一个类数据，其中包含一个底层的熊猫数据作为私有成员，并在类中提供额外的方法来转换数据。在我走到这一步之后，我在想：，我做面向对象的编程是为了做它吗？这与仅仅用纯熊猫编写代码而忘记创建我自己的类相比，有什么好处吗？ class Data: def __init__(self, df): self._df = df

浏览 4提问于2021-05-15得票数 2

1回答

Python数据中的插值

python、pandas、dataframe、interpolation

我试图在Python中执行线性插值，以便根据某一列中的某些值计算插值值。在下面的示例中，我希望使用插值中高度列中相关单元格的实际数值来插值产品"a“和"b”的测量值。我可以称高度列为插值的索引吗？当我插值乘积"a“的缺失测量值时，用于插值的索引值为4、5和7。对于乘积"b”的插值，使用的索引值为1、2.2和3。我知道dataframe.interpolate()，但我很难修改代码以使用正确的索引值。下面是我开始使用的dataframe的代码： import pandas as pd testdata1 = [('Product', [&#

浏览 5提问于2017-08-11得票数 1

回答已采纳

2回答

在数据帧中创建新列，将现有列传递给SQL函数

python、pandas、dataframe

我有一个数据框，其中包含作为列的名称。我有一个DB语句，它在传递名称时返回FIRST_NAME。我正在编写一个python脚本，如下所示： def fname(row): cursor.execute(select case when df['name'] = fname then fname else blank end as fname from dual;) return cursor.fetchone()[] df[fname]=df.apply(fname) 它似乎抛出了“期望第一个参数是字符串或unicode” 如何将name值逐个传递给上面的函数，并将其

浏览 5提问于2020-04-18得票数 0

1回答

Bigquery Python API -编写dataframe order by column

python、google-cloud-platform、google-bigquery、google-api-python-client

我正在尝试使用Python API向Bigquery编写一个pandas.Dataframe，按列对记录进行排序： from google.cloud import bigquery client = bigquery.Client(project=project_id) df = pd.DataFrame(...) df.sort_values('date', inplace=True) job_config = bigquery.LoadJobConfig( schema=[ bigquery.SchemaField("date

浏览 17提问于2021-06-30得票数 0

2回答

大熊猫在大型数据平台上的GroupBy

python、pandas、dataframe

我有一个包含150列的dataframe。在150列中，有15列类型为string，其余都是浮动列。 dataframe包含15个字符串列组合的相同记录，rest中的值可能不同。我想在这15个字符串列上做groupby，并对所有浮动列做一个和。如何在Python中轻松地做到这一点，而无需指定groupby语句中每个列的名称，因为dataframe是巨大的。

浏览 1提问于2019-09-22得票数 0

回答已采纳

1回答

函数来更改不工作的列的数据类型。

python、pandas

我编写了一个python函数来接受一个dataframe的列，检查数据类型，以及它是否是对所需数据类型的错误更改。但是，这些更改只发生在函数内部。如何解决这个问题，以便对dataframe进行永久更改？ def change_required_data_type (column,data_type): is_correct = None for i in column: if type(i) != data_type: is_correct = False if is_correct != False: pr

浏览 1提问于2019-07-08得票数 0

回答已采纳

1回答

使用排序索引将Python写入Excel

python、sorting、dictionary、export-to-excel

我已经编写了python代码，并且我正在尝试将一个矩阵写入Excel。我已经用python创建了一个字典，并且我使用DataFrame来构造矩阵。问题是，python中的字典不能排序。因此，当我写入Excel时，我得到一个没有排序的矩阵。 from pandas import DataFrame import pandas as pd list = ['6M', '1yr', '2yr', '10yr', '30yr'] Corr = {} for line in list: for line2 in

浏览 1提问于2015-12-15得票数 0

2回答

如何使用Python DataFrame检查A列的内容是否包含在B列中？

python、pandas、dataframe

我在熊猫DataFrame中有两个专栏：authors和name。我想创建第三列:如果相应行的name包含在相应行的authors中，则单元格的值为False，否则为False。因此，结果将看起来像下面的图片。我尝试过.str.contains()、.str.extract()、.str.find()、.where()等，但是Python返回了一个错误：'Series‘对象是可变的，因此它们不能被散列。有人知道如何在Python中创建第三列吗？

浏览 5提问于2016-04-29得票数 3

回答已采纳

1回答

指定列，同时将冰雪公园Python Dataframe追加到表

snowflake-cloud-data-platform、snowpark

所以现在，我使用Python中的session.createDataFrame()创建了一个Dataframe。其目的是将此Dataframe附加到雪花中现有的表对象中。但是，源dataframe的架构与目标表的模式不完全匹配。在斯诺dataframe中，DataFrameWriter对象具有option() 方法，该方法允许指定列顺序，因此允许跳过数据文件中的列，因为列的名称可以匹配。然而，斯诺公园Python目前还缺少option() for DataframeWriter。这迫使雪花查找模式和列数(源和目标之间)匹配，否则会引发错误。还不确定Python的斯诺Python何时会收到

浏览 12提问于2022-08-28得票数 2

1回答

如何检查字符串中的任何单词在Pandas中是否有特殊的字符和条件

python、pandas

我有一个dataframe，其中一个列包含一个tweet。我想要得到这个dataframe的行，其中这个"tweet“列包含任何以"#”开头并且有2个或更多大写字母的单词。因此，例如，我想撤回这样的行：我喜欢用python编写代码。CodingSession 我不再害怕#COVID19 19了。然而，在我的条件下，这些分类是不可能的：我喜欢用python编写代码。#编码#会话我喜欢用python编写代码。#编码会议我不再害怕#Covid19 19了。

浏览 4提问于2022-02-11得票数 1

回答已采纳

2回答

R通过比较两个dataframe列插入行

r、dataframe

我有一个数据框架，其中有两列(语言、文章)作为列标题，另一个数据框架的列标题是language和count。我想迭代第一个dataframe，如果第一个dataframe的language列中的值与第二个dataframe中language列的值匹配。我想将文章列的值插入到第二个dataframe中。 language articles 1 en 4200596 2 de 1571581 3 fr 1369891 4 nl 1405514 5 it 1020971 6 es 981124 lang

浏览 0提问于2013-04-04得票数 1

回答已采纳

4回答

如何通过引用修改Pandas DataFrame？

python、pandas、data-science

我正在尝试编写一个Python函数，它可以就地执行一次热编码，但最后我在找到一种方法来就地执行连接操作时遇到了麻烦。它似乎为concat输出生成了我的DataFrame的副本，并且我无法将它分配给我通过引用传递的DataFrame。如何做到这一点？ def one_hot_encode(df, col: str): """One-Hot encode inplace. Includes NAN. Keyword arguments: df (DataFrame) -- the DataFrame object to modify

浏览 18提问于2019-11-18得票数 0

2回答

如何缩放除上一列之外的所有列？

python、pandas、scikit-learn

我使用python 3.7.6。我在研究分类问题。我想缩放我的数据框架(df)功能列。dataframe包含56个列(55个特征列，最后一个列是目标列)。我想要缩放功能列。我是这样做的： y = df.iloc[:,-1] target_name = df.columns[-1] from FeatureScaling import feature_scaling df = feature_scaling.scale(df.iloc[:,0:-1], standardize=False) df[target_name] = y 但这似乎并不有效，因为我需要重新创建dataframe (

浏览 2提问于2020-04-02得票数 4

回答已采纳

1回答

通过R的网格化用python编写一个lambda函数

r、reticulate

我正在尝试编写一个简单的python函数，比如将一列中的每一项都加5，但是我无法在R环境中定义一个python函数。可以在这里定义一个Python函数吗？ library(magrittr) library(dplyr) library(reticulate) os <- import('os') pd <- import('pandas', convert = F) np <- import('numpy', convert = F) a <- pd$Series(data = c(1, 2, 3)) b <

浏览 2提问于2017-03-18得票数 0

2回答

如何相互合并两个矩阵？

在用编写代码时，我还面临着另一个问题.我有两个dataframes (行数和冒号相同)。现在我想把它们合并成一个，但是dataframe 1的6列将是新矩阵中的1,3,5,7,9.11列；而数据框架2的列在新合并的dataframe中是2,4,6,8,10,12列。我可以用for循环来完成它，但是有没有更聪明的方法/功能来完成它呢？(预先谢谢你；)

浏览 2提问于2022-09-27得票数 0

2回答

如果Dataframe元素在列表中，则删除它们

python、pandas、list、dataframe、compare

我请求您帮助我编写Python脚本的一部分:我有一个包含4列的dataframe： keyword impressions clicks ctr 0 About 1.0 0.0 0.000000 1 Achat 12.0 2.0 16.6666667 2 Action 1.0 0.0 0.000000 3 Adele 14.0 1.0 7.14285714

浏览 8提问于2021-05-27得票数 0

回答已采纳

1回答

创建一个函数，将数据帧的所有列作为r中的输入。

r、function

我有两个数据框架：“临床”和表达式“” “临床”数据包含关于乳腺癌(rows)患者各种临床参数(列)的数据。“表达”包含关于乳腺癌(rows)患者表达基因水平(列)的数据。“表达式”dataframe中的列名是各种"gene.ID"。这两个数据文件都有相同的病人(行)，并且仅在列中彼此不同。但是，每个dataframe中的行与其他dataframe的顺序并不完全相同。我想测试和标出某一基因表达水平与队列中个体临床参数之间的相关性。为了做到这一点，我试图创建一个函数：(1)接收这些数据和特定基因的gene.ID；(2)提取该基因的表达模式；(3)从两个数据中匹配患者；(4)

浏览 1提问于2016-12-20得票数 0

4回答

pandas数据帧中的自定义排序

python、pandas

我有python pandas dataframe，其中一列包含月份名称。如何使用字典进行自定义排序，例如： custom_dict = {'March':0, 'April':1, 'Dec':3}

浏览 0提问于2012-12-12得票数 114

回答已采纳

2回答

为什么熊猫的数据栏顺序会自动更改？

python、pandas、dataframe

当我将结果输出到CSV文件时，我生成了一个熊猫数据。但是dataframe列顺序会自动改变，我很好奇为什么会发生这种情况？问题图像:

浏览 3提问于2016-12-21得票数 2

回答已采纳

1回答

理解Python中的变量范围和更改

python、function、pandas

我正在使用Python3.6和Pandas 0.20.3。我肯定这件事一定要在某个地方解决，但我似乎找不到。我通过添加列来修改函数中的dataframe；然后将dataframe还原到原始列。我不回数据。添加的列保持不变。如果我在函数中添加列，并且它们不是永久的，并且更新dataframe不起作用，我可以理解。我也会理解，如果添加列改变了数据格式，而分配数据帧也被卡住了。以下是代码： import numpy as np import pandas as pd df = pd.DataFrame(np.random.randn(10, 5)) df 这给 0

浏览 3提问于2017-10-02得票数 0

回答已采纳

1回答

如何在Dataframe火花中添加按ID分组的索引

scala、apache-spark、dataframe、apache-spark-sql

我有这个数据 +---------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+---------------+ |_id |details__line_items

浏览 1提问于2019-06-25得票数 2

回答已采纳

2回答

熊猫-栏排序更改

python-3.x、pandas、columnsorting

我试图将csv文件集合并到一个Dataframe中。在此过程中，我创建了一个名为Time_Created的新列，作为Dataframe的第一列。 df_v1 = pd.concat([pd.read_csv(f) for f in updatedfiles_1], sort=True) cols = df_v1.columns.tolist() print(cols) cols.insert(0, cols.pop(cols.index('Time_Created'))) print(cols) <-- This shows the columns as expecte

浏览 0提问于2018-10-29得票数 0

回答已采纳

1回答

基于另一列中的文本在pandas中创建列

python、pandas、string、dataframe

我在python中有一个pandas Dataframe，它有一个名为"Description“的列，其中包含一组由"\n”分隔的文本元素。我想通过拆分文本元素在相同的Dataframe中创建新列。例如，我有： Description '\nA: Elephant\nB: Cats\nC:Dog' 我想用关联的元素获得相应的列数，如下所示： Description A B C '\nA: Elephant\nB: Cats\nC:Dog' Elephant

浏览 11提问于2021-01-21得票数 0

1回答

变量用于不同任务时的Python内存使用情况

python、memory-management

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

2回答

将(row)函数应用于DataFrame会更改列类型

python、pandas

对列类型的意外更改有问题，如下所示。列x是浮点数，列icol是整数。当应用测试函数(不执行任何操作)时，列icol将更改为类型float64，如以下代码所示： df = pd.DataFrame({'x':[1000, -1000, 1.0]}) df['icol'] = 1 print(df.dtypes) def testfunction(r): pass return(r) df = df.apply(testfunction, axis='columns') print(df.dtypes) 但是，如果我

浏览 20提问于2020-01-24得票数 2

回答已采纳

1回答

自更新以来，Spyder中数据格式的列标题非常小

spyder

我一直在为Python使用Spyder，而且自从更新以来，变量资源管理器中的dataframe列标题非常小，我不知道如何更改它。在更新之前，大小是很好的。这是一个截图知道我能怎么改变吗？

浏览 6提问于2021-12-15得票数 1

3回答

熊猫改变栏的顺序

python、pandas、dictionary、dataframe

在我的项目中，我使用的是烧瓶，我得到了一个JSON (由REST )，它包含我应该转换成熊猫Dataframe的数据。JSON看起来像： { "entity_data":[ {"id": 1, "store": "a", "marker": "a"} ] } 我得到JSON并提取数据： params = request.json entity_data = params.pop('entity_data') 然后我把数据转换成熊猫的

浏览 0提问于2018-12-25得票数 3

回答已采纳

7回答

如何更改火花数据中的列位置？

scala、apache-spark、dataframe、apache-spark-sql

我想知道是否可以更改列在dataframe中的位置，实际上是否可以更改架构？准确地说，如果我有一个像[field1, field2, field3]那样的数据文件，并且我想得到[field1, field3, field2]。我不能放任何代码。让我们想象一下，我们使用的是一个有100列的dataframe，经过一些联接和转换之后，其中一些列对于目标表的模式是错误的。如何移动一个或多个列，即:如何更改架构？

浏览 4提问于2016-06-29得票数 47

回答已采纳

1回答

用Numba处理熊猫DataFrame时序的有效方法

python、python-2.7、pandas、numba

我有一个1,500,000行的DataFrame。这是我从QuantQuote.com那里买来的一分钟的股市数据。(打开，高，低，关闭，音量)。我正试图对股市交易策略进行一些自制的回溯测试。直接的python代码处理事务太慢了，我想尝试使用numba来加快速度。问题是。谷歌搜索发现，有关熊猫使用numba的信息少得令人吃惊。这让我想知道我是不是在考虑这个错误。我的设置是Numba 0.13.0-1，Pandas 0.13.1。Windows 7，MS VS2013 with PTVS，Python2.7，Enthought 我现有的Python+Pandas内部循环具有以下一般结构计

浏览 1提问于2014-05-13得票数 16

3回答

Python ValueError : ColumnTransformer，列排序不是相等的

python、pandas、scikit-learn、data-science

编制了以下功能:读取csv，训练模型，预测请求数据。我得到了以下ValueError :对于fit和transform，列排序必须相等，当使用RE余物关键字时训练数据和用于预测的数据的列数完全相同，例如15列，我不知道列的“排序”会如何改变。 ~/.local/lib/python3.5/site-packages/sklearn/pipeline.py in predict(self, X, **predict_params) 417 Xt = X 418 for _, name, transform in self._iter(with_

浏览 5提问于2020-04-02得票数 3

回答已采纳

1回答

如何在r中编写用户定义的函数？

假设表中有2列数量整数十进制我想要计算第三列的值，名为“总计”。在Server的transact-sql中，我可以简单地编写 select Price*Quantity as Total from mytable 或者，我可以编写一个使用过的定义函数CalcTotal，然后编写 select calcTotal(quantity,price) as total from mytable 如何在R中编写函数以将类似的列添加到dataframe中？我试图提出我的问题

浏览 5提问于2020-11-09得票数 0

回答已采纳

1回答

如何在Scala中合并三个DataFrame

scala、apache-spark、dataframe、merge

如何在Spark-Scala中合并3个DataFrame？我完全不知道如何才能做到这一点。在stackOverFlow上我找不到类似的例子。我有3个类似的DataFrames。列名相同，列数相同。差异只是行上的一个值。 DataFrame1： +----+------+----+---+ |type| Model|Name|ID | +----+------+----+---+ | 1 |wdasd |xyzd|111| | 1 |wd |zdfd|112| | 1 |bdp |2gfs|113| +----+------+----+---+ DataFrame2： +---

浏览 1提问于2018-03-15得票数 3

回答已采纳

2回答

是否可以在Javascript或Python中实现类似于R中的“非标准评估”？

javascript、python、r、pandas、dataframe

在R中，您可以编写允许参数为预定义对象的未引号属性的函数。例如，DataFrame对象的接口允许以下内容： # df has columns "A" and "B" df = mutate(df, C=A*B) 现在，df有了一个新的列"C“，它是列"A”和"B“的乘积。还有未引用的“公式”类型： lm(data=df, A~B) 这个“非标准评估”。是否可以在Javascript或Python中执行类似的操作。

浏览 0提问于2019-06-17得票数 8

1回答

熊猫聚集在所有栏上

python、pandas

Python 3和熊猫0.23 我有一个带有2000列的DataFrame，需要根据每一列的一些汇总统计数据进行一些变量消除。测试数据： data = pd.DataFrame({ 'a': np.random.normal(0, 2, 10), \ 'b': np.random.normal(0, 2, 10), \ 'c': np.random.normal(0, 2, 10) \ }) 作品： data.aggregate(['min','max', 'nunique

浏览 2提问于2018-07-10得票数 2

回答已采纳

1回答

Azure数据库.对Az SQL表的写入

python-3.x、azure-databricks

我正在将一个.parquet (来源于MySql)文件作为DataFrame读入Databricks，并希望将少数列数据类型转换为DataFrame数据类型。示例：在本例中，希望将列active和is_agent转换为SQL DataType位，并将其写回新的数据框架。我想循环遍历数据帧中的所有列，并在源列数据类型为Byte的情况下应用上述强制转换。如何使用Python实现这一点。

浏览 2提问于2020-04-21得票数 0