dataframe中的单列需要分解为3列_在pyspark中创建包含单列元组的dataframe_需要访问Thymleaf中的简单列表 - 腾讯云开发者社区

python、pandas

当从pandas DataFrame (比如df.iloc[:, 0]、df['A']或df.A等)中选择单个列时，生成的向量将自动转换为序列而不是单列DataFrame。但是，我正在编写一些以DataFrame作为输入参数的函数。因此，我更喜欢处理单列DataFrame，而不是系列，这样函数就可以假定df.columns是可访问的。现在，我必须使用像pd.DataFrame(df.iloc[:, 0])这样的东西显式地将该系列转换为DataFrame。这似乎不是最干净的方法。有没有一种更优雅的方式直接从DataFrame索引，这样结果就是单列DataFrame而不是系列？

浏览 4提问于2013-05-28得票数 114

回答已采纳

3回答

如何在DataFrame中创建单列sparkR？

r、sparkr

如何在DataFrame中创建单列SparkR？假设我们有下面的列x，我如何从它创建一个DataFrame？ ## Assumes a running sparkR shell data("ChickWeight") cwDF <- createDataFrame(sqlContext, ChickWeight) x <- cwDF$Chick 似乎有一个通用的toDF函数，但没有方法。知道如何将x转换为单列DataFrame对象吗？

浏览 0提问于2015-12-15得票数 0

回答已采纳

1回答

确定对象是字符串还是数据string

python、dataframe

我有一些变量和单列数据。我正试着把它们安排成一个数据集。问题是，有些是单字符串，一些是单列数据，我试图遍历它们，所以我必须对不同的类型使用不同的方法。我尝试了以下方法来确定是否传递了单个字符串或数据帧。 data = {'Column Name': ['First value', 'Second value']} a_dataframe = pd.DataFrame (data, columns = ['Column Name']) a_single_string = 'text' another_str

浏览 2提问于2021-02-23得票数 0

回答已采纳

2回答

使用lower函数在文本清理中将pyspark dataframe中的单个列中的值转换为小写

python、pyspark

尝试使用.lower函数将pyspark dataframe单列中的值转换为小写，以便进行文本清理 import pyspark.sql.functions as f f.lower(f.col(col("subject")).show() 获取： SyntaxError: unexpected EOF while parsing

浏览 0提问于2019-02-21得票数 0

1回答

Pandas -将具有多个值的行拆分为新行

pandas

我有一个单列的Dataframe。其中一些行有多个用逗号分隔的值。我希望每行只有一个值。下面是我的Dataframe的样子： 0,apples 1,bananas 2,oranges,kiwis 预期输出： apples bananas oranges kiwis

浏览 7提问于2019-04-01得票数 0

1回答

重新排序dataframe列

python、csv、pandas

是否有办法从txt-文件中订购Pandas数据文件中的列： pandas.DataFrame.read_table 例如，从csv文件中，使用： pandas.DataFrame.to_csv 中可以传递订单列。 columns 或者一般情况下，是否有一种重新排序dataframe列的方法？也许使用.ix模块？

浏览 2提问于2014-07-15得票数 1

回答已采纳

2回答

如何在单列的python中用100替换20%的随机行值？

python-3.x、pandas、ipython

如何在dataframe的单列(评级)中用100替换20%的随机行值？

浏览 0提问于2019-10-27得票数 1

回答已采纳

1回答

为什么我得到的潘达斯数据帧只有一列vs系列？

python、pandas、dataframe、series

我注意到了几次单列数据帧(下面的例子)；但在其他大多数情况下，单列数据框架只是一个系列。对于为什么返回一列DF，有什么押韵或理由吗？示例： 1)当用布尔掩码索引列时，掩码只有一个真值 df = pd.DataFrame([list('abc'), list('def')], columns = ['foo', 'bar', 'tar']) mask = [False, True, False] type(df.ix[:,mask]) 2)当对只有两列的DataFrame设置索引时，首先： df = pd.Data

浏览 5提问于2014-09-18得票数 5

回答已采纳

3回答

朱莉娅-如何将DataFrame转换为数组？

arrays、dataframe、julia

我有一个只包含数值的DataFrame。现在，我想要做的是将这个DataFrame的所有值提取为一个数组。我该怎么做呢？我知道对于单列，如果我执行df[!,:x1]，那么输出就是一个数组。但是，如何对所有列执行此操作？

浏览 70提问于2020-12-21得票数 5

回答已采纳

2回答

熊猫数据帧列表，但忽略列名

python、pandas、rbind

副标题:让熊猫哑口无言，别再试图变得聪明了。我有一个单列熊猫数据帧的列表(res)，每个都包含相同类型的数字数据，但每个都有不同的列名。行索引没有任何意义。我想把它们放在一个单一的，非常长的，单列数据框架中。当我执行pd.concat(res)时，每个输入文件都会得到一列(以及加载和加载NaN单元格)。我尝试过参数(*)的各种值，但没有一个能达到我想要的效果。编辑:样本数据： res = [ pd.DataFrame({'A':[1,2,3]}), pd.DataFrame({'B':[9,8,7,6,5,4]}), pd.Data

浏览 5提问于2016-12-19得票数 7

回答已采纳

1回答

如何从可变长度列表创建Pandas DataFrame

python、pandas、list

我想从可变长度的列表中创建一个单行pandas-DataFrame： data = [x1, x2, x3, ...]，其中xis是整数。我尝试过使用df=pd.DataFrame(data)，但我得到的数据帧是单列多行的，而不是一行多列的。

浏览 2提问于2020-12-02得票数 0

7回答

如何用Python创建示例单列星火DataFrame？

python、apache-spark、pyspark、apache-spark-sql

我想要创建一个示例单列DataFrame，但是下面的代码不起作用： df = spark.createDataFrame(["10","11","13"], ("age")) ## ValueError ## ... ## ValueError: Could not parse datatype: age 预期结果： age 10 11 13

浏览 10提问于2017-12-06得票数 31

回答已采纳

3回答

在pandas中如何将单列数据拆分成多列？

python、pandas

我有以下数据框 # import Pandas as pd import pandas as pd # create a new data frame df = pd.DataFrame({'Name': ['1234567 A: John Larter 123456 451151515 A: Robert Junior 4646466 9865513 A: Jonny Depp 9456561'], }) df 所有数据都堆积在单列上。我需要在sepearte列中每个A:之后获取数据预期的DataFrame

浏览 26提问于2020-03-21得票数 0

2回答

对Panda的数据框中的列求和，其中每个单元格值都是一个列表

python、pandas、sum

我有一个类似于下面示例的单列Dataframe： import pandas df = pandas.DataFrame({'Column': [[10, 100],[20, 200],[30, 300]]}) Column 0 [10, 100] 1 [20, 200] 2 [30, 300] 如何逐个元素地添加行，以使结果为： Column 0 [60, 600]

浏览 7提问于2020-11-04得票数 0

回答已采纳

2回答

Dataframe，只保留一列

pandas、dataframe

我找不到从多列DF返回单列Dataframe的pandas函数。我需要drop([''])的完全相反的函数。有什么想法吗？

浏览 5提问于2017-08-17得票数 6

回答已采纳

4回答

从DataFrame中提取单个火花值

scala、apache-spark、apache-spark-sql

我有一个Spark查询，它保证返回具有单个Int值的单列。从结果DataFrame中提取作为Int的值的最佳方法是什么？

浏览 0提问于2015-08-12得票数 50

回答已采纳

1回答

比较两列以在Spark DataFrame中创建新列

python、pyspark、apache-spark-sql

我有一个有2列的Spark DataFrame，我正在尝试创建一个新列，使用when otherwise操作的另外两列。 df_newcol = df.withColumn("Flag", when(col("a") <= lit(ratio1) | col("b") <= lit(ratio1), 1).otherwise(2)) 但是这会抛出一个错误 ValueError: Cannot convert column into bool: please use '&' for 'and',

浏览 5提问于2018-01-23得票数 4

回答已采纳

2回答

如何使每个列从一个单独的文件中合并起来，而不是在每个df下对齐？

pandas

试图将单列dfs附加到一次csv。代表旧dfs的每一列。不知道如何阻止dfs在csv文件中堆叠。 master_df = pd.DataFrame() for file in os.listdir('TotalDailyMCUSDEachPool'): if file.endswith('.csv'): master_df = master_df.append(pd.read_csv(file)) master_df.to_csv('MasterFile.csv', index=False)

浏览 6提问于2022-01-03得票数 2

3回答

R:在字符串中显示匹配的特殊字符

r、regex、gsub

如何在单列dataframe的每一行中显示哪个特殊字符是匹配的？样本数据： a <- data.frame(name=c("foo","bar'","ip_sum","four","%23","2_planet!","@abc!!")) 确定字符串是否具有特殊字符： a$name_cleansed <- gsub("([-./&,])|[[:punct:]]","\\1",a$name) #\\1 puts back th

浏览 8提问于2020-04-22得票数 1

回答已采纳

1回答

为什么在Pandas.DataFrame上使用Pandas.DataFrame

pandas

什么时候应该在一列Pandas.Series上使用Pandas.DataFrame？我觉得单列dataframe提供了更多的灵活性，所以也许这只是一个什么时候这种灵活性可能会带来更大的伤害而不是好处的问题？有什么性能问题我应该考虑吗？

浏览 2提问于2014-06-23得票数 1

回答已采纳

1回答

将循环的结果组合到DataFrame中

python、pandas、dataframe、append

使用Python 0.19.1。我在循环中调用一个函数，它每次返回长度为4的数字列表。将它们连接到DataFrame中最简单的方法是什么？我要这么做： result = pd.DataFrame() for t in dates: result_t = do_some_stuff(t) result.append(result_t, ignore_index=True) 问题是它沿着列连接，而不是按行连接。如果dates的长度为250，那么它将给出一个包含1000行的单列df。相反，我想要的是一个250 x 4 df。

浏览 5提问于2016-11-14得票数 1

回答已采纳

1回答

如何在熊猫数据栏中获得第一个值

python、pandas

我有一个带有单列的熊猫数据，该列有多个值。我想得到第一价值。下面是列name= A的dataframe示例，我希望在输出中获得值abc，XYZ。我怎么能这么做？ A abc, 123, 888 XYZ, 789, 999

浏览 2提问于2022-02-16得票数 2

回答已采纳

1回答

添加单个多索引列值

python、pandas

在附加的dataframe中，我想对"count“列下的所有值求和，并将其存储在一个名为"CC”的新列中，即： df['CC'] = [620,764] 我只想在单列中执行此操作。我试着跟踪，但没有运气。 df['count'].sum(level=0,axis=1) enter image description here

浏览 17提问于2021-04-16得票数 0

1回答

如何使用python绘制python中的多索引数据？

python-2.7、pandas、plot、ipython、dataframe

我有多个索引的数据单列。我想要根据数据绘制堆叠条形图。数据如下： df= pd.DataFrame(index=pd.MultiIndex([[1,2,3],['open','closed']],[[0,0,1,1,2,2],[0,1,0,1,0,1]])) df['id']=[23,6,12,4,31,16] df id state 1 closed 23 open 6 2 closed 12 open 4 3 closed 31 open 16

浏览 2提问于2015-09-07得票数 4

回答已采纳

3回答

如何删除整个python dataframe列中的多余空白

python、pandas、dataframe

在一个dateframe(所有列)中删除所有多余的空白空间的pythonic方法是什么？我知道.str.strip()方法可以用于单列或每列。dataframe作为这样的许多列，我想将该方法应用于整个dataframe。空格发生在不同的点，文本的开头，中间和结尾。附件是在移除空格之前和之后的dataframe外观。下面的数据是预期的结果。我已经搜索过了，我遇到的大部分相关问题都是为了一个专栏。样本数据 import pandas as pd data = [[' James Brown ', '10', 'USA'], [

浏览 13提问于2022-01-19得票数 0

回答已采纳

2回答

如何合并列表的一列，提取唯一的字符串值，放入dataframe中

python、pandas、list、dataframe

快疯了，找不出哪里出了问题。有一个带有dataframe的文件，由单列组成，每一行由一个列表组成。我迷路了，请指教 fruits 0 ['apple', 'orange','grape'] 1 ['apple','pineapple','coconut'] 预期@ fruit 0 apple 1 coconut 2 grape 3 orange 4 pineapple

浏览 2提问于2019-09-05得票数 0

回答已采纳

4回答

熊猫系列和单列DataFrame之间的区别是什么？

python、pandas

为什么熊猫要区分Series和单列DataFrame 换句话说：Series类存在的原因是什么？我主要使用带有datetime索引的时间序列，这可能有助于设置上下文。

浏览 34提问于2014-09-26得票数 208

回答已采纳

1回答

在哪里存储大型熊猫数据帧(由webapp应用程序消耗)？

python、pandas、flask

我有一个5 5GB的Dataframe (有数千列)，每次用户在我的web应用程序中输入时，我都会从这个Dataframe中加载和抓取一列，并返回一些计算。我的前端是Vue应用程序，后端是Flask。 Dataframe是一个很大的矩阵，所以它超出了数据库的列限制(至少是我尝试过的)。我可以在哪里存储这个Dataframe，以便能够快速加载它？

浏览 0提问于2021-01-10得票数 0

1回答

Dataframe操作拼接

pandas、dataframe

我有一个没有标头的单列dataframe，我想将它分成多个列，如下所示- 1 2 3 4 5 . . 100 我想把它代表成- 1 6 .. .. 96 2 7 .. .. 97 3 8 .. .. 98 4 9 .. .. 99 5 10 .. .. 100

浏览 4提问于2022-05-13得票数 -1

回答已采纳

3回答

将一个数据帧追加到另一个数据帧中

python、pandas、dataframe

我希望将三个数据帧合并为一个具有单列的.All数据帧。 org_city_id=p.DataFrame(training_data['origcity_id']) pol_city_id=p.DataFrame(training_data['pol_city_id']) pod_city_id=p.DataFrame(training_data['pod_city_id']) 所有这些都有100条记录，所以我的目标是将它们放入单个数据框中，然后包含300条记录.My下面的代码不起作用 org_city_id.append([pol_city_id

浏览 4提问于2016-09-03得票数 5

回答已采纳

1回答

将函数应用于Pandas引发的AttributeError中的列

python-3.x、pandas、dataframe、apply

我有下面的dict和熊猫DataFrame。 sample_dict = {'isDuplicate': {'1051681551': False, '1037545402': True, '1035390559': False}, 'dateTime': {'1051681551': Timestamp('2019-01-29 09:09:00+0000', tz='UTC'), '10375454

浏览 4提问于2020-07-04得票数 0

回答已采纳

1回答

初值熊猫累积

python、pandas、cumsum

因此，给定以下单列数据框架： from pandas import DataFrame df = DataFrame({0: {'10/10/2012': 50, '10/11/2012': -10, '10/12/2012': 100}) In [3]: df Out[3]: 0 10/10/2012 50 10/11/2012 -10 10/12/2012 100 我想为给定的列创建一个累积和，但是给累加器一个初始值。因此，对于上面的dataframe和初始值为100的数据，如下所示

浏览 2提问于2015-10-03得票数 1

回答已采纳

2回答

熊猫:填写已在列中的特定有序值的缺失索引。

python、pandas、dataframe

我提取了一个具有特定值的单列数据。下面是dataframe的样子： Commodity 0 Cocoa 4 Coffee 6 Maize 7 Rice 10 Sugar 12 Wheat 现在，我想分别用列中的值填充每个没有值的索引，所以它应该如下所示： Commodity 0 Cocoa 1 Cocoa 2

浏览 1提问于2017-04-14得票数 3

回答已采纳

3回答

Python将逗号分隔列表转换为pandas dataframe

python、csv、pandas

我正在努力将逗号分隔的列表转换为多列(7)数据帧。 print (type(mylist)) <type 'list'> Print(mylist) ['AN,2__AAS000,26,20150826113000,-283.000,20150826120000,-283.000', 'AN,2__AE000,26,20150826113000,0.000,20150826120000,0.000',......... 下面创建了一个单列的框架： df = pd.DataFrame(mylist) 我已经检查了P

浏览 0提问于2015-08-26得票数 21

回答已采纳

2回答

分组数据的多索引过滤

python、pandas-groupby、multi-index

我有一个熊猫数据框架，其中我做了一个groupby。groupby结果如下所示： ? 正如你所看到的，这个数据帧有一个多级索引('ga:dimension3'，'ga:data')和一个单列('ga:sessions')。我希望使用索引的第一级('ga:dimension3')和每个第一级索引值的第一个日期创建一个dataframe： ? 我想不出该怎么做。感谢您的指导。提前谢谢。

浏览 10提问于2021-01-18得票数 1

回答已采纳

3回答

在Python中追加/连接单个列中的所有行

python、arrays、python-3.x、list、dataframe

对于上下文:我有多个数据集文件，每个文件都属于单个维度；目标:为此，我尝试获取单列数据集中一个Dataframe的所有行，如下所示 ? 将所有行放在一列中。我有以下几行代码 a = [] for x in range (5): np_df = df_D1.loc[x] a.append(np_df) 它给出的结果如下所示 ? 但我想要这样的结果。 ? 这有点简单，感觉有点愚蠢，有点卡在这里了。

浏览 28提问于2020-09-22得票数 1

回答已采纳

1回答

传递什么Pandas数据类型来在一个组中转换或应用

python、pandas

在尝试调试groupby函数应用程序时，我使用一个虚拟函数来为每个组“查看传递给函数的内容”的。当然，我在玩游戏： import numpy as np import pandas as pd np.random.seed(0) # so we can all play along at home categories = list('abc') categories = categories * 4 data_1 = np.random.randn(len(categories)) data_2 = np.random.randn(len(categories)) df

浏览 5提问于2013-12-19得票数 6

回答已采纳

1回答

如何合并熊猫中的多列值？

python、pandas

我有个数据： data = {'Wavelength Band1': [410, 411, 412], 'Band1': [0, 0, 0], 'Wavelength Band2': [500, 501, 502], 'Band2': [0, 0.0007, 0.0021], 'Wavelength Band3': [730, 745, 750], 'Band3': [0.0023, 0.0046, 0.007]} df = pd.DataFrame(data=da

浏览 3提问于2020-02-05得票数 2

回答已采纳

3回答

根据Python中的嵌套列表从dataframe获取值

python、python-3.x、pandas、dataframe、nested-lists

浏览 9提问于2022-05-11得票数 0

回答已采纳

2回答

将pandas DataFrame列追加到CSV

python、csv、pandas

我正在尝试向现有的CSV添加一个pandas DataFrame (单列)，就像一样，但它不起作用！相反，我的列被添加到csv的底部，并反复重复( csv >> size of column中的行)。下面是我的代码： with open(outputPath, "a") as resultsFile: print len(scores) scores.to_csv(resultsFile, header=False) print resultsFile 终端输出：4032 <open file '/Users/alavin/nt

浏览 5提问于2015-01-09得票数 8

回答已采纳

1回答

从2-d numpy数组中创建带有单个向量列的Pandas DataFrame

python、pandas、numpy

我有一个numpy 2D数组： arr = [ [10, 20], [30, 40] ] 用pd.DataFrame(arr)把它转换成熊猫的数据给了我： 0 1 0 10 20 1 30 40 我在找这样的东西： 0 0 [10, 20] 1 [30, 40] 我可以用 df.agg(lambda x: np.array(x), axis="columns") 或 df.agg(lambda x: [y for y in x], axis="columns") 但是，是否有更好的方法来结束单列dataframe呢？

浏览 0提问于2021-12-20得票数 1

回答已采纳

2回答

字符串的DataFrame

python、pandas、dataframe、stringio

import sys if sys.version_info[0] < 3: from StringIO import StringIO else: from io import StringIO import pandas as pd TESTDATA = StringIO(txt) df = pd.read_csv(TESTDATA,names=['col1']) 哪里 txt="The lion (Panthera leo) is a species in the family Felidae;it is a muscular, deep-

浏览 41提问于2019-05-06得票数 1

1回答

需要根据索引合并多个行

python

我有一个dataframe，值如下 0 1 2 a 5 NaN 6 a NaN 2 NaN 需要根据索引'a‘组合两行的输出，这两行在两行中是相同的还需要添加多个列，并作为单列输出需要如下所示的输出。添加5 2 6后的值13 0 a 13 尝试使用concat函数执行此操作，但遇到错误

浏览 1提问于2019-12-17得票数 0

2回答

使用一行pandas命令将列连接到单个数据帧中

python、pandas

我有33个单列，每个列都作为一个数据帧工作： col1_df、col2_df、col3_df....col33_df 如何将它们连接到一个数据帧中？我的代码是 df = [col1_df, col2_df....col33_df], but the return is not a dataframe 有没有一个熊猫路线可以解决这个问题？

浏览 12提问于2021-01-12得票数 1

1回答

在熊猫数据中创建可读字符串

python、pandas

我有一个单列数据： col1 1 2 3 4 我需要创建另一个列，它将是一个字符串，如下所示： Result: col1 col2 1 Value is 1 2 Value is 2 3 Value is 3 4 Value is 4 我知道格式化字符串，但不确定如何在dataframe中实现它。

浏览 1提问于2019-11-29得票数 1

回答已采纳

1回答

将列文本模式与定义的列表进行比较，并将定义列表中的第一个匹配字符串返回到dataframe中的新列

python、python-3.x、regex

假设我有咖啡店菜单列表。我想获取文本并返回数量和项目名称。 menu = ['Cappuccino','Café Latte','Expresso','Macchiato ','Irish coffee '] 现在我想从我的菜单中提取匹配的编号和订购的项目名称(菜单中的任何第一个匹配项) 示例文本:带来1个Capputino 输出数据帧： text Quantity match Bring 1 Capput

浏览 3提问于2021-07-19得票数 1

2回答

如何将单列数据框或单行数据框作为数据框或序列返回？

python、pandas、dataframe

给df， df = pd.DataFrame({'col1':np.arange(6), 'col2':[*'abcdef']}) col1 col2 0 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 5 f 然后，在选择单个列时，使用： df['col1'] # returns a pd.Series 0 0 1 1 2 2 3 3 4 4 5 5 Name: col1, dtype:

浏览 33提问于2021-09-23得票数 2

回答已采纳

1回答

用Python将普通列表转换为多列DataFrame

python、pandas、dataframe

有一个像这样的浮点数的简单列表(长度要大得多，它总是3的乘数)： InputList = (0.5, 0.3, 0.2, 0.8, 1.2, 0.5, 0.6, 0.7, 0.9, 1.4, 1.1, 0.3) 需要创建一个DataFrame，其中第一列中的值是列表的前4个元素，第二列是接下来的4个元素，依此类推。结果DataFrame的列数应该等于3，如下所示： Index, Col1, Col2, Col3 0, 0.5, 1.2, 0.9 1, 0.3, 0.5, 1.4 2, 0.2, 0.6, 1.1

浏览 3提问于2022-10-10得票数 0

1回答

是否在保存到DataFrame时将excel值拆分为多列？

python、pandas、dataframe、xlsxwriter

我有一个需求，那就是将数据框中的单列更改为多列，并存储在excel中。示例在DataFrame df中，我有如下值 tp = [["'Attribute1', 143040, 'YES', ' 143040', ' 100.000000', ' 0', 0, '-', '-', '-', '-'"], ["'Attribute2', 143040, 'YES

浏览 8提问于2020-06-04得票数 0

1回答

如何将集合作为新列追加到包含多列的DataFrame中？

scala、dataframe、apache-spark、functional-programming、apache-spark-sql

我想将一个新列附加(添加)到具有多个列的现有数据框架中。 val a = Seq( ("10", "MILLER", "1300", "2017-11-03"), ("30", "Martin", "1250", "2017-11-21")).toDF("dept_no","emp_name","sal","date") scala> a.show +-------+--------+--

浏览 21提问于2019-04-01得票数 3

回答已采纳