如何使用pandas DataFrame的两个单独列中的数据在python中创建新列？_如何使用列值在pandas dataframe中创建新列？_使用pandas/python从DataFrame中的两个现有文本列创建新列 - 腾讯云开发者社区

、、

我有一只熊猫，它的每一栏都是按比例排列的，值是男性还是女性。我的目标是创建2列与OneHotEncoder (按比例男性，按女性)的值1或0适当。我正在使用Azure ML设计器，它使用Execute Python脚本组件，该组件以dataframe作为参数，然后它可以输出2个dataframes。我输入的代码是： # The script MUST contain a function named azureml_main # which is the entry point for this module. # imports up here can be used to impor

浏览 11提问于2022-03-01得票数 0

1回答

Python --老熊猫合并的结果比新的熊猫多。

、

我有两个环境：环境#1: Python3.7.5Pandas 0.23.4 环境#2: 3.8.10Pandas 1.3.4 Python 我在两个版本中都有相同的代码，没有对其进行任何修改。但是，我有这一行特定的代码，这些代码似乎导致了问题/产生了不同的输出： df_result = pd.merge(df_l, df_r, left_on=left_on, right_on=right_on, how='inner', suffixes=suffixes) df_l和df_r只是读取Excel文件。我在两个版本的调试器中检查了它们，它们是完全相同的，所以应该没问题。另外

浏览 1提问于2021-12-14得票数 0

回答已采纳

2回答

如何将多个变量传递给pandas dataframe，以便将它们与.map一起使用来创建新列

、

要将多个变量传递给一个普通的python函数，您只需编写如下代码： def a_function(date,string,float): do something.... convert string to int, date = date + (float * int) days return date 在使用Pandas DataFrames时，我知道您可以基于一个列的内容创建一个新列，如下所示： df['new_col']) = df['column_A'].map(a_function) # This m

浏览 2提问于2015-05-22得票数 6

1回答

变量用于不同任务时的Python内存使用情况

、

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

1回答

DataFrame的多列上的Pandas.rolling_apply lambda

、、、

我想做一个涉及DataFrame的多个列的pandas.rolling_apply。我可以使用DataFrame "df“中的一列来实现，如下所示： a = pd.Series(np.random.randn(12)) pd.rolling_apply(df['Col1'], 12, lambda x: x@a.values, min_periods=12) 但我真的希望将数据帧的两个列合并到rolling_apply中。下面这样的事情是可能的吗？ pd.rolling_apply(df, 12, lambda x: x['Col1']@a.value

浏览 59提问于2017-12-14得票数 0

回答已采纳

1回答

海运中的分组箱形图

、、、

在这里一些很棒的人的帮助下，我能够在seaborn中生成我的第一个盒子图。我有两个单独的海运图表，显示两个比较从excel工作表。我现在要做的是将两个数据比较(显示在下面的两列中)显示在同一个图上，实质上是创建一个分组的箱形图。我尝试将数据转换为dataframe，连接，并将其融化，但没有成功。我是python的新手，所以我想知道你们是否可以帮助我。下面是我的代码。 import pandas as pd import numpy as np import xlrd import matplotlib.pyplot as plt import seaborn as sns %matplotli

浏览 2提问于2018-11-28得票数 0

2回答

寻找使用python中dataframe列的值填充二维数组的方法

、、、

我想在python中创建一个矩阵，它使用的是每个状态转换组合的所有频率。例如，如果我们有3个状态(a，b，c)和两个时间段(1 & 2)，那么我可以使用以下列进行数据处理： # Import pandas library import pandas as pd # initialize list of lists data = [['a to a', 20],['a to b', 10], ['a to c', 5], ['b to a', 7],['b to b', 30],['

浏览 2提问于2022-08-14得票数 1

回答已采纳

1回答

使用来自另一列的索引值在熊猫数据中的一列中进行字符串索引

、、

在“我的Pandas dataframe”列中，需要将字符串长度限制为同一数据格式中另一列中存在的值。我尝试创建一个新列，并使用普通的python字符串索引，并使用另一个列作为值。下面是我试图运行的代码的MWE： import pandas as pd data = [[5, 'LONSTRING'], [3, 'LONGERSTRING'], [7, 'LONGESTSTRINGEVER']] df = pd.DataFrame(data, columns=['String Limit', 'String'

浏览 2提问于2019-08-09得票数 1

回答已采纳

1回答

向DataFrame添加列是否涉及复制数据？

、、、、

我的问题只是关于性能，而不是语义。向df添加新列是否会导致将现有DataFrame中的数据物理复制到新的内存位置(例如，以确保DataFrame占用连续内存)？ # using pandas 0.18.1, python 3.5 import pandas as pd df = pd.DataFrame({'a': range(100)}) b = pd.Series(range(100)) df['b'] = b # is this operation expensive? # equivalently df.loc[:, 'b'] = b

浏览 2提问于2016-06-20得票数 4

1回答

熊猫索引与复制错误

、

我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作，新列的结果是正确的。但在运行代码时，我会得到以下错误消息。我怎么才能解决这个问题？我认为这会影响性能。 C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。请参阅文档中的注意事项： # In[1]: import pandas as pd import numpy as np from pandas im

浏览 2提问于2015-08-27得票数 0

1回答

PySpark:在新星火DataFrame上使用现有的模式

、、、

在Python中，我有一个现有的DataFrame，其中包含135个~列，称为sc_df1。我还有一个Pandas DataFrame，它的列与我想要转换为星火DataFrame的列完全相同，然后是unionByName和两个火花DataFrames。即，sc_df1.unionByName(sc_df2). 在将Pandas DataFrame转换为火花DataFrame时，是否有人知道如何使用DataFrame模式，以便两个DataFrames在联合时具有相同的模式？我知道这不管用，但下面是我想要做的事情： sc_df2 = sc.createDataFrame(df2, schema

浏览 2提问于2020-04-27得票数 0

回答已采纳

1回答

Dataframe.update()中的‘'join’参数

、

我正在尝试用另一个更新数据帧。我注意到'update‘只更新匹配列处的值，而不会从另一个框架添加新列。如何执行这两个功能:更新值和添加新列？ import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [400, 500, 600]}) new_df = pd.DataFrame({'B': [4, 5, 6],'C': [7, 8, 9]}) df.update(new_df, join='left') 更新的df没有'C‘列。为什么会这

浏览 0提问于2018-10-20得票数 1

1回答

从URL创建名称

、

我正在DataFrame中创建一个NAME列，并根据另一列中包含的子字符串设置它的值。有没有更有效的方法来做到这一点？ import pandas as pd df = pd.DataFrame([['www.pandas.org','low'], ['www.python.org','high']], columns=['URL','speed']) print(df.head()) df['Name'] = df['URL'] print(df

浏览 0提问于2020-06-25得票数 3

回答已采纳

1回答

熊猫不能正确处理时间戳栏吗？

、、

默认情况下，当两个dataframes被连接(使用concat)时，concat将创建一个新的dataframe，并将两者的列合并在一起，在结果中设置nan中任何缺失列的值。例如..。 import pandas as pd a = pd.DataFrame({'A':range(5), 'B':range(5)}) b = pd.DataFrame({'A':range(5)}) pd.concat([a , b], sort=False) A B 0 0 0.0 1 1 1.0 ... 3 3 NaN 4

浏览 0提问于2018-12-06得票数 5

回答已采纳

1回答

基于另一列中的文本在pandas中创建列

、、、

我在python中有一个pandas Dataframe，它有一个名为"Description“的列，其中包含一组由"\n”分隔的文本元素。我想通过拆分文本元素在相同的Dataframe中创建新列。例如，我有： Description '\nA: Elephant\nB: Cats\nC:Dog' 我想用关联的元素获得相应的列数，如下所示： Description A B C '\nA: Elephant\nB: Cats\nC:Dog' Elephant

浏览 11提问于2021-01-21得票数 0

2回答

如何在pandas中设置两列的值

、

我有一个函数，它在python中返回一个包含两个元素的元组。我将使用此函数在pandas中的dataframe中创建两个新列。这是我现在拥有的代码 df['A','B'] = df.apply(lambda x: my_fun (X['A'], x['B'], other_arguments)[0:2], axis=1) my_fun返回包含5个元素的元组，我将使用前两个元素来创建新列。但是，它只创建一列，并将该列的值设置为my_fun返回的元组。如何创建两列而不是一列？

浏览 18提问于2019-02-12得票数 1

回答已采纳

1回答

将dataframe一列一列地从另一个dataframe划分

、、、

我有两个看起来类似的数据格式，我想将df1中的一列除以来自df2的一列。以下是一些样本数据： dict1 = {'category': {0: 0.0, 1: 1.0, 2: 0.0, 3: 0.0, 4: 1.0}, 'Id': {0: 24108, 1: 24307, 2: 24307, 3: 24411, 4: 24411}, 'count': {0: 3, 1: 2, 2: 33, 3: 98, 4: 33}} df1 = pd.DataFrame(dict1) dict2 = {'Id': {0: 24108,

浏览 1提问于2022-07-27得票数 1

回答已采纳

1回答

如何在Pandas中的列中显示多于2个值的行？

、、

我在Pandas中有DataFrame，如下所示： col1 ------- John One John Kole Ole Mike Robe Gut Michael Spark 如何才能从上面的DataFrame中的列中只显示这些值，该列有两个以上的值，所以或示例只显示John和Mike，因为这些值有两个以上的单词？如何在Python Pandas中做到这一点？

浏览 3提问于2021-06-25得票数 0

回答已采纳

1回答

将pandas Series或DataFrame列插入现有Excel文件的第一个空列(使用OpenPyXL?)

、、、、

我正在使用Python的pandas库处理Excel文件中的一些数据，并根据这些数据创建两个新列。我想将这些列添加到Excel文件中现有列的最右侧，而不会扰乱已经存在的数据。由于这个原因，我不能使用pd.to_excel()，因为这会覆盖现有的数据，并且整个工作表都会丢失其格式。我正在查看OpenPyXL以保存新数据(必须读取文件两次并不是很好，但是使用OpenPyXL处理头并将它们传递给pandas在我看来有点混乱)。问题是ws.append()函数在第一列(A列)的底部插入数据，我想在第一个可用空闲列(例如C和D列)的顶部(第1行)插入数据。理想情况下，这应该从两个pandas Seri

浏览 3提问于2020-04-09得票数 1

1回答

基于dict创建组合列的熊猫功能

、、、

我试图在pandas.DataFrame中创建一个加权列我有一个python dictionary，键是pandas.DataFrame列名，值是相应的权重。我想创建一个基于dictionary和引用pandas.DataFrame列值加权的新列。考虑到我的dictionary配置会改变并包含“错误配置”，有什么有效的方法来做到这一点呢？为例： import pandas as pd import numpy as np weights = {'IX1' : 0.3, 'IX2' : 0.2, 'IX3' : 0.4, '

浏览 1提问于2019-02-14得票数 3

回答已采纳

1回答

如何在spark sql dataframe中映射一列以创建新列？

、、、

在python和pandas中，我可以创建一个新的专栏，如下所示：使用pandas dataframe中的两列来创建字典。 dict1 = dict(zip(data["id"], data["duration"])) 然后，我可以应用这个字典在第二个dataframe中创建一个新列。 df['id_duration'] = df['id'].map(lambda x: dict1[x] if x in dict1.keys() else -1) 如果我有一个数据帧id_duration (有两列：id和duration)和

浏览 38提问于2021-01-22得票数 0

回答已采纳

1回答

创建Python字符串占位符(%s) n次

、、、、

我希望在Python2.7中使用基于Pandas DataFrame中列数的循环自动生成以下字符串： INSERT INTO table_name (firstname, lastname) VALUES (534737, 100.115) 这假设DataFrame有2列。以下是我所拥有的： # Generate test numbers for table: df = pd.DataFrame(np.random.rand(5,2), columns=['firstname','lastname']) # Create list of tuples fro

浏览 5提问于2015-03-11得票数 0

回答已采纳

3回答

用pandas.DataFrame设置值

、

拥有这个DataFrame： import pandas dates = pandas.date_range('2016-01-01', periods=5, freq='H') s = pandas.Series([0, 1, 2, 3, 4], index=dates) df = pandas.DataFrame([(1, 2, s, 8)], columns=['a', 'b', 'foo', 'bar']) df.set_index(['a', 'b'],

浏览 1提问于2016-06-01得票数 8

回答已采纳

1回答

熊猫:将数组求和为具有多个组比列的聚合

、、

我正在使用Python3.5.1和Pandas 0.18.0。假设我有一个有多列的Pandas数据格式。dataframe有一个列，其中包含一个numpy数组。下面是一个示例： >>> import pandas as pd >>> import numpy as np >>> df = pd.DataFrame([{'A': 'Label1', 'B': 'yellow', 'C': np.array([0,0,0]), 'D': 1},

浏览 3提问于2016-10-03得票数 3

回答已采纳

1回答

在python中的dataframe中添加csv文件中的列

、

我已经使用编写器在python中创建了一个csv文件。我将这个csv文件称为“数据”，它由一列40行组成。然后，我在一个新的python脚本中导入这个csv文件，并创建一个dataframe。但是，在我的新数据框架中，我希望将这40个数据点分成4列，每列10行。到目前为止，我尝试了以下几点： data=pandas.read_csv("location/data.csv", header=None) frame=pandas.DataFrame(data[:10]) frame['second column']=data[10:20] 这

浏览 1提问于2017-12-01得票数 1

回答已采纳

2回答

Python -创建一个空的熊猫DataFrame，并使用For循环从另一个DataFrame填充

、

使用: Mac OSX Lion上的Python 2.7和Pandas 0.11.0 我正在尝试创建一个空的DataFrame，然后基于for loop从另一个数据帧填充它。我发现，当我构造DataFrame然后使用for loop时，如下所示： data = pd.DataFrame() for item in cols_to_keep: if item not in dummies: data = data.join(df[item]) 将产生一个空的DataFrame，但包含要从另一个DataFrame添加的适当列的标题。

浏览 7提问于2013-06-09得票数 1

回答已采纳

2回答

Pandas版本改变了DataFrame读取后数字的解释方式。

、

我有两个环境：环境#1 (旧)： Python3.7.5Pandas 0.23.4 环境#2 (新)： 3.8.10Pandas 1.3.4 Python 当我在这两个环境中通过执行pd.read_csv('name_of_my_csv_file.csv', delimiter=';', dtype=str)来加载相同的CSV文件时，我注意到Python或Pandas错误地解释了一些数字(不是全部，大约是50,000行中的12行)。在环境#1 (旧的)中，对一个数字的错误解释类似于这个7546.168415200001，实际上，在7546.168415200

浏览 12提问于2021-12-15得票数 2

回答已采纳

2回答

如何避免“A值试图设置在来自DataFrame的片的副本上”？

、

我有数据，df_original a b 0 10 5 1 12 6 2 14 1 现在，我想要创建一个包含所有c > 5行的新的dataframe，然后在这个新的dataframe上设置一个新的列值： df = df_original[df_original['b'] > 5] df['c'] = df['a'] / df['b'] 但我收到一个警告： /Library/Python/2.7/site-packages/ipykernel/__main__.py

浏览 2提问于2016-04-06得票数 3

回答已采纳

2回答

如何为DataFrame中的每一列绘制盒图？

、、

我有一个多列的DataFrame df，我希望使用matplotlib为每个列创建一个boxplot 。下面我的df.info()输出的DataFrame供参考 <class 'pandas.core.frame.DataFrame'> RangeIndex: 9568 entries, 0 to 9567 Data columns (total 5 columns): Ambient Tempreature 9568 non-null float64 Exhaust Vacuum 9568 non-null float64 Ambient

浏览 0提问于2018-08-09得票数 10

回答已采纳

3回答

使用熊猫、dataframe或任何其他python 3向csv添加(列表)列表

、、、、

我有10个包含数千行的列表，例如： l1 = 'a1'，'a2'，.，l2 = '1'，'2'，.，.，l10 = 'abc'，'sde'，. 它们的行数是相同的。我想创建一个CSV文件，如： name reg... address 'a1' '1'... 'abc' 'a2' '2'... 'sde' 首先，我想用熊猫DataFrame：(我只用103个第一行进行测试) data = [l1, l2

浏览 2提问于2018-05-07得票数 0

回答已采纳

2回答

Python dataframe组标记

、、、

在Pandas或其他python包中是否有任何工具可以帮助在Pandas‘dataFrame中标记不同数量的行组？以下是更详细的内容：我的dataFrame有一列datetime.datetime对象作为dataFrame索引。时间间隔不均匀，在给定的时间内，行数会发生变化。在该dataFrame中，我需要创建一个列，该列对跨越固定时间跨度的每一系列行都有不同的标签(在我的例子中为12秒)。例如，使用示例和秒 Time(s) | label 1 | 0 2 | 0 3 | 0 7 | 0 12

浏览 2提问于2017-11-15得票数 3

回答已采纳

2回答

Pandas.DataFrame:使用当前df中的一列创建一个新列，并在另一个df中查找一列并进行计算

、、、

嗨，我是python / Pandas的新用户。请帮助我使用Pandas.DataFrame (也许还可以应用方法)。我有两个DataFrames，示例如下。我想通过查找每个产品的单价，乘以df_products‘products’，来创建一个新的df_products‘’列。我该怎么做呢？谢谢。 # Pandas DataFrame example questions import pandas as pd products = ({ 'Product': ['A', 'B', 'C', 'D'],

浏览 6提问于2022-07-04得票数 0

2回答

Python3熊猫使用length添加了一个列，如果是if，则语句

、、、、

在Python3Pandas中使用dataframe，需要创建一个新列。我有两个具有不同长度字符串的类似列。新列应返回具有13个字符长度的第1或第2列。在excel中，我会把它写成：c2=if(len(b2)=13,b2,a2)，然后把公式复制下来。我需要解释的代码是： df = pd.read_csv("example15.csv") #create a new column with if-then statment df['13_digit_#'] = (df.column1 len = 13 or df.column2 len = 13) 我该怎么改

浏览 1提问于2016-10-03得票数 2

回答已采纳

1回答

使用[]而不是点访问Dataframe列时的“SettingsWithCopyWarning”

、、

当从两个现有列创建新列时，为什么pandas要抛出一个SettingsWithCopyWarning A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead 跑步时 df['c'] = df['a'] - df['b'] 但跑的时候不行 df.c = df['a'] - df['b'] 此外，c列是使用df['c'

浏览 6提问于2015-10-04得票数 1

1回答

如何为Pandas DataFrame指定输入数据类型

、

我希望将现有的Python转换为Pandas DataFrame对象。如何为每一列指定数据格式并定义索引列？下面是我的代码示例： import pandas as pd data = [[1444990457000286208, 0, 286], [1435233159000067840, 0, 68], [1431544002000055040, 1, 55]] df = pd.DataFrame(data, columns=['time', 'value1', 'value2']) 在上面的示例中，对于现有列，

浏览 2提问于2016-02-25得票数 5

回答已采纳

1回答

Python ===>根据其他列创建一个新列

、、

我有这样的数据： nt 12062 Python Pandas: Create new column out of other columns where value is not null 12063 Python Pandas Create New Column with Groupby().Sum() 12064 12065 Python - Pandas - create “first fail” column from other column data 12066 12067 12068 Creating new column in

浏览 4提问于2017-05-21得票数 1

回答已采纳

7回答

使用Python在Pandas dataframe中创建周几列

、、

使用Python在Pandas dataframe中创建周几列我想将csv文件读入pandas数据帧，将一列日期从字符串格式解析为date对象，然后生成一个表示星期几的新列。这就是我正在尝试的：我想要做的是： import pandas as pd import csv df = pd.read_csv('data.csv', parse_dates=['date'])) df['day-of-week'] = df['date'].weekday() AttributeError: 'Series'

浏览 293提问于2015-05-14得票数 74

回答已采纳

2回答

有什么更好的方法将列添加到pandas.Series中？

、、

import pandas series1 = pandas.Series({ 'a':1, 'b':2, }) dict = series1.to_dict() dict['c'] = 3 series2 = pandas.Series(dict) 我需要在series1上添加一个列/索引。当前，如上所述，我通过从series1的数据创建一个字典，添加一个索引，然后使用该字典创建一个新的系列来创建series2。有没有一种方法可以像pandas.DataFrame.join()或pandas.DataFrame.assign(

浏览 31提问于2021-04-17得票数 0

回答已采纳

1回答

如何规范化Pandas DataFrame中列的默认日期格式？

、、、

首先我会说我不是最有经验的Python，我还在学习。对于我正在处理的当前项目，我必须将CSV文件加载到Python中，在Python中我创建了一个熊猫DataFrame。目标是返回每列的数据类型，特别是具有不同日期格式的数据类型。我创建了一个小的示例CSV文件来测试它是否可以识别正确的数据类型。 import pandas as pd import numpy as np from tabulate import tabulate from datetime import datetime #Read the CSV file into Pandas

浏览 3提问于2017-06-26得票数 0

回答已采纳

1回答

用电火花将稠密向量转换成数据

、、、

首先，我尝试了下面链接中的所有内容来修复我的错误，但是没有一个有效。我正试图将密集向量转换为dataframe (最好是星火)，并附带列名并遇到问题。我在中的列是使用创建的一个向量，现在我想将它转换回一个dataframe，因为我想在向量中的一些变量上创建图。方法1： from pyspark.ml.linalg import SparseVector, DenseVector from pyspark.ml.linalg import Vectors temp=output.select("all_features") temp.rdd.map( lambd

浏览 0提问于2018-09-27得票数 3

回答已采纳

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

、、、

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

2回答

Pandas DataFrame中的压缩列

、、

我有两个列表，我想创建一个包含3列的pandas Dataframe，其中一列包含通过压缩列表中的两列生成的列。我尝试了以下几种方法 import pandas as pd import numpy as np S_x = [80, 90, 100, 200, 300, 600, 800, 900, 1000, 1200] S_y = [800, 1000, 1200, 450, 80, 100, 60, 300, 700, 900] S_z=list(zip(S_x,S_y)) frame4 = pd.DataFrame(np.column_stack([S_x, S_y,S_z]),

浏览 28提问于2020-04-02得票数 0

回答已采纳

2回答

在蟒蛇大熊猫中创建新列时的KeyError

、、

我正试图在蟒蛇熊猫中创建一个新的专栏，我一直得到一个(不稳定的)重新出现的KeyError。脚本的部分非常简单，所以我不确定是什么导致了错误，因为dataset中没有一个列具有相同的名称。我的目标是创建一个新列，并将其附加到包含ticket_contents列内容的新翻译的dataframe中。这是一个样本的数据； 25483 0 outstanding 0 Los-Angeles e-payment delayed Ticket 1/7/19 7:54 39363 0 outstanding 0 Los-Angeles e-payment delayed

浏览 0提问于2019-02-26得票数 0

回答已采纳

2回答

如何添加新列(而不是替换)

import pandas as pd test=[ [14,12,1,13,15], [11,21,1,19,32], [48,16,1,16,12], [22,24,1,18,41], ] df = pd.DataFrame(test) x = [1,2,3,4] df['new'] = pd.DataFrame(x) 在本例中，df将创建新列“new”。我想要的是。我希望创建一个新的DataFrame (df1)包含‘new’列(六个列)，并且df没有被更改(只有五个列)。我不想让df改变。我该怎么做？

浏览 0提问于2019-01-26得票数 0

回答已采纳

1回答

如何从受另一列约束的数据库中提取一列数据

、、

这是在Python 2中完成的，我使用的是Pandas。虽然我喜欢用SQL来做这件事，这可能会让我的生活变得更容易，但这不是一个选择。我有两个数据帧，x和y。Dataframe x有一个列'BuyerNames‘，y有一个列’Buyer‘，它们都包含一个列'Section'，以及其他共享列。'x(BuyerNames)‘和’y (Buyer)‘中的条目属于同一集合，并且共享列中的数据通常是一致的。我想创建一个dataframe，它是y的子集，称为y*，这样对于具有相应索引的行，'BuyerNames’的值等于‘Buyer’的值。此数据帧的长度相同，并

浏览 10提问于2019-01-10得票数 0

1回答

如何在python中连接数据帧时分配新的描述性列

、、、、

我有两个数据帧，我想用python连接起来。但是，我想添加另一个列type，以便区分不同的列。以下是我的示例数据： import pandas as pd df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']}, columns=['numbers', 'colors']) df1 = pd.DataFrame({'numbers

浏览 17提问于2020-09-10得票数 3

回答已采纳

1回答

创建单行python pandas dataframe

、、

我想创建一个python pandas单行DataFrame，以使用更多的pandas功能，比如转储到*.csv。我已经看到使用了如下代码，但我最终只得到了列结构，而不是空数据 import pandas as pd df = pd.DataFrame() df['A'] = 1 df['B'] = 1.23 df['C'] = "Hello" df.columns = [['A','B','C']] print df Empty DataFrame Columns: [A,

浏览 6提问于2017-08-04得票数 38

回答已采纳

1回答

根据两个索引减去两个多索引数据帧

、、

我有两个数据文件，如下所示： df1 = val id1 id2 foo 1 50 2 100 4 200 bar 1 25 4 100 8 200 baz 2 75 4 150 df2 = val id1 id2 foo 1 60 2 200 3 100 bar 1 50 4 101 8 202 baz 2 70 5 155 我

浏览 0提问于2018-09-11得票数 2

回答已采纳

1回答

熊猫-附加DataFrame

、、

当附加到熊猫DataFrame时，附加的值不会添加到DataFrame中。我正在尝试创建一个空的DataFrame，然后能够在后面的代码中添加更多的行。 import pandas df = pandas.DataFrame(columns=["A"]) df.append(DataFrame([[1]])) print(df) 输出： Empty DataFrame Columns: [date, start_time, end_time] Index: [] 知道我可能做错了什么吗？根据文档，这应该像预期的那样在A列下的一个新的值1行中工作，但是，如上所述，它没有追

浏览 4提问于2021-06-19得票数 1

回答已采纳

1回答

可能的索引按列编号(而不是标签)而没有iloc？

、

我们可以在不使用的情况下同时索引大熊猫的行和列吗？文件上说使用DataFrame，在[]中切片行。但是，当我想以相同的方式包含行和列时，它是不工作的。 data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) data[0:2] #only rows data.iloc[0:2,0:3] # works. data[0:2,0:3] # not working in python, but it works similarly in R

浏览 2提问于2017-02-19得票数 0

回答已采纳