在循环中访问pandas DataFrame以控制indeces - 腾讯云开发者社区

python、pandas

我有一个带有日期时间索引的数据格式。首先，这是我的假数据。 import pandas as pd data1 = {'date' : ['20190219 093100', '20190219 103200','20190219 171200','20190219 193900','20190219 194500','20190220 093500','20190220 093600'], 'number' : [18.6125, 12.

浏览 0提问于2019-02-26得票数 0

回答已采纳

1回答

迭代dataframe中的行并将对象添加到列表中

python、pandas、dataframe

我将一个txt文件读取到一个dataframe中，现在尝试遍历pandas dataframe中的行，并为每个数据条目创建一个学生对象。最终，将学生对象存储在“学生”列表中。我对如何迭代行并将学生对象添加到学生列表中感到有点困惑。有人能帮我创建这个列表吗？谢谢 students = [] import pandas as pd data = pd.read_csv('students.txt') df = pd.DataFrame(data) print(df) 文件输出 firstname lastname status gpa 0 Mike

浏览 42提问于2021-10-31得票数 0

3回答

如何输入特定的行值，并输出行号

python、pandas

我一直在努力理解函数，我试图完成的任务是创建一个函数，该函数从行值中获取输入并输出行号。示例数据集 import pandas as pd data = [['tom', 10], ['nick', 15], ['juli', 14]] df = pd.DataFrame(data, columns=['Name', 'Age']) 希望我可以使用函数调用任何名称，输出将是行号。我正在寻找的例子是使用输入- "Nick"，输出为1。

浏览 17提问于2022-06-25得票数 1

1回答

Pandas数据帧:从条件1获取行索引，按条件2排序

python、pandas、numpy、dataframe

我有如下结构的数据帧： import pandas as pd import numpy as np data = {'Col1' : [4,5,6,7], 'Col2' : [10,20,30,40], 'Col3' : [100,50,-30,-50], 'Col4' : ['AAA', 'BBB', 'AAA', 'CCC']} df = pd.DataFrame(data=data, index = ['R1','R2',&

浏览 1提问于2016-07-30得票数 2

回答已采纳

2回答

主脚本可以使用模块中的导入语句吗？

python、python-3.x

在主要python脚本中可以从python模块生成导入语句吗？ my_module.py import pandas as pd def data(): df1 = pd.DataFrame({'A': range(1, 6), 'B': range(10, 0, -2), 'C': range(10, 5, -1) }) return df1 my_scrpit.py import

浏览 3提问于2020-12-21得票数 0

回答已采纳

1回答

如何在matplotlib中绘制一个数据帧的多个值

python-3.x、pandas、dataframe、matplotlib

这个问题我问了好几次，但不知何故，我的问题也没有甚麽意见。我希望这次我的问题结构是正确的。我有一个如下的数据框架： indeces Zeitstempel Ergebnis 0 382 16.04.2020 16:12:07 PASS 1 383 16.04.2020 16:13:07 PASS 2 392 16.04.2020 16:13:20 FAIL 3 382 16.04.2020 16:13:22 PASS 4 383 16.04.2020 16:14:22 PASS 数据帧有三列。我正在尝试构建一个

浏览 12提问于2021-04-01得票数 0

回答已采纳

1回答

将数据帧绑定到for循环中的变量会将其转换为元组吗？

python、pandas、dataframe、for-loop、tuples

如果这是基本的，我很抱歉，但我是python的新手。当我获得AttributeError: 'tuple' object has no attribute 'plot'.时，我正在尝试通过for循环在pandas中创建绘图查看我的代码，我发现将一个dataframe赋值给一个变量会将它转换为一个元组。如下所示： import seaborn as sns flowers = sns.load_dataset('iris') for k in flowers['species'].unique(): print(&#

浏览 3提问于2020-12-28得票数 2

回答已采纳

1回答

当随机分配给培训/测试数据集时，将R数据中的行分组在一起

r、dataframe、random、training-data

我有一个由X行组成的数据块，每个行对应于单个个体(每个个体的X可以是不同的)。我想将这些个体随机地分配到训练、测试和验证样本中，但是到目前为止，我还没有能够得到正确的语法，以确保用户的每个X行总是被收集到同一个子样本中。例如，数据可以简化为如下所示： user feature1 feature2 1 "A" "B" 1 "L" "L" 1 "Q" "B" 1 &

浏览 4提问于2015-11-22得票数 0

回答已采纳

1回答

Python不断增长的字典或不断增长的数据帧-在循环中追加

python、python-3.x、pandas

我正在尝试编写代码，在循环中从在线来源收集数据，并在每次迭代中使用pandas操作这些数据。最初，我认为我应该在循环外初始化一个dict，获取数据，将dict转换为循环内的dataframe，并对其执行操作。但是，在循环中创建字典而不是仅仅创建一个数据帧并添加到数据帧中，这感觉非常奇怪。但据我所知，pandas并不是真正为逐个细胞更新而“设计”的(而是向量化的)。对此最有效的方法是什么？ import pandas as pd d = {'a':[], 'b':[], 'c':[], 'x':[], 'z'

浏览 15提问于2019-08-09得票数 2

3回答

如何从pandas数据帧中提取单元

python、pandas

假设我制作了一个pandas数据帧(我不擅长pandas，这可能效率不高)： import pandas as pd colnames = ['a', 'b'] data = pd.DataFrame(columns=colnames) df_row = ['val1', 'val2'] app = pd.Series(df_row, index=cols) data = data.append(app, ignore_index=True) 我希望以字符串而不是pandas对象的形式访问val1。如果我这样做了： cell =

浏览 2提问于2015-08-25得票数 5

回答已采纳

1回答

为什么pandas Dataframe.to_csv的输出与Series.to_csv不同？

python、python-3.x、pandas、dataframe、csv

我需要一个数据被,拆分的单线CSV。我的问题是，当我尝试使用apply遍历我的Dataframe时，我得到了一个Series对象，to_csv方法给了我一个拆分成行的str，将None设置为""，没有任何,。但是，如果我使用for遍历数据帧，我的方法将获得一个Dataframe对象，并在一行中给出一个包含,的str，而不会将None设置为""。下面是测试这一点的代码： import pandas def print_csv(tabular_data): print(type(tabular_data)) csv_data = tabula

浏览 28提问于2021-04-22得票数 3

回答已采纳

2回答

无法追加数据帧

python-2.7、pandas

我无法将dataframe附加到已经创建的dataframe。预期输出如下： a b 0 1 1 1 2 4 2 11 121 3 12 144 import pandas def FunAppend(*kwargs): if len(kwargs)==0: Dict1={'a':[1,2],'b':[1,4]} df=pandas.DataFrame(Dict1) else: Dict1={'a':[11,12],'b':[121,144]}

浏览 2提问于2017-02-06得票数 0

1回答

在Pandas GroupBy中找出一列的差异

python、performance、pandas

我试图计算卫星在同一地点采集的样本之间的时间差。我目前在Pandas DataFrame中有数据，它具有样本的纬度、经度和时间。下面是数据的快照(它有一些可以忽略的额外列)： JulianDay LatSp LonSp AltSp LandMask 34 2.459581e+06 19.699432 -105.036661 410.853638 1 35 2.459581e+06 20.288866 -105.201204 1378.320140 1 36 2.45

浏览 0提问于2021-09-18得票数 2

回答已采纳

1回答

如何创建一个空数据文件并追加它

python、pandas、dataframe

我是新来的蟒蛇和熊猫。我必须读取几个csv文件，这些文件具有相同的列，并创建了一个结果dataFrame(它包含来自每个csv文件的所有行)。我试过了，但是当我打印dataframe时，它是打印空的DataFrame 栏：[]索引：[] 守则是： def readCSV(dir): list = getFilesInDir(dir) # my function which returns list of files. dataframe = pandas.DataFrame() for name in list: df = pandas.read_csv(name)

浏览 0提问于2020-03-22得票数 1

回答已采纳

1回答

Pandas To_Excel解析问题-仅输出1个文件

python、json、pandas、export-to-excel

您好，我有这样的工作代码： import pandas as pdfrom pandas.io.json import json_normalize import json import warnings warnings.filterwarnings('ignore') with open('yieldfull.json') as file: data = json.load(file) df_json = json_normalize(data) df_json_stripped = data[0] platform_dict = df_jso

浏览 22提问于2021-05-07得票数 1

回答已采纳

1回答

当追加多个列时，如何解释DataFrame.assign(**kwargs)和dd[x]=y在Dask中的性能差异？

python、pandas、dataframe、dask

在将一些代码从Pandas迁移到Dask时，我发现通过使用多列调用DataFrame.assign()来修改Dask数据帧与使用多个DataFrame.__setitem__() (也称为dataframe[x]=y)调用来修改它之间存在巨大的性能差异。使用导入 import pandas, dask, cProfile 对于定义如下的Dask数据帧： dd = dask.dataframe.from_pandas(pandas.DataFrame({'a':[1]}), npartitions=1) cProfile.run('for i in range(100)

浏览 3提问于2020-04-16得票数 0

1回答

从字典创建数据帧并追加它们

python、pandas、dataframe

我有一个文件目录，我正在将这些文件解析成具有多个键值对的字典，并且我希望将每个字典作为一行存储在pandas dataframe中。 import pandas as pd df = pd.DataFrame() for file in os.listdir(directory): dict1 = parseFileToDict(file) df_temp = pd.DataFrame.from_dict(dict1, orient='columns') df_temp.set_index('name') df = df.a

浏览 11提问于2020-10-12得票数 1

1回答

推荐的方式来访问熊猫数据帧中的单行？

python、python-3.x、pandas

我经常希望使用多个条件选择Pandas DataFrame的单行。为了进一步处理，最好将其作为系列或字典访问，而不是作为1xW DataFrame访问。我可以这样做： r = df.loc[ (df['col1'] == v1) & (df['col2'] == v2) ] if len(r.index) != 1: raise ValueError(...) r = r.iloc[0] 这感觉有点笨拙。有没有更好的，推荐的方法？

浏览 8提问于2019-10-15得票数 1

回答已采纳

3回答

熊猫:哪一种阈值适用于每一行？

python、pandas

给定一个分数栏，例如， scores = pd.DataFrame({"score":np.random.randn(10)}) 和阈值 thresholds = pd.DataFrame({"threshold":[0.2,0.5,0.8]},index=[7,13,33]) 我想找出每个分数的适用阈值，例如， score threshold 0 -1.613293 NaN 1 -1.357980 NaN 2 0.325720 7 3 0.116000 NaN 4 1.423171 33 5 0.2

浏览 0提问于2018-06-22得票数 0

回答已采纳

3回答

无法循环访问DataFrame :获取以下错误:元组索引必须是整数或切片，而不是字符串

python、python-3.x、pandas、dataframe、machine-learning

在过去的30分钟里，我一直在尝试调试我的代码，但没有结果，也许你能帮上忙？错误出在第17行，但我真的不知道为什么会发生这种情况。因此，我使用字典来存储函数is_nontrivial_reverse_number()返回的数据，它是一种boolean类型。我遍历它并将0中的所有值插入到1100中。然后，我使用pandas库将字典插入到DataFrame中。然后，我遍历我的dataFrame，以检索设置为真的值的计数。但问题是，即使我在不同的字典和数据帧集上使用了相同的函数，row["nonTrivial"]似乎也不起作用。 import pandas as pd2

浏览 60提问于2019-01-15得票数 3

回答已采纳

2回答

熊猫:通过多列查找另一个DataFrame中不存在的行

python、join、pandas

与此相同，但具有多列这是设置： import pandas as pd df = pd.DataFrame(dict( col1=[0,1,1,2], col2=['a','b','c','b'], extra_col=['this','is','just','something'] )) other = pd.DataFrame(dict( col1=[1,2], col2=['b','c'

浏览 5提问于2015-09-18得票数 30

回答已采纳

1回答

将数据字典中的列转换为字符串

python、pandas、dataframe

我试图将字典结构中包含的所有数据格式中的所有列从object转换为string，以便对字符串应用清理函数。 # each key represents a dataframe: # iterate over each dataframe and convert all columns to strings import pandas as pd data = {'dataframe_1':pd.DataFrame({'col1': ['John', 'Ashley'], 'col2': ['+10&#

浏览 2提问于2021-06-29得票数 0

回答已采纳

1回答

`pandas.DataFrame.to_html()`无表边界‘和’`tr样式‘

python、html、pandas

根据标题，从pandas.DataFrame.to_html()生成“干净的”HTML代码是可能的吗?如果是的话，那么如何？我已经发现，border=...和justify=...参数控制在那里显示的内容，但是显然不管您在那里输入了什么值，您似乎总是得到它们。下面是一个最低限度的工作示例： import pandas as pd import numpy as np df = pd.DataFrame(data=np.arange(3 * 4).reshape(3, 4)) df.to_html(border=0, justify='inherit') 它产生： <

浏览 1提问于2018-07-21得票数 6

1回答

如何使用百分位数函数进行排序？(Matlab)

matlab、loops、for-loop、ranking、percentile

我有以下606x274表：目标：对于每一个日期，计算更低和更高的20%百分位数，并根据结果创建两个新变量。“l”表示“较低”，“U”表示“上层”，其中包含表标题中所显示的滴答名称。一步步地： % Replace NaNs with 'empty' for the percentile calculation (error: input to be cell array) T(cellfun(@isnan,T)) = {[]} % Change date format T.Date=[datetime(T.Date, 'InputFormat&

浏览 2提问于2016-12-22得票数 0

回答已采纳

1回答

Python:使用熊猫匹配替换部分文件路径

python、pandas、loops、for-loop、filepath

数据帧有2列：old_path和new_path。数据帧可以包含数百行。该脚本遍历文件列表。对于列表中的每个文件，请检查其文件夹路径的任何部分是否与old_path列中的值匹配。如果匹配，则将文件的匹配old_path替换为相应的new_path值。我使用for index, row in df.iterrows():或for row in df.itertuples():实现了这一点，但我认为应该有一种更有效的方法来完成它，而不必使用第二个for循环。任何帮助都是非常感谢的。下面的示例使用df.iterrows() import pandas as pd import os df

浏览 0提问于2018-11-20得票数 2

2回答

无法向pandas DataFrame添加值

python、pandas、dataframe、yfinance

我正在尝试寻找一些股票的移动平均收敛散度，我正在使用Pandas_ta，yfinance和pandas库。但是当我试图将MACD值添加到dataframe时，我得到了这个错误： IndexError: iloc cannot enlarge its target object 我的代码是： import pandas as pd import pandas_ta as ta import yfinance as yf import datetime as dt import matplotlib.pyplot as plt start=dt.datetime.today()-dt.time

浏览 102提问于2020-09-14得票数 2

回答已采纳

1回答

如何将两个urls的标题存储在excel文件中

python-3.x、pandas、python-requests

import bs4 from bs4 import BeautifulSoup from pandas.core.base import DataError from pandas.core.frame import DataFrame import requests import pandas as pd from fake_useragent import UserAgent urls = ['https://www.digikala.com/search/category-mobile', 'https://www.digikala.com/search

浏览 14提问于2021-01-18得票数 0

回答已采纳

1回答

Pandas Dataframe中更快的列表扁平化方法

python、pandas、list、dataframe、flatten

我有一个下面的数据框架： import pandas df = pandas.DataFrame({"terms" : [[['the', 'boy', 'and', 'the goat'],['a', 'girl', 'and', 'the cat']], [['fish', 'boy', 'with', 'the dog'],['when', 'girl'

浏览 23提问于2019-07-24得票数 2

回答已采纳

2回答

如何将DataFrame.append()转换为pandas.concat()？

python、pandas、dataframe、append、concatenation

在熊猫1.4.0：append()被反对，而医生说使用concat()代替。 FutureWarning: frame.append方法已被废弃，并将在未来的版本中从熊猫中删除。使用pandas.concat代替。有问题的代码块： def generate_features(data, num_samples, mask): """ The main function for generating features to train or evaluate on. Returns a pd.DataFrame() ""

浏览 4提问于2022-02-24得票数 11

回答已采纳

1回答

可以为熊猫GroupBy对象编写访问器吗？

python、pandas、dataframe、numpy、accessor

我想知道是否有可能为对象实现熊猫api访问器(作为GroupBy )。使用以下代码，我可以将访问器应用于组项： import pandas as pd import numpy as np @pd.api.extensions.register_dataframe_accessor("geo") class GeoAccessor: def __init__(self, pandas_obj): self._obj = pandas_obj @property def center(self): # return t

浏览 4提问于2021-11-05得票数 1

回答已采纳

1回答

从pointcloud pcl python文件中获取索引点

python、point-cloud-library

可以从PCL点云文件中检索索引点吗？我在txt文件中有包含XYZ和其他一些列信息的点云数据。我使用以下代码将txt文件转换为pcl云文件： import pandas as pd import numpy as np import pcl data = pd.read_csv('data.txt', usecols=[0,1,2], delimiter=' ') pcl_cloud = pcl.PointCLoud() cloud = pcl_cloud.from_array(np.array(data, dtype = np.float32)) 据我

浏览 30提问于2019-12-31得票数 0

1回答

当我在DataFrame中使用双括号时会发生什么？

python、pandas、brackets

当我这样做的时候 test = pd.DataFrame([[1, 2, 3], [4, 5, 6]]) print(type(test)) print(test) print('\n') print(type(test[1])) print(test[1]) print('\n') print(type(test[[1]])) print(test[[1]]) 我明白了。 <class 'pandas.core.frame.DataFrame'> 0 1 2 0 1 2 3 1 4 5 6 <cla

浏览 37提问于2021-10-16得票数 0

2回答

Panda Dataframe值字典

python、python-3.x、pandas、numpy

下面是在打印对象dic时的输出： {'Stock': Price date 2018-11-23 150 2018-11-26 153} 通过打印dic‘’Stock‘，我最终得到： Price date 2018-11-23 150 2018-11-26 153 此对象的类型为<class 'pandas.core.frame.DataFrame'>。然后我尝试使用函数$pandas.Series，发现这个DataFrame只包含一

浏览 1提问于2018-11-26得票数 0

回答已采纳

2回答

对Python熊猫数据行的更新不更新数据吗？

python、pandas、dataframe

我刚刚发现，迭代熊猫的数据行，并对每一行进行更新，并不会更新数据！这是预期的行为，还是需要先对行做一些事情，以便更新反映在父dataframe中？我知道可以在循环中直接更新dataframe，或者在这个简单的/人为的示例中对列进行简单的重新计算，但我的问题是，iterrow()似乎提供了行的副本，而不是对dataframe中实际行的引用。这有什么原因吗？ import pandas as pd fruit = {"Fruit": ['Apple','Avacado','Banana','Strawberry',

浏览 4提问于2022-11-14得票数 0

1回答

如何遍历数据帧中的列？

python、pandas

我有一个数据帧，其中包含许多度量列，所有列都包含浮点输出。我要把它们都四舍五入到四位数。我想循环遍历所有列来完成此操作。 import numpy as np import pandas as pd test_df = pd.DataFrame(np.random.randn(10,4), columns=['a','b','c','d']) metrics = test_df.columns metrics = metrics.tolist() for x in metrics: test_df.x = np.ro

浏览 0提问于2014-06-26得票数 3

回答已采纳

1回答

使用Python将网站解析为CSV文件

python、html、xml、csv

我使用以下内容作为指南，作为python的新手，我不知道如何在我的数据集上实现它。我的问题是我想把下面的表格转换成CSV格式，我原以为上面的解决方案会起作用，但可惜不行。 import requests import pandas as pd url = ' html = requests.get(url).content df_list = pd.read_html(html) df = df_list[-1] print(df) df.to_csv('my data.csv') Pavlos建议： import csv, requests from bs4 i

浏览 0提问于2021-03-13得票数 2

1回答

使用类从dataframe中删除列

python-3.x、pandas、dataframe、oop

我正在努力减少数据帧中不需要的数据列，但让它在OOP的范围内工作。数据帧中的列是从'A‘到'M’。示例： import pandas as pd # columns 'A' 'B' and 'C' are what I want kept vibe_df = pd.read_csv('C:Location/Document.csv') vibe_df = vibe_df[['DateTime', 'A', 'B', 'C']] 上面的工作，但是，我

浏览 0提问于2020-08-27得票数 1

3回答

Python如何在循环中连接数据？

python、pandas

我如何加入下面的数据， # Convert Spark DataFrame to Pandas pandas_df = df.toPandas() print pandas_df age name 0 NaN Michael 1 30 Andy 2 19 Justin 我目前的尝试， persons = "" for index, row in pandas_df.iterrows(): persons += str(row['name']) + ", " + str(row['age&#

浏览 9提问于2015-08-17得票数 1

回答已采纳

1回答

检索结果，并使用延迟加载和gzip将文件放入.csv格式

c#、sql、sql-server、csv、parallel-processing

我正在尝试从sql server下载表，并将每个下载的表写成一个csv文件，然后对其进行gzip压缩。我现在的问题是，这个表太大了(上面有一百万行，我正在使用python pandas dataframe来做这件事)，以至于出现了内存错误。有没有办法在C#中懒惰地做这件事，从而最小化内存使用，然后我就可以为这个任务并行运行2-3个进程？

浏览 2提问于2015-12-20得票数 0

1回答

熊猫到RDD

pandas、apache-spark、dataframe、pyspark、apache-spark-sql

我可以将Pandas DataFrame转换为RDD吗？ if isinstance(data2, pd.DataFrame): print 'is Dataframe' else: print 'is NOT Dataframe' 是DataFrame 下面是尝试使用.rdd时的输出 dataRDD = data2.rdd print dataRDD AttributeError Traceback (most recent call last) <ipython-input-56-7

浏览 7提问于2015-08-19得票数 12

1回答

将数据从for循环传递到dataframe

python-3.x

我刚开始在python中学习一些东西，我被困在两者之间。 import yfinance as yf import pandas as pd import yahoo_fin.stock_info as si ticker = ['20MICRONS.NS', '21STCENMGM.NS', '3IINFOTECH.NS', '3MINDIA.NS', '3PLAND.NS'] for i in ticker: try: quote = si.get_quote_table(i)

浏览 2提问于2021-05-25得票数 0

回答已采纳

1回答

熊猫时间三角洲属性(_m，_s)：奇怪的行为

python、pandas、pycharm、timedelta

我亲眼目睹了一些奇怪的行为，访问属性，比如_m或_s，比如来自大熊猫timedelta对象的属性。让我用一个最小的例子来解释这个问题，我在PyCharm中运行控制台(PyCharm 2020.2.3 (Community )) >>> import pandas as pd >>> # Creating a dataFrame with 2 pandas timedeltas: ... df_test=pd.DataFrame({"Timedeltas":[pd.Timedelta('1 days 1:01:01'), pd

浏览 3提问于2020-11-30得票数 2

回答已采纳

3回答

查看Python相关矩阵条目的常见观察计数的快速方法

python、numpy、pandas、missing-data

假设我有一个名为pandas.DataFrame的df。df的列表示不同的个体，索引轴表示时间，因此(i，j)条目是单个j对时间段i的观测，我们可以假设所有数据都是float类型，可能有NaN值。在我的例子中，我有大约14,000列和几百行。 pandas.corr会给我14,000乘14,000的相关矩阵，它的时间性能对我的应用程序来说是很好的。但我也想知道，对于每一对个体(j_1，j_2)，在相关计算中有多少非零观测，这样我就可以分离出数据覆盖率较差的相关细胞。我想出的最好办法是： not_null_locations = pandas.notnull(df).values.asty

浏览 3提问于2013-08-14得票数 7

回答已采纳

1回答

用idxmax编制大熊猫索引

python-3.x、pandas

以下是我要做的事： In [7]: from pandas import DataFrame, Series In [8]: import pandas as pd In [9]: import numpy as np In [10]: df = DataFrame([[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]], index=['a', 'b', 'c', 'd'],

浏览 1提问于2014-12-29得票数 1

回答已采纳

1回答

Pandas数据框值不会在函数外部更改

pandas、dataframe

我在for循环中有一个pandas dataframe，我在其中更改pandas dataframe中的值，如下所示： df[item].ix[(e1,e2)] = 1 但是，当我访问df时，这些值仍然保持不变。你知道我到底哪里错了吗？有什么建议吗？

浏览 2提问于2017-11-04得票数 0

1回答

在循环内追加数据帧

python、pandas、selenium

我试图通过循环遍历元素，然后单击分页来获取链接列表。我不确定如何在pandas dataframe中附加每个循环，这样我就可以在循环外部调用dataframe来列出所有链接。它总是覆盖并打印出最后一行。 while True: links = [link.get_attribute('href') for link in driver.find_elements_by_class_name('view-detail-link')] for link in links: df_links = pd.DataFrame([[

浏览 36提问于2019-03-16得票数 0

回答已采纳

2回答

创建单个pandas.core.frame.Pandas对象

python、pandas、dataframe

如何将单个数据行创建为pandas.core.frame.Pandas object 因此，当您使用for row in df.itertuples()迭代一个dataframe (df)时，每一行都将是一个pandas.core.frame.Pandas对象。我想要创建一个这种类型的对象。例如： import pandas as pd d = [{'a': 1, 'b': 2}] df = pd.DataFrame(d) print(type(df)) print("a", df.a) for row in df.itertuples()

浏览 7提问于2021-09-15得票数 3

回答已采纳

1回答

DataFrame : ImportError:无法导入名称Python

python、pandas

我正在编译这个简单的代码(使用SublimeText 3和Python2.7(已经安装在我的MAC机上))： from pandas import DataFrame data = {"a": [1, 2, 3], "b": [3, 2, 1]} data_df = DataFrame(data) 我得到了以下错误： Traceback (most recent call last): File "jj.py", line 1, in <module> from pandas import DataFrame ImportError:

浏览 2提问于2017-06-08得票数 0

1回答

熊猫SettingWithCopyWarning的意义

python、pandas

当我运行这段代码时 df = raw.copy() # making a copy of dataframe raw df['new col'] = '' for i in range(len(df)): df['new col'].loc[i] = 'some thing' 我得到了这个警告(警告1)： SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in

浏览 14提问于2022-03-31得票数 -1

1回答

Pyspark:从列表的RDD创建spark数据帧，其中列表的一些元素是对象

python、pandas、apache-spark、pyspark、rdd

我正在尝试将pandas.DataFrame代码转换为等效的pyspark DataFrame。我有一个以下格式的RDD。 myRdd = [[1, 'a', {'a':[1, 2]}], [2, 'b', {'c': 1, 'd':3}], [3, 'c', {}]] columnNames = ['sl', 'name', 'params'] 内部列表中的第三个元素没有特定的结构。在pandas数据帧中，我可以

浏览 1提问于2018-04-07得票数 1