从pandas行创建一个列表字典？_从pandas dataframe创建字典列表_从pandas数据框创建列表字典 - 腾讯云开发者社区

python-3.x、pandas

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。 target_df = pandas.read_csv(file_absoulte_path, nrows=0, engine='python').columns.tolist() 并将上面返回的列表与另一个列表(expected_columns)进行比较，如下所示。 if(colums_expected==target_df): logger.info("Column names are CORRECT, as expected!"

浏览 2提问于2021-07-15得票数 1

3回答

在循环中将字典附加到pandas数据帧

python、python-3.x、pandas

我需要在循环中创建一个字典，并将它们附加到具有匹配的dict键名和数据框的列名的pandas数据框中。每次迭代中字典的键值对可以是不同的。在字典中使用所有可能的关键字在开始时定义了空的熊猫数据帧df_podcast。以下是尚未完成的代码示例 df_podcast=pd.DataFrame(columns=podcast_cols) podcast_dict={} for j in range(len(podcast[0])): if podcast[0][j].tag=="key": podcast_dict[podcast[0][j].text]=

浏览 0提问于2017-05-14得票数 9

回答已采纳

1回答

从CSV保存和阅读Python字典

python、csv、pandas、numpy、dictionary

我想执行一个简单的操作，将python字典存储到csv文件中，然后将它从文件中读取为字典。例如，我的字典将字符串映射到numpy数组的列表中： d = {'x': [array([2, 3, 4]), array([5, 6, 7])], 'y': [array([1, 2, 3]), array([4, 5, 6])] 因此，我想将此字典存储为csv，然后在另一个程序中从文件中重新创建字典。我尝试过使用python的csv模块将字典写到csv文件中，但是很难正确地存储多维numpy数组的列表。当我使用该模块读取它时，它会读取csv文件中的空白行。我也尝试

浏览 1提问于2016-11-11得票数 0

回答已采纳

1回答

如何替换熊猫的细胞？

python-3.x、pandas

我有一个从CSV创建的Pandas数据帧，其中包含以下报头： podcast_name,user_name,description,image,ratings,category,itunes_link,rss,email,latest_date,listener_1,listener_2,listener_3,listener_4,listener_5,listener_6,listener_7,listener_8,listener_9,listener_10,listener_11,listener_12,listener_13,listener_14,listener_15,listen

浏览 4提问于2019-08-17得票数 1

回答已采纳

1回答

仅为select列向pandas数据框追加一行

python、pandas

我想向pandas DataFrame追加一个新行，但只填充select列。在下面的代码中，我设置了要填充的列列表的子集，并分配一个值列表。 import pandas as pd sampleDF = pd.DataFrame(columns=['Tenant','Industry','Square Footage']) sampleDF = sampleDF.iloc[sampleDF.tail(1).index.item(), ['Tenant', 'Industry']] = ['DE Sha

浏览 19提问于2021-02-01得票数 0

2回答

如何将字典附加到pandas数据帧？

python、json、for-loop、dictionary、pandas

我有一组包含json文件的urls和一个空的pandas dataframe，其中的列表示jsnon文件的属性。并不是所有的json文件都具有pandas dataframe中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas dataframe，如果json文件没有与dataframe中的列匹配的属性，则必须将其填充为空。我设法创建了如下字典： import urllib2 import json url = "https://cws01.worldstores.co.uk/api/product.php?product_sku=ULS

浏览 2提问于2015-07-29得票数 11

回答已采纳

1回答

在熊猫DataFrame中迭代行并创建一个数据集

python、pandas、dictionary、hashmap

我正在尝试使用pandas DataFrame创建一个字典。 import pandas as pd df = pd.DataFrame({'name': ["p1","p1","p2","p2","p2"], 'val': [0, 1, np.nan, 1, 0] }) 我想创建一个字典，其中name列为key，val列为values。值将是一个列表。我使用的是for loop，因为DataFrame只有100行。 mydict = dict

浏览 2提问于2022-02-06得票数 0

回答已采纳

1回答

使用熊猫保存在csv文件中的长列表

python、pandas、dataframe

我使用下面的内容来用python写入csv文件： submission = pandas.DataFrame({ "label": data["label"], predictors[0]: data[predictors[0]] }) 之后，我用以下内容编写了一个csv文件： submission.to_csv("test.csv", index=False) 现在，我的预测器列表是一个很长的1000+元素列表，显然我不能手工编写所有这些行。 submission = pandas.DataFrame({ "la

浏览 3提问于2016-03-26得票数 0

回答已采纳

1回答

在循环中创建多个Pandas数据帧

python、pandas

尝试为列表中的每个股票报价器创建pandas数据框我的代码： for ticker in stock_tickers: data = pd.read_csv(f'{ticker}_{get_date()}.csv') 它将只为最后一个股票报价器创建一个pandas数据框架...有没有办法让所有人都这样做呢？

浏览 38提问于2021-11-04得票数 0

1回答

4维嵌套字典到pandas数据框架

python、json、pandas、dictionary、dataframe

我需要你的帮助转换一个多维字典到一个熊猫数据框。我从一个JSON文件中获取字典，该文件是从API调用(Shopify)中检索的。 response = requests.get("URL", auth=("ID","KEY")) data = json.loads(response.text) "data“字典如下所示： {'orders': [{'created_at': '2016-09-20T22:04:49+02:00', 'email'

浏览 11提问于2016-09-22得票数 0

1回答

从从Excel文件读取的字典格式提取的列表格式数据中提取特定数据

python、pandas、list、dictionary、nested

我正在从嵌套字典格式的数据中提取特定的数据。通过选择特定数据作为字典格式中的第一步，可以获得以下列表格式数据。每一行的数据类型是一个列表。 dataset 0 [] 1 [] 2 [] 3 [{'A': 1, 'B'

浏览 1提问于2022-09-18得票数 1

回答已采纳

2回答

如何创建字典列表

python、pandas、dictionary

我想计算按年份分组的文档中单词频率的数据，然后将数据放在熊猫的数据中。我的例程为每一行创建一个字典，其中包含作为键和值的单词和频率。然后，我想循环几年，将字典附加到彼此，以创建一个字典列表，并将其转换为dataframe。从字典列表中创建数据似乎是标准的；我可以通过手动创建列表来做到这一点。我希望能做这样的事情： wordtable = {'year':'1965','word1':20, 'word2': 250, 'word3': 125} newrow={'year':'1966

浏览 5提问于2016-12-16得票数 0

回答已采纳

1回答

对要插入数据库的python数据类型感到困惑

python、sql-server、pandas、pyodbc、shareplum

我试图将这个值插入到Server表中，但我不确定这是一个列表还是一个字典。对于某些上下文，我使用shareplum从Sharepoint列表中提取数据，代码如下 import json import pandas import pyodbc from shareplum import Site from shareplum import Office365 authcookie = Office365('https://company.sharepoint.com', username='username', password='password&

浏览 0提问于2021-04-16得票数 0

回答已采纳

1回答

如何在Bokeh中导入CSV作为ColumnDataSource，而无需通过Pandas？

bokeh

要在Bokeh中使用数据集，通常也会导入熊猫，并使用熊猫DataFrame作为数据。也可以从Pandas DataFrame创建ColumnDataSource。但是，有没有可能直接从csv文件(或任何其他表格源数据)转到Bokeh，而不使用Pandas作为桥梁创建，以及如何创建？

浏览 1提问于2017-08-14得票数 0

1回答

使用列表中的名称创建数据帧

python、excel、pandas、concatenation、dictionary-comprehension

我有很多带标签的excel文件。我想把它们都连接起来，一次一个制表符。我正在做： mypath = "mypath" files = os.listdir(mypath) files = [os.path.join(mypath,f) for f in files if f[-4:]=='xlsx'] sheets = pandas.ExcelFile(files[0]).sheet_names 现在，假设我的标签是alpha，beta，gamma等，我想创建一个数据帧df_alpha，df_beta等的列表，它们是中文件的所有alpha标签的并集。我的目

浏览 15提问于2021-04-14得票数 3

回答已采纳

1回答

创建Dict列表: python / pandas

pandas、list、loops、dictionary

我从我和Pandas一起读到的Excel中得到了一个导入。每一行都是一个不同的人，列中给出的值如people_id等。现在我想把每个人都放入一个字典，然后把每个字典放到一个列表中。但不幸的是，我的循环总是返回同一个人，但在列表中返回了19次。故障出在哪里？ path = os.path.abspath('dataset_people.xlsx') # works as long as file is in same directory as this code. Excel-file must be closed. excel = pandas.read_excel(pat

浏览 11提问于2020-04-10得票数 0

回答已采纳

1回答

从以关键字为索引的字典列表创建DataFrame

python、pandas、dataframe

我想从字典列表中创建一个pandas数据，并使用键作为索引，例如： x = [ {'AAPL': 0.07969655043031681}, {'MSFT': 0.04751221896383187}, {'NFLX': 0.009729232074671192} ] 我尝试过pd.DataFrame(x)，但是键显示为列，而不是索引你能帮帮忙吗。？

浏览 7提问于2019-03-01得票数 2

回答已采纳

1回答

从pandas数据框创建列表字典

python、pandas、dataframe、dictionary

我正在尝试创建基于pandas数据帧的列表字典，我需要一个列表字典来传递给我的Plotly仪表板 In: df.head() Model Make Ford F-150 Ford Escape Ford Mustang Jeep Grand Cherokee Jeep Wrangler 我发现df.to_dict()是通过列标题来定向的，但是我需要根据相邻的行值来定向。要做到这一点，唯一的方法是将我的数据帧重塑为列by Model，它们各自的制造商在它们下面？ Out: makes_by_model= { 'Ford':

浏览 7提问于2020-04-30得票数 1

回答已采纳

1回答

创建多个pandas数据帧作为列表上函数迭代的输出

python、pandas、dataframe、dictionary

我正在尝试使用pytaxize包的函数itis.hierarchy_full，以便从特定Id检索有关生物物种的信息。该函数只接受一个值/Id，并将所有分类信息保存在可供稍后编辑的pandas数据帧中。 import pandas as pd from pytaxize import itis test1 = itis.hierarchy_full(180530, as_dataframe = True) 我有大约800个物种I，我想自动化这个过程来获得800个不同的数据帧。我以某种方式创建了一个带有小列表的测试(请注意，我是一个生物学家，所以代码非常基础，可能效率很低： species =

浏览 0提问于2021-03-03得票数 0

1回答

通过Python将列表字典写入SQL Server

python、sql、python-3.x、dictionary、azure-functions

我有一个列表字典，我需要将其写入SQL Server，其中字典键是列名，字典值是大型值列表(目前约为30,000，很可能会增长到50,000+)。数据来自REST API，经过转换，然后创建一些新值，然后写入。我有一个在Azure上运行的工作代码，它使用pandas来做这件事，但是当表从80列增加到110列时，Azure开始崩溃，所以现在我已经写了一些东西来处理字典中的所有数据转换，我只需要把字典写成SQL。字典的一个小示例如下所示： data_dict = {'company': [1, 1, 15, None], 'net_amount': [$20

浏览 46提问于2020-10-04得票数 0

回答已采纳

1回答

Create dictionary，仅添加列与列表中的值匹配的行

python、list、dictionary、genetics

我有两个CSV文件。首先，我想用1列列出一个列表。然后，我想从另一个CSV创建一个字典，但只包含其中一列的值与前面创建的列表中已经存在的值匹配的行。以下是到目前为止的代码： #modified from: http://bit.ly/1iOS7Gu import pandas colnames = ['Gene > DB identifier', 'Gene_Symbol', 'Gene > Organism > Name', 'Gene > Homologues > Homologue > D

浏览 0提问于2014-02-16得票数 0

2回答

如何避免pandas的concate和to_csv函数中的空集？

python、pandas

我有一个通过pandas存储在csv中的字典： df = pd.concat([pd.Series(node_dict[k], name=k) for k in HEADERS], 1) df.to_csv(os.path.join(abspath, outputfile), sep='\t', index=False) 关键点对应于CSV或pandas框架中的列，值是集合的列表。每个集合都是当前行的值。让我们看看我是否有两列： names companies {'john

浏览 19提问于2020-03-26得票数 0

1回答

Pandas创建单独的df遍历现有的df行

python、pandas、dataframe

我有一个熊猫df： import pandas as pd data = {'animal': ['Cow', 'Mouse', 'Horse', 'Dog', 'Cat'], 'age': [12, 1, 23, 4, 5], 'reports': [4, 24, 31, 2, 3], 'id': [234, 745, 732, 245, 232]} df = pd.DataFrame(data)

浏览 16提问于2019-11-01得票数 0

回答已采纳

1回答

将dict转换为Python中的列表块

python、python-3.x、dictionary

我有一条看起来像： d = {'col2': 'b', 'col1': 12} 这是从Pandas DataFrame创建的，使用： df.ix[row,['col1','col2,]].to_dict() 我想在df.isin()方法中包含这个dict。但是，当我这样做时，我会得到以下错误： TypeError: only list-like or dict-like objects are allowed to be passed to DataFrame.isin(), you passed a 'int&#

浏览 1提问于2016-03-12得票数 2

回答已采纳

1回答

组织从Excel读取到Pandas DataFrame的数据

python、excel、pandas

我使用这个脚本的目标是:1.从excel文件中读取时间序列数据(>100,000k行)以及标题(标签，单位)2.将excel数字日期转换为pandas dataFrame的最佳datetime对象3.能够使用时间戳引用行，使用序列标签引用列到目前为止，我使用xlrd将excel数据读取到一个列表中。制作了pandas系列，每个列表都以时间列表为索引。将序列和序列头部组合在一起，生成python字典。把字典传给了熊猫DataFrame。尽管我做了很多努力，但df.index似乎被设置为列标题，我不确定何时将日期转换为datetime对象。我3天前才开始使用python，所以任何建议都是

浏览 1提问于2013-07-18得票数 8

回答已采纳

1回答

如何从pickle文件列表创建多个Pandas数据帧？

python、pandas

我想为一个pickle文件列表中的每个文件创建一个Pandas数据帧。如果我使用以下代码： dfs = [pd.read_pickle(file) for file in DATA_PROCESSED.iterdir()] 我将获得一个列表，但我还希望在文件名和数据帧名之间建立一个对应关系。在这种情况下，我将只获得dfs，例如你能帮我一下吗？

浏览 37提问于2018-08-05得票数 0

回答已采纳

1回答

为什么网状将熊猫dfs的列表转换为r dfs的列表，但如果使用字典或嵌套列表，则不会这样做？

python、r、pandas、dataframe、reticulate

这是我第一次使用reticulate。我有20个多页pdf表，我从python中使用camelot提取数据(它们不是简单的表，所以我需要更强大的表读取器)。它创建一个表列表(每个页面一个表)，并生成一个TableList对象。我能够循环列表并将表转换成熊猫数据。使用pdfs之一执行此操作的示例： tables2001 = camelot.read_pdf('2001.pdf', flavor='stream', pages='1-end') df2001 = list() for t in tables2001: df = t.df df

浏览 6提问于2022-05-30得票数 2

回答已采纳

3回答

Pandas:从命名元组列表创建数据帧

python、pandas、dataframe

我刚接触熊猫，所以也许我在问一个非常愚蠢的问题。通常，pandas中数据帧的初始化是按列进行的，我将列名称的键和列表样对象的值放入相同长度的字典中。但我喜欢在不动态连接行的情况下按行初始化。假设我有一个命名元组的列表，有没有一个优化的操作可以直接从它得到一个熊猫数据帧？

浏览 4提问于2013-11-16得票数 36

回答已采纳

1回答

如何处理pyarrow写表时的空字典

python-3.x、pandas、parquet、pyarrow

我正在用pandas和pyarrow从python字典列表中创建拼图文件。但获取空的nasted字典时出现以下错误。 Cannot write struct type 'subject' with no child field to Parquet. Consider adding a dummy child field 下面的代码。 import pandas as pd import pyarrow as pa import pyarrow.parquet as pq data =[ { "name":"david"

浏览 3提问于2021-09-02得票数 0

2回答

在ipython中，如何获得具有特定类型和模式的所有局部变量的列表？

python、local-variables

例如，我在工作空间中创建了5个pd.DataFrame，它们是： trade_i = pd.DataFrame(np.random.rand(5, 2)) trade_xt = pd.DataFrame(np.random.rand(5, 2)) trade_mmt = pd.DataFrame(np.random.rand(5, 2)) trade_pg = pd.DataFrame(np.random.rand(5, 2)) trade_fg = pd.DataFrame(np.random.rand(5, 2)) 如您所见，这些类型都是pandas.core.frame.DataFram

浏览 4提问于2018-01-14得票数 1

回答已采纳

1回答

创建拼写相似的pandas数据框变量名称列表

python、regex、list、pandas

在我的环境中，我有一个由几个pandas数据帧组成的列表，它们的名称类似。例如： import pandas as pd import numpy as np df_abc = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD') df_xyz = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD') df_2017 = pd.DataFrame(np.random.randn(

浏览 0提问于2017-06-19得票数 1

2回答

熊猫-数据人名清单？

python、list、pandas

我做了很多搜索却找不到任何相关的东西。是否有一个内置函数来自动生成我创建的Pandas数据文件列表？例如，我创建了三个数据格式：df1 df2 df3 现在我想要一个类似于：df_list = [df1, df2, df3]的列表，这样我就可以迭代它了。

浏览 0提问于2017-06-29得票数 3

回答已采纳

1回答

使用python PRAW提取reddit注释，并使用结果创建数据帧

python、pandas、dataframe、reddit、praw

我希望从reddit帖子中提取所有评论，并最终将作者姓名、评论和评论放入一个数据框架中。我是编程新手，所以我遇到了一段艰难的时期.. 现在，我正在使用PRAW提取粘滞的注释，并尝试使用for循环迭代这些注释，并创建一个包含作者和注释的字典列表。出于某种原因，它只是将第一个作者、评论、字典配对添加到列表中，并重复它。这就是我所拥有的： import praw import pandas as pd import pprint reddit = praw.Reddit(xxx) sub = reddit.subreddit('ethtrader') hot_python = su

浏览 1提问于2018-01-21得票数 1

1回答

如何在Python中将数据从excel列提取到列表中？

python、excel、list、pandas

我正在尝试从excel中的列中提取数据到Python中的列表。我有以下代码： #Extracting Labels read = pd.read_excel('Test-data-results.xlsx', sheetname=0) # can also index sheet by name or fetch all sheets labels = read['Labels'].tolist() print(labels) 当我运行这段代码时，我得到一个关键错误：.... File "pandas/_libs/index.pyx", lin

浏览 97提问于2018-08-13得票数 1

回答已采纳

2回答

Python-从非数字数据列表创建表

python、pandas、matplotlib

我正在寻找一种方法来创建一个简单的表给出了3个文本数据列表，以及标题列表。总结如下:根据数据源的不同，我需要3列和无限数量的行。如果有一种方法可以在Python中正常执行，我也不希望导入任何内容。或者，我也可以使用pandas、matplotlib或它们的组合。下面是我的代码： headers=["SCHEME","SERVER","PATH"] schemes=[] servers=[] paths=[] colLabels=['PATH','SERVER','SCHEME'] rowLabels

浏览 0提问于2016-03-20得票数 0

3回答

如何获取列表的对应值

python、pandas、dataframe、loops

我有两个列表A和B。我想检查列表A的输入"Nein“，如果这是真的，那么我想从列表B中获得相应的文本，并在下一个命令中使用输出(例如:A)作为输入。这必须遍历整个列表(否则，传递循环)。我使用pandas从excel中提取了这两列，并将其转换为列表。 A = [Nein, Ja, Nein, Ja, Nein, Nein] B = [A, B, C, D, E, F] for i in A: if i == "Nein": print(i) ???? 任何帮助都将不胜感激。

浏览 29提问于2021-01-13得票数 0

回答已采纳

2回答

替换稀有单词标记: Python

python、pandas

我希望能够在语料库中用标识符'UNK‘替换所有稀有单词。下面的代码可以工作，但速度很慢。有没有更好更聪明的方法？编辑:瓶颈是rareWordstoUNK函数-前面的部分非常快。在我的熊猫系列中大约有8万行。 X_train是一个pandas系列，其中每个“行”都是诸如['this','is','my','first', 'sentence']之类的单词标记的列表。我遍历并创建了一个词频字典，然后创建了一个不常见单词的列表(本例中为frequency >1)。然后我想把这个应用到未来的数据中，如果这个词

浏览 2提问于2016-04-16得票数 1

3回答

难以从清单中创建熊猫数据

python、python-3.x、csv、pandas、dataframe

我在从网上抓取数据的时候，很难从我生成的列表中创建一个熊猫df。在这里，我使用漂亮汤从localharvest.org (农场名称、城市和描述)中提取一些关于本地农场的信息。我能够有效地抓取数据，在每次传递时创建一个对象列表。我遇到的麻烦是将这些列表输出到表格df中。我的完整代码如下： import requests from bs4 import BeautifulSoup import pandas url = "http://www.localharvest.org/search.jsp?jmp&lat=44.80798&lon=-69.22736&s

浏览 5提问于2016-08-18得票数 0

回答已采纳

2回答

使用字典列表在数据帧中创建新变量

python、pandas、dataframe

我有以下数据帧： import pandas as pd data = {'One': ['number 1', 'number 1'],'Two': ['number 2', 'number 2']} df = pd.DataFrame(data, columns=['One', 'Two']) print(df) 我还有这个字典列表： [{'year': '1997', 'name': 'John'}

浏览 0提问于2020-07-10得票数 0

2回答

试图从python中的JSON中获取一个值

python、json

我正在尝试使用python访问json文件中的值。在imgur链接中，我试图访问的值是嵌套在"args“中的"NUM”。我的主要逻辑是读取JSON文件，然后使用熊猫来规范JSON，我尝试过使用.loc来查找“args”，但我需要其他方法或选项的帮助。1：下面是我的代码片段以及我正在获得的终端错误 def readInJSON(json): df = pandas.json_normalize(json) goto_rows = [i for i in df.loc[df['mnemonic'] == 'PLD_CCD_EXPOSE_CL

浏览 9提问于2022-10-20得票数 0

1回答

将值附加到Pandas系列中

pandas、add、series

我想从文件中提取一个特定的行。有许多文件，因此产生了许多行/值。我想把所有的值都放入一个Pandas DataFrame中。为此，目的是将名为"11“的行放入一栏"11”(系列)，将名为"22“的行放入下一栏/系列"22”，将"33“行放入最后一栏/系列。目的： 11 22 33 file1 0.4 4.1 6.2 file2 0.5 4.3 6.1 file3 0.6 4.6 6.1 file4 0.8 4.1 6.7 ... ...

浏览 2提问于2017-03-24得票数 2

回答已采纳

1回答

如何为每个列表项创建一个带有列表和字典的CSV文件？

python、pandas、dataframe、csv、dictionary

我有一个list，并根据每个列表项创建一个dictionary，我想写一个CSV文件，如下所示： ListItem, key1, key2, key3 li1, value1, value2, value3 li2, value1, value2, value3 这就是我试图做到这一点的方法，但我认为我的代码在每次迭代中都会覆盖第一行，并且我不知道如何在第一列中输入列表项。你能帮我一下吗？ import pandas as pd import random def CreateDict(li): dict = {} dict['x'] = random.r

浏览 8提问于2021-01-29得票数 0

2回答

通过应用多个返回函数创建多个熊猫DataFrame列

python、pandas

我想将一个具有多个返回的函数应用到一个pandas DataFrame中，并将结果放在该DataFrame中的单独的新列中。考虑到这样的情况： import pandas as pd df = pd.DataFrame(data = {'a': [1, 2, 3], 'b': [4, 5, 6]}) def add_subtract(a, b): return (a + b, a - b) 目标是一个命令，调用add_subtract on a和b，在df中创建两个新列：sum和difference。我想像这样的事情可能会奏效： (df['s

浏览 2提问于2017-12-26得票数 7

回答已采纳

1回答

将每列中的唯一值与其出现的次数放入一列，pandas

python、excel、pandas、aggregate、data-science

我有一个索赔级别记录的数据集。我想创建另一个数据帧，其中包含每个唯一值在一周内出现的次数。假设表的名称是(Claims.csv) import pandas as pd import dateutil df = pd.read_csv("Claims.csv", encoding='utf-8') 我是否应该创建一个遍历所有行的循环，并将每个唯一值保存在一个列表中，然后从该列表创建新的数组，然后再次遍历所有行以获得它的值的数量？或者在pandas中有一个内置的函数可以做到这一点，或者是一个现成的库？提前谢谢。

浏览 0提问于2018-06-08得票数 1

3回答

如何遍历Pandas数据帧

python、numpy、pandas、scikit-learn

我正在尝试遍历Pandas数据帧。列表L包括用于指定X或Y应该从哪个行开始的值，即(1:，2:，3:)。 list = [1,2,3] for L in list: X = data.ix[L:, 'X':] Y = data.ix[L:, 'Y'] regressor = LinearRegression() regressor.fit(X, Y) prediction = regressor.predict([[Variable]]) 尝试上述操作时出现的错误为： TypeError: 'type&

浏览 2提问于2016-01-19得票数 1

1回答

熊猫先进的read_excel或ExcelFile.parse

python、pandas、import-from-excel

我正在尝试将excel文件有条件地解析到Pandas数据文件中。我有一组excel文件，每个文件的顶部都有一些不属于数据的行--一些基于报表参数创建报表的标识数据。我想在ExcelFile.parse()中使用skiprows=some_number方法，但是我不知道每个文件的some_number是什么。我知道HeaderRow将从一个可能性列表中的一个成员开始。我如何告诉Pandas从行开始创建dataframe，该行在我的可能性列表中包含任何some_string？或者，是否有一种方法可以导入整个工作表，然后删除行前面的行，其中包括我的可能性列表中的任何some_string？

浏览 3提问于2015-04-13得票数 1

回答已采纳

1回答

统计Pandas中单词出现次数的最快方法

python、string、count

我有一个字符串列表。我想要计算Pandas列的每一行中所有单词的出现次数，并使用此计数添加一个新列。 words = ["I", "want", "please"] data = pd.DataFrame({"col" : ["I want to find", "the fastest way", "to count occurrence", "of words in a column", "Can

浏览 13提问于2019-10-26得票数 1

回答已采纳

2回答

如何从值列表中创建一个包含列的新数据框(下面会更详细地介绍)？

python、pandas

我得到了一个像这样的数据框。在值列中，每行都有一个数字列表。在“类别”列中，每行都有一个类别列表。值的类型为int，类别为string。“值”列中的每个值始终适合“类别”列中列表中相同位置的类别值。你可以把它想象成食谱。例如:对于第一行的配方，你需要a中的2，c中的4，d中的3和e中的5。 | values | categories | | ------ | ---------- | | [2,4,3,5] | ['a','c','d','e'] | | [1,6,7] | [&#

浏览 13提问于2021-03-10得票数 2

回答已采纳

2回答

从列表的字典中删除'nan‘

python、pandas、list

我的数据包含由pandas读取为nan的空行的列。我想从这些数据中创建一个列表字典。但是，一些列表包含nan，我想要删除它。如果我在data.dropna().to_dict(orient='list')中使用dropna()，这将删除包含至少一个nan的所有行，因此我丢失了数据。 Col1 Col2 Col3 a x r b y v c x z data = pd.read_csv(sys.argv[2], sep = ',') dict = data.to_dict(ori

浏览 3提问于2019-02-21得票数 2

3回答