如何在python/pandas中高效地创建索引和列名组合矩阵 - 腾讯云开发者社区

、

我刚刚完成了Pandas教程，对下面的行为感到有点困惑。 In [28]: d Out[28]: Status CustomerCount StatusDate 2009-01-05 9 2519 2009-01-12 10 3351 2009-01-19 10 2188 2009-01-26 10 2301 2009-02-02 7 2204 2009-02-09

浏览 4提问于2015-02-02得票数 0

回答已采纳

1回答

使用dataframe Matplotlib的条形图

、、、

我正在研究熊猫的数据数据(data_agg_clust)，它的样本数据如下： KPIPred Cluster 9-11 125.872327 18-20 120.084786 15-17 112.328802 12-14 109.752560 21-23 106.128234 我想使用matplotlib创建一个条形图： import matplotlib.pyplot as plt; plt.rcdefaults() data_agg_clust.plot.bar(x="Cluster", y="KPIPred"

浏览 1提问于2022-01-20得票数 1

回答已采纳

1回答

我在使用python计算excel中的单元格时出错了，但我不知道为什么？

、、、

这是代码： import pandas as pd file_name = "C:/Users/jains/Downloads/Python/Python/SA.xlsx" df = pd.read_excel(file_name) df['Sum'] = df['data']*df['petha']+df['leta']*df['deta'] df.to_excel("C:/Users/jains/Downloads/Python/Python/SA.xlsx") 这是e

浏览 2提问于2021-08-19得票数 0

回答已采纳

1回答

熊猫链索引的替代方案是什么？

、、、

我正在上一个学习python的在线课程，老师告诉我们链式索引不是一个好主意。然而，他没有说出是不是合适的替代方案。假设我有一个Pandas数据框，其中行被索引为['1', '2', '3']，列被命名为['a', 'b', 'c']。使用命令df['1']['a']提取在第一行和第一列中找到的值的适当替代方法是什么？

浏览 0提问于2016-12-21得票数 7

2回答

如何在我的Dataframe上执行特定操作？

、、

你好，我有一个使用python和pandas的数据框架： b c d 1 4 e 2 5 f 3 6 我想要这个： a b c d 1 4 e 2 5 f 3 6 如何进行此操作？非常感谢！

浏览 6提问于2020-04-12得票数 0

2回答

如何在Pandas中访问数据数据的特定元素。给出误差

、、、

我有一个数据格式的df_params。它包含存储过程的参数。 PurchaseOrderID OrderDate SupplierReference DF_Name 0 1 2013-01-01 B2084020 dataframe1 1 2 2013-01-01 293092 dataframe2 2 3 2013-01-01 08803922 dataframe3 3 4 2013-

浏览 9提问于2022-05-05得票数 1

回答已采纳

1回答

如何在Python中将数据从excel列提取到列表中？

、、、

我正在尝试从excel中的列中提取数据到Python中的列表。我有以下代码： #Extracting Labels read = pd.read_excel('Test-data-results.xlsx', sheetname=0) # can also index sheet by name or fetch all sheets labels = read['Labels'].tolist() print(labels) 当我运行这段代码时，我得到一个关键错误：.... File "pandas/_libs/index.pyx", lin

浏览 97提问于2018-08-13得票数 1

回答已采纳

1回答

使用数据帧/矩阵为sklearn和Tensorflow创建输入

、、、

我正在使用pandas / python /numpy / datalab/bigQuery为机器学习处理生成一个输入表。数据是基因组的--现在，我正在处理174行12430列的小子集以同样的方式从bigQuery (df_pik3ca_features = bq.Query(std_sql_features).to_dataframe(dialect='standard',use_cache=True))中提取列名，提取行名：samples_rows = bq.Query('SELECT sample_id FROMspeedy-emissary-167213.pg

浏览 8提问于2017-06-28得票数 1

回答已采纳

1回答

对Numpy nd阵列的直观理解

、、、

所以我已经看过手册了--但结构还是让我很困惑。具体而言，以下几个方面之间的关系如何： nd数组和Python列表 nd数组与Python字典 nd阵列与Pandas DataFrame nd-数组和Numpy“结构化数组”？还有，nd数组是否就像一个列表序列？ “n维”从何而来？因为它看起来就像一个矩阵，它只是二维的。谢谢!

浏览 0提问于2017-09-28得票数 1

回答已采纳

1回答

为什么DataFrame行选择语法df[:2]可以工作，但如果语法df[1]不工作呢？

、、、

我有以下数据： data = pd.DataFrame(np.arange(16).reshape(4, 4), index = ['Ohio', 'Colorado', 'Utah', 'New York'], columns = ['one', 'two', 'three', 'four']) 如果我运行：data[:2]，输出将是： one two three four Ohio 0 1 2 3 Colora

浏览 6提问于2020-09-13得票数 0

回答已采纳

2回答

如何在python中导入excel表格中的特定列并将其值存储在变量数组中？

我想将excel表格中的四列导入到python中，并将它们存储为不同的数组。我试过使用'pandas‘模块，但无法正确地实现我的需求。 import pandas as pd df = pd.read_excel("Book2.xlsx","Sheet4") tg1f = df['A'] 我希望将不同列的值存储在单独的数组中。例如，excel工作表第一列中的值应该存储在一个名为“Temperature”的变量中。

浏览 79提问于2019-07-04得票数 2

回答已采纳

3回答

从pandas数据帧创建numpy数组

、、、

import pandas as pd import numpy as np df = pd.read_csv('~/test.txt') list(df.columns.values) 我得到以下输出： ['time', 'Res_fs1', 'angle1', 'Res_fs2', 'angle2', 'Res_ps1', 'Force1', 'Res_ps2', 'Force2', 'object'] 当我尝试使

浏览 2提问于2017-06-28得票数 0

1回答

改变约化矩阵熊猫的值

、、、

我正在尝试实现算法，其中给定的矩阵(矩阵代表城市)应该根据条件进行缩减：在这里，矩阵(数据帧矩阵)： 0 1 2 3 4 0 9992 1 0 2 0 1 2 99991 5 0 0 2 0 4 9992 0 1 3 3 0 1 9991 2 4 1 0 2 2 99989 然后，根据一个条件，删除矩阵中的0行和

浏览 2提问于2016-10-26得票数 0

回答已采纳

1回答

如何在pandas中选择一些特定的solumns和最后一列

、、、

我使用的是Pandas by Python。我有一个DF的列：'id'，'name'，'age'，'n1'，'n2'，'n3'，...如果我想选择特定的列，我会使用df = df[['name','age']]，是的，它起作用了。但是如果我想选择特定的列和最后一列(以防最后一列的名称不是静态的)。我该怎么办？

浏览 6提问于2020-03-24得票数 1

回答已采纳

2回答

Python -数据帧的维度

、

Python新手。在R中，可以使用dim(...)获得矩阵的维数。Python Pandas中对应的数据帧函数是什么？

浏览 6提问于2012-12-18得票数 94

回答已采纳

1回答

打印从txt导入的表时，标头对齐。

、

我在学Python。我正在读这个.txt文件： user_id|age 1|20 2|25 3|30 4|35 使用此脚本： import pandas as pd users = pd.read_table(r'provapd.txt', sep='|', index_col='user_id') print(users.head(3)) 它可以工作，但是头在输出中不对齐： age user_id 1 20 2 25 3 30 为什

浏览 0提问于2019-11-24得票数 2

回答已采纳

1回答

为什么我只能在python中调用这个.CSV文件中的第一列？

、

我试图从python中的这个.CSV文件中调用第二列，以便使用它进行一些数据分析，但是我只能从该文件调用第一列("Time_abs/ps")。我尝试分别调用第二列和第三列(“信号/nA”和“刷新信号/nA”)，方式与成功调用第一列时相同，但每当我试图这样做时，我都会收到下面的错误。有人知道为什么会发生这种事吗?知道如何解决这个问题吗？输入： import pandas as pd import io df = pd.read_csv(io.BytesIO(uploaded['wf air.csv'])) print(df) print(df['T

浏览 16提问于2022-07-11得票数 0

1回答

使用scikit矢量化特定列的问题学习DictVectorizer？

、、、、

我想了解如何做一个简单的预测任务，我正在玩这个，也是在不同的格式。Wich是关于学生在某些课程中的表现，我想矢量化一些列的数据集，以避免使用所有的数据(只是为了了解它如何工作)。因此，我尝试了以下方法，使用 import pandas as pd from sklearn.feature_extraction import DictVectorizer training_data = pd.read_csv('/Users/user/Downloads/student/student-mat.csv') dict_vect = DictVectorizer(sparse=F

浏览 3提问于2015-04-30得票数 2

回答已采纳

1回答

数据帧索引

、、

使用python3，我编写了计算数据的代码。守则如下： import pandas as pd import matplotlib.pyplot as plt import numpy as np def data(symbols): dates = pd.date_range('2016/01/01','2016/12/23') df=pd.DataFrame(index=dates) for symbol in symbols: df_temp=pd.read_csv("/home/furqan/Desktop

浏览 2提问于2017-01-02得票数 3

回答已采纳

1回答

熊猫中的矩阵乘法

、

我将数值数据存储在两个DataFrames x和y中。来自numpy的内积可以工作，但来自pandas的点积不能。 In [63]: x.shape Out[63]: (1062, 36) In [64]: y.shape Out[64]: (36, 36) In [65]: np.inner(x, y).shape Out[65]: (1062L, 36L) In [66]: x.dot(y) --------------------------------------------------------------------------- ValueError

浏览 1提问于2013-05-10得票数 18

回答已采纳

1回答

iloc函数在熊猫和Python中有什么优势？

、、

我刚开始学习Python和Pandas，在许多教程中我看到了iloc函数的使用。人们总是说，您可以使用这个函数来引用dataframe中的列和行。但是，您也可以不使用iloc函数直接这样做。下面是一个输出相同的例子： # features is just a dataframe with several rows and columns features = pd.DataFrame(features_standardized) y_train = features.iloc[start:end] [[1]] y_train_noIloc = features [start:end] [[1

浏览 2提问于2020-10-21得票数 2

回答已采纳

1回答

以日期为索引合并大熊猫数据

、、、

我正在尝试合并两个不同长度的数据文件(称为df1和df2)，它们都是按日期索引的。dfs (df1)的时间越长，所列出的日期就越短(df2)。我尝试使用以下命令组合它们：merged = df2.merge(df1, on='Date')，但是我得到了以下错误，当我尝试这样做时，我不理解这些错误。 --------------------------------------------------------------------------- KeyError Traceback (most recent c

浏览 3提问于2014-04-24得票数 4

回答已采纳

1回答

AttributeError中可能存在的to_sql错误

、、

我不确定 (熊猫0.13.1)的这种行为是否是有意的。当我在没有列名的情况下创建一个dataframe，并尝试在sql db中写入 dfi = DataFrame(randn(3, 10)) dfi.to_sql(name = to_table, con=connection, flavor='mysql', if_exists='replace') 我得到以下错误： /usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-package

浏览 2提问于2014-04-09得票数 1

回答已采纳

3回答

如何使用pandas同时从csv中提取两个值？(两列，同一行)

、、、

我正在使用pandas将csv文件读取到我的python代码中。我知道我可以从所有行的特定列中获取一个特定值，并将其附加到一个数组中，如下所示： import pandas as pd df = pd.read_csv('File.txt') for row in df[df.columns[0]]: playerNames.append(row) 但是，我希望同时从第0列和第2列获取值，以填充字典。在我的脑海里，大概是这样的： for row in df[df.columns[0,2]]: playerNameDictionary[row.columns[0]

浏览 147提问于2018-08-11得票数 0

2回答

尝试从yfinance Ticker对象获取日期时出现Python错误

、、、、

我正在尝试为某些股票制作日线图，但遇到了一个问题。每2分钟获取一次“接近”价格是正确的，但是当我尝试获取“日期时间”时，我得到了一个错误。我相信你的金融使用熊猫创建了一个数据框架，但我可能错了。无论如何，我在从yfinance中删除某个专栏时遇到了问题。我是python和许多包的新手，所以这可能是一个简单的错误，但我的代码如下所示。 stock = yf.Ticker('MSFT') print(stock.history(period='1d', interval='2m')) priceArray = stock.history(peri

浏览 24提问于2021-06-17得票数 0

回答已采纳

1回答

添加具有不同维度和标签的矩阵

、、、、

我使用python的包有可能具有不同维度的2D标记矩阵，我需要将它们添加到标签对齐的位置。larry包处理了这一点，但两个矩阵的相加需要相同的尺寸。但对于我的任务来说，每个维度都有不同顺序的不同标签。larry一边处理它，一边添加例如： la.add(lar1, lar2, join='inner') 但是期望lar1和lar2具有相同的维度，但是除了标签的不同排序之外，我的矩阵甚至可能具有不同的维度。我想要的示例： ADD([[1,2][3,4]],[[5,6,7][5,7,2]],label=[[A,B,C][X,Y]]) 应导致输出具有最大尺寸，在添加时用零填充缺少

浏览 1提问于2013-09-23得票数 0

2回答

通过索引在矩阵中赋值

、、、、

从R开始，我被用来通过使用索引将一个简单的值赋值给一个矩阵，例如： > mat <- matrix(NA,2,3) > mat [,1] [,2] [,3] [1,] NA NA NA [2,] NA NA NA > mat[1,2] <- 12 > mat [,1] [,2] [,3] [1,] NA 12 NA [2,] NA NA NA > 现在，我不得不用Python运行一些脚本，并希望收集2D矩阵中的值。矩阵应该有列和行名，我也想通过索引访问它们。到目前为止，我想到了两种方

浏览 3提问于2012-08-24得票数 1

回答已采纳

1回答

如何在Streamlit上更改面积图的标签？

、、、

我已经使用Streamlit for Python部署了一个面积图。是否可以更改X轴的标签以及绘制的每个数据点的标签？ import streamlit as st import pandas as pd st.write(""" My area chart """) df = pd.read_csv("my_data.csv") st.area_chart(df)

浏览 16提问于2020-07-02得票数 2

回答已采纳

1回答

基于多值的矩阵变换为更小的矩阵

、

所以我有一个巨大的矩阵(大约150万行x 7列)，并试图找出一种有效的方法来拆分它。为了简单起见，我将使用这个小得多的矩阵作为我想要做的事情的示例。这7列包括(按顺序)：条目编号、x和y坐标、第一个标签(非数字)、数据#1、数据#2和第二个标签(非数字)。所以使用pandas，我从excel表格中导入了一个名为A的矩阵，它看起来像这样： ? 我需要做的是根据两个标签对其进行划分(即，我有一个矩阵是所有13G + Aa的矩阵，另一个矩阵是14G + Aa的矩阵，另一个矩阵是14G + Ab的矩阵--这将使我得到3个独立的2x7矩阵)。这样做的原因是因为我需要对每个单独矩阵的“标记”列的

浏览 19提问于2019-09-03得票数 1

3回答

如何使用"loc“和"for”在pandas中添加行？

、、

我想通过loc将一个dataframe的数据添加到新的dataframe中。我使用了"loc“，但出现了一个错误。我可以添加数据吗？ >>> import pandas as pd >>> df = pd.DataFrame({'A': [1.0, 1.2, 3.4, 4.1, 8.2]}) >>> import pandas as pd >>> df_new = pd.DataFrame(columns=['A']) >>> for i in df: ..

浏览 1提问于2017-12-12得票数 1

3回答

Pandas力矩阵乘法

、、、、

我想使用Python Pandas强制矩阵乘法“定向”，在DataFrames对抗DataFrames，Dataframes对抗系列和系列对抗系列之间。作为示例，我尝试了以下代码： t = pandas.Series([1, 2]) print(t.T.dot(t)) 输出:5 但我希望是这样的： [1 2 2 4] Pandas很棒，但是不能以我想要的方式做矩阵乘法是最令人沮丧的，所以任何帮助都会非常感谢。 PS:我知道Pandas试图隐式地使用索引来找到计算矩阵乘积的正确方法，但似乎这种行为无法关闭！

浏览 0提问于2013-04-09得票数 2

回答已采纳

1回答

如何在Pandas函数中使用np.Vectorize()？

、、、、

我有一个以Pandas DataFrame格式操作的函数。它适用于pandas.apply()，但不适用于np.Vectorize()。请查找以下功能： def AMTTL(inputData, amortization = []): rate = inputData['EIR'] payment = inputData['INSTALMENT'] amount = inputData['OUTSTANDING'] amortization = [amount] if amount - payment &l

浏览 17提问于2022-09-21得票数 0

2回答

Pandas未在分配了Python3.5.0的索引后添加列

、、

我尝试过以下几种说法： import pandas as pd df = pd.DataFrame(index=[i for i in range(5)]) df.columns = ["res"+str(i) for i in range(5)] Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\Python35\lib\site-packages\pandas\core\generic.py", lin

浏览 33提问于2020-02-13得票数 1

回答已采纳

1回答

Pandas将行组合为标题信息

、、、

这就是我如何使用pandas读取和创建数据帧 def get_sheet_data(sheet_name='SomeName'): df = pd.read_excel(f'{full_q_name}', sheet_name=sheet_name, header=[0,1], index_col=0)#.fillna(method='ffill') df = df.swapaxes(axis

浏览 95提问于2021-11-22得票数 0

回答已采纳

1回答

python 2与python 3使用pandas进行列排序

、、、、

我面临着一个与pandas数据框中的列排序相关的问题，同时将其另存为csv。这是python 3中的顺序：而在python 2中，它还原列，而且如果列的数量大于2，则排序完全不同。下面是我将数据帧保存为csv的代码： selective_price = [] for index_sample, row_sample in selectivePriceList.iterrows(): selective_price.append(row_sample.loc[list_keys]) counter +=1 #print(selective_pric

浏览 4提问于2018-02-13得票数 0

回答已采纳

1回答

Python数据源-前两列消失

、、、

我已经开始使用PowerBI，并使用Python作为数据源，下面的代码如下所示。源数据可以下载 (约700兆字节)。数据最初是 (包含在IOT_2019_pxp.zip中)。 import pandas as pd import numpy as np import os path = /path/to/file to_chunk = pd.read_csv(os.path.join(path,'A.txt'), delimiter = '\t', header = [0,1], index_col = [0,1],

浏览 4提问于2022-08-08得票数 1

回答已采纳

1回答

潘达斯的问题

、、

抱歉，标题不清楚，但我不知道问题出在哪里.问题是，我希望加载一个CSV文件，然后将其分成两个数组，并对每个数组执行一个函数。它适用于第一个数组，但第二个数组是制造问题的，尽管每件事情都是一样的。我真的被困住了。“守则”如下： from wordutility import wordutility from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model import LogisticRegression from sklearn import cross_validation fr

浏览 2提问于2015-03-27得票数 4

回答已采纳

1回答

在Python中使用列名和行名创建矩阵

、

我是Python的新手。我想创建一个m x n矩阵，并在它的列和行中添加名称。我有一个包含行名称的列表和一个包含列名称的列表。似乎我需要用"Pandas“。但是我不知道如何使用它。有人能帮我吗？

浏览 0提问于2014-10-03得票数 1

2回答

熊猫系列不能获得索引

、

不知道这里有什么问题..。我想要的是这个系列中的第一个也是唯一的元素。 >>> a 1 0-5fffd6b57084003b1b582ff1e56855a6!1-AB8769635... Name: id, dtype: object >>> len (a) 1 >>> type(a) <class 'pandas.core.series.Series'> >>> a[0] Traceback (most recent call last): File "<pys

浏览 1提问于2017-07-13得票数 4

回答已采纳

2回答

如何在python中使用pandas读取csv文件的所有行？

、、

我使用pandas模块从.csv文件中读取数据。我可以编写以下代码来提取属于单个列的数据，如下所示： import pandas as pd df = pd.read_csv('somefile.tsv', sep='\t', header=0) some_column = df.column_name print some_column # Gives the values of all entries in the column 但是，我现在尝试读取的文件有5000多列，并且写出了以下语句 some_column = df.column_name 现在是

浏览 2提问于2016-11-25得票数 3

回答已采纳

1回答

使用python中的pandas打印名为12/12/12的列

、、、、

嘿，我有一个CSV文件，一个名为12/12/12的列，我需要打印整个列。在python中使用pandas，我如何打印它？当我尝试编写代码时： pd=df.12/12/12 print(pd) 它显示无效的语法

浏览 0提问于2020-01-13得票数 0

2回答

Pandas将数据插入MySQL

、、、、

我尝试使用Pandas (Python)将我从.csv文件中提取的数据列插入到MySQL中。以下是我到目前为止拥有的代码。 import pandas as pd from pandas.io import sql from sqlalchemy import create_engine engine = create_engine('mysql://username:password@localhost/dbname') with engine.connect() as conn, conn.begin(): df = pd.read_csv('File.csv&

浏览 1提问于2017-07-25得票数 7

回答已采纳

1回答

获取Pandas DataFrame第一列

、

这个问题很奇怪，因为我知道如何做某事，但我不知道为什么我不能用另一种方法。假设简单的数据帧： import pandasas pd a = pd.DataFrame([[0,1], [2,3]]) 我可以很容易地对这个数据帧进行切片，第一列是a[[0]]，第二列是a[[1]]。很简单，不是吗？现在，让我们有更复杂的数据帧。这是我的代码的一部分： var_vec = [i for i in range(100)] num_of_sites = 100 row_names = ["_".join(["loc", str(i)]) for i in

浏览 4提问于2017-01-31得票数 12

回答已采纳

2回答

在python中从excel文件中的数据创建数组。

、、

我是python和pandas的新手，你能帮我回答这个看似简单的问题吗？我已经有一个包含我的数据的excel文件，现在我想用python创建一个包含这些数据的数组。例如，我在excel中有如下数据： ? 我想从这些数据中创建一个矩阵，如下所示的python代码： ? 实际上，我的数据要长得多，所以有没有办法利用pandas把我的excel文件中的数据放到python中的一个矩阵中，就像上面的简单例子一样？谢谢!

浏览 20提问于2021-03-30得票数 0

1回答

熊猫分级索引-不工作的数据？

、、

我在DataFrame中处理值时遇到了问题，但是我似乎对Series对象没有任何问题。 >>> df=DataFrame([0.5,1.5,2.5,3.5,4.5], index=[['a','a','b','b','b'],[1,2,1,2,3]]) >>> series=Series([0.5,1.5,2.5,3.5,4.5], index=[['a','a','b','b','b'],[1,2,

浏览 3提问于2013-12-05得票数 1

回答已采纳

1回答

如何在R中设置行索引名？(就像潘达斯中的DF.index.name )

、、、、

如何在R data.frame 对象中设置行索引名？我试着寻找堆栈溢出的答案，但我甚至想不出如何搜索它？这一种解释了它，但是他们正在将它转换成一个矩阵？。 > dimnames(DF_c) = c("sample","cluster") Error in `dimnames<-.data.frame`(`*tmp*`, value = c("sample", "cluster" : invalid 'dimnames' given for data frame 在Python中，我只需要做Pa

浏览 1提问于2016-08-22得票数 5

回答已采纳

2回答

如何在Python表中从组合框中获取currentIndex()属性

、、

我对Python的对象编程不是很在行，所以我不得不寻求帮助。我以这种方式在表格中创建了一个组合框(它是有效的)： self.comboBoxEng = QtGui.QComboBox() self.tableWidget_1.setCellWidget(row,column,self.comboBoxEng) 问题是：如何获取currentIndex()属性(例如...)来自用作tableWidgetItem的combobox

浏览 0提问于2013-12-11得票数 0

1回答

Python pandas在尝试访问大型数据集上的'DATE‘列时产生错误

、、、、

我有一个3'502'379行3列的文件。以下脚本本应执行，但在日期处理行中引发错误： import matplotlib.pyplot as plt import numpy as np import csv import pandas path = 'data_prices.csv' data = pandas.read_csv(path, sep=';') data['DATE'] = pandas.to_datetime(data['DATE'], format='%Y%m%d') 这是发生

浏览 2提问于2016-08-09得票数 1

1回答

如何在R中创建密度图矩阵

、、、、

我不想为一个数据框创建不同的不同图，而是想为一个数据框创建一个密度图矩阵，其中我可以在一个图中看到所有列。为了单独创建它，我使用以下代码。如何才能在一个绘图中获得所有列？ loan_amnt <- density(out_data$loan_amnt) plot(loan_amnt, main="Loan Amount") polygon(loan_amnt, col="red", border="blue")

浏览 42提问于2019-05-19得票数 3

回答已采纳