Pandas pd.cut ValueError:值的长度与索引的长度不匹配_Pandas和Sets - ValueError:值的长度与索引的长度不匹配_Python ValueError:值的长度与索引的长度不匹配 - 腾讯云开发者社区

python、pandas

ValueError信息试图告诉我什么？下面的代码有什么问题，或者我期望它能工作？在分配的两边，切片级数的长度是相同的。 import pandas as pd d = {'A':[1,2,3,4,5], 'B':[6,7,8,9,0], 'C':[7,8,4,2,0]} df = pd.DataFrame(data=d) df["D"] = 0 print( len( # shows that lengths of all slices is the same: 4 4 4 4 df["D"][1:]), le

浏览 3提问于2022-09-29得票数 0

回答已采纳

1回答

‘`ValueError:索引包含重复条目，当做熊猫剪裁时不能重塑’

python、pandas、dataframe、numpy、cut

这是我的数据 sitename SOREANG SOREANG SATC L SUMELAP L SUKAJAYA L TAWANG sitename1 SOREANG 1.0 0.5 0.0 0.0 0.0 SOREANG SATC 1.0 1.0 0.0 0.0

浏览 5提问于2022-04-11得票数 2

2回答

返回值为alist时使用pandas赋值函数时出错

python、pandas

我想知道为什么熊猫赋值函数不能处理返回的列表。例如 df = pd.DataFrame({ "id" : [1,2,3,4,5], "val" : [10,20,30,30,40] }) def squareMe(x): return x**2 df = df.assign(val2 = lambda x: squareMe(x.val)) # Out > Works fine : Returns a DataFrame with squared values 但如果我们返回一个列表， def squareMe(x):

浏览 1提问于2021-10-07得票数 1

2回答

过滤数据集中的多个赋值

python、pandas

尝试使用过滤过的数据集进行多个辅助时，我遇到了一种奇怪的行为，我无法解释自己。我的测试数据： import pandas as pd wert = 2.5 df = pd.DataFrame([['Test', 12, None, None], ['Test2', 15, None, None]], columns=['A','B','C','D']) 我的第一个问题是执行这一行代码： df.loc[(df['A'] == 'Test'), ['D']

浏览 0提问于2019-06-11得票数 3

回答已采纳

1回答

ValueError:值的长度与嵌套循环中的索引长度不匹配

python、pandas、for-loop、nltk、list-comprehension

我正在尝试删除列中每一行的句号。列包含行和行，因为我已经用nltk对其进行了nltk，现在它是一个包含元组的列表。我试图用这个嵌套的列表理解删除停止词，但它说的是ValueError: Length of values does not match length of index in nested loop。怎么解决这个问题？ import pandas as pd from nltk.corpus import stopwords from nltk.tokenize import word_tokenize data = pd.read_csv(r"D:/python proj

浏览 1提问于2020-05-19得票数 2

回答已采纳

1回答

熊猫中的矩阵乘法

python、pandas

我将数值数据存储在两个DataFrames x和y中。来自numpy的内积可以工作，但来自pandas的点积不能。 In [63]: x.shape Out[63]: (1062, 36) In [64]: y.shape Out[64]: (36, 36) In [65]: np.inner(x, y).shape Out[65]: (1062L, 36L) In [66]: x.dot(y) --------------------------------------------------------------------------- ValueError

浏览 1提问于2013-05-10得票数 18

回答已采纳

2回答

在数据框架中循环失败:重写现有列值

python、python-3.x、pandas、dataframe、jupyter-notebook

我正在使用for循环来重用现有的数据帧。示例代码： for i in range(0, 5, 1): RGU_TT_TempX = pd.DataFrame() RGU_TT_TempX = RGU_TT_Temp #Merging Regular Ambulance TT with MSUs TT #Updating MSUs TT according to the Formula RGU_TT_TempX["MSU_X_DURATION"] = 0.05 + df_temp_MSU1["MSU_X_DURATION"

浏览 1提问于2022-10-26得票数 0

1回答

如何在Python数据集中插入新列

python

我有一个数据集，其中包含供应商和制造商的列表。我想为每个唯一的供应商和制造商分配一个唯一的编号。我正在使用Python，我这样做是为了执行一些机器学习预测。这是我到目前为止所拥有的 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline df = pd.read_csv('MasterData030617.csv') X = df.dropna(axis=0) numbers= np.unique(X['

浏览 2提问于2017-09-10得票数 1

1回答

如何解释特定于我的代码的索引错误

python、pandas

目前我有一个索引错误问题，我想了解一下。如何解释if len(arr) and (arr.max() >= len_axis or arr.min() < -len_axis):？也就是说，我不知道它引用的是哪个数组，即与我的代码相关的len(arr)或len_axis。输出： IndexError Traceback (most recent call last) <ipython-input-27-f9c0ccc07fa7> in <module> ----> 1 Engine_

浏览 21提问于2020-10-02得票数 1

回答已采纳

1回答

如何使用分类器根据数字数据和标记数据进行预测？

python、python-3.x、machine-learning、scikit-learn、data-science

我正在尝试训练和安装一个分类器，然后使用它进行预测，基于数字数据和标记数据的组合。我试图预测车辆的price，基于这些预测变量。 prediction_values = [2, 164, 'audi', 'gas', 'std', 'four', 'sedan', 'fwd', 'front', 99.8, 176.6, 66.2, 54.3, 2337, 'ohc', 'four', 109, 'mpfi', 3.19, 3.4,

浏览 6提问于2022-09-28得票数 -1

回答已采纳

1回答

如何修复python列表理解错误？

python-3.x、list-comprehension

我正在学习python，我需要使用列表理解来回答一个关于作业的问题，但是我找不到一个错误。我有一个数据与参与者，他们的年龄，以及他们的分数在不同的测试。我试着用列表理解来得到一个年龄以下参与者的分数列表， df['scoreunder18'] = [row for row in df['score'] if df['Age'] < 18 in row] 但是得到了以下错误： *** ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.i

浏览 2提问于2022-11-25得票数 0

回答已采纳

2回答

无法使用序列设置pandas列值，而是将所有内容设置为np.nan

python、pandas、dataframe、indexing、nan

我有以下pandas (pd)数据帧： > df = pd.DataFrame({'x':[1,2,3], 'y':[4,5,6], 'z':[7,8,9]}, index=['one', 'two', 'three']) > df x y z one 1 4 7 two 2 5 8 three 3 6 9 和一系列： s = pd.Series([99,99,99]) 当我尝试将b中的这些值分配给df中的某个列时，我没有得到任何错误，但该列中

浏览 0提问于2020-05-08得票数 0

1回答

Geopandas集合几何学: ValueError for MultiPolygon“等伦键和值”

python、pandas、geopandas、shapely

我有两个带有几何列的地理数据，我把一些几何图形从1复制到另一个。这对多边形很好，但对任何(有效) MultiPolygon都返回一个MultiPolygon。请建议如何解决这个问题？我不知道是否/如何/为什么要更改MultiPolygon以获得“相等的len键和值”？ geodata01.loc[index, 'geometry'] = geodata02.loc[index, 'geometry'] 这种方法适用于多边形。只有在MultiPolygons中我才能得到： ValueError if len(labels) != len(value): --

浏览 0提问于2019-05-07得票数 5

回答已采纳

3回答

熊猫:根据另一个数据帧列(python)中的值范围，在单独的数据帧列中计算值。

python、pandas

我使用python3.9，并试图根据另一列中的一系列值计算另一个dataframe列中的输出值。例如，在df['a']中，我有0到50之间的整数，没有特殊的顺序。我正在尝试基于if语句在同一数据帧中创建另一个名为df‘’output_ column的列。 import pandas as pd import numpy as np p = 'a' if df[p] in range(0, 7): df['output_column'] = 95 elif df[p] in range(8, 14): df['out

浏览 9提问于2022-03-09得票数 0

回答已采纳

1回答

LightGBM fit抛出带有pd.cut分类功能的"ValueError:检测到循环引用“

python、machine-learning、categorical-data、lightgbm、bins

我一直在非常满意地使用lightGBM模型，因为我拥有具有数千万个特征和数百万行的大型数据集，以及大量的分类列。我很喜欢lightGBM获取pandas数据帧的方式，该数据帧具有简单的astype('category')定义的分类特征，而无需任何一次性编码。我还有一些浮动列，我正在尝试将它们转换为分类存储箱，以加快收敛并强制决策点的边界。问题在于，尝试使用pd.cut绑定浮点列会导致fit方法失败并抛出ValueError: Circular reference detected 有一个类似的问题here，实际上在回溯中提到了Json编码器，但我没有DateTime专栏，因为

浏览 71提问于2019-04-29得票数 3

回答已采纳

2回答

有错匹配行数的Python和NumPy.where行为

python、numpy、pandas、where

在下面的所有示例中，我都使用了Pandas0.8.1，但我可以确认，当我使用Pandas 0.11时，相同的示例对我来说是一样的。依赖于将Pandas版本更改为较新版本的解决方案不适用于我当前的问题(尽管请随意添加评论(而不是答案)来说明是否在新的Pandas版本中修复了这个问题)。我有一个Pandas DataFrame对象示例 In [20]: dfrm Out[20]: A B C D 0 1.202034 -0.285256 0.392160 0 1 1.799628 -0.169389 -0.305984

浏览 3提问于2013-08-28得票数 1

回答已采纳

1回答

创建基于通用日期时间格式DD/MM/YYYY的新列，但遇到错误"ValueError: bins必须单调增加“。

python-3.x、pandas、dataframe、datetime、python-datetime

我有一个熊猫数据帧列，其一般日期格式如下所示。我的日期格式是DD/MM/YYYY。 dates 0 11/04/2017 1 17/04/2017 2 23/04/2017 3 02/04/2017 4 30/03/2017 我想根据这个日期列创建一个新列，例如预期的新列。 phase 0 3 1 4 2 5 3 2 4 1 我尝试使用本文中建议的方法但是我遇到了一个错误 --------------------------------------------------------------------------- Valu

浏览 12提问于2022-06-26得票数 0

回答已采纳

1回答

如何通过构造简单的熊猫系列来定义一个正确的指数？

python、pandas、series

我有以下python字典： sdata ={'Ohio': 35000, 'Oregon': 16000, 'Texas': 71000, 'Utah': 5000} 假设我想用这本字典制作熊猫系列。出于某些原因，我希望使用其他列来构造Series： states = ['California', 'Damascus','Ohio', 'Oregon', 'Texas','Regensburg', 'Munich'] o

浏览 4提问于2021-11-29得票数 2

回答已采纳

1回答

ValueError:列必须与键的长度相同--为什么不能对数字列表使用pd.cut()

python、pandas

我可以看到其他类似的问题，但我不能让他们的解决方案适用于我。我写了这段代码： print(list(output_dataframe2['confidence_range'][0:100])) output_dataframe2['confidence_range'] = output_dataframe2.apply(lambda x: pd.cut(output_dataframe2['confidence_range'][0:100], [.3, .4, .5, .6, .7, .8, .9, 1]),axis=0) 产出如下： [0

浏览 4提问于2022-05-26得票数 0

回答已采纳

2回答

熊猫-搜索关键词

python、pandas、dataframe

我试图在dataframe中搜索关键字，如果使用以下代码找到关键字，则打印关键字： if df[df['description'].str.contains(keyword,case=False)]: print(keyword) else: print("NOT FOUND") 我收到以下错误消息： ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 对如何解决这个问题有什么建

浏览 9提问于2021-12-09得票数 0

1回答

python将数据划分为间隔

python、dataframe、probability

我需要把数据转换成一个区间变化序列。 import numpy as np import math import sys import os import pandas as pd data = pd.read_csv("euro-dollar-exchange-rate-historical-chart.csv",index_col=['date'] ) data df=data['2017-01-02':] df value; date 1999-01-04 1.1825; 1999-01-05 1.1774; 1999-

浏览 1提问于2022-11-07得票数 0

2回答

如何将数据从长转换为宽，并在索引中按年对值进行分组？

python、arrays、pandas、dataframe、matplotlib

下面的代码与我使用的前一个csv一起工作，两个csv的列数量相同，列的名称也是相同的。运行的csv的数据没有的csv数据这个错误意味着什么？我为什么要犯这个错误？ from pandas import read_csv from pandas import DataFrame from pandas import Grouper from matplotlib import pyplot series = read_csv('carringtonairtemp.csv', header=0, index_col=0, parse_dates=True, squeeze=

浏览 3提问于2020-09-20得票数 6

回答已采纳

1回答

pandas.Series.str.match与pandas.Series.str.contains的区别

pandas

pandas.Series.str.contains和pandas.Series.str.match有什么区别？为什么下面是这样的情况？ s1 = pd.Series(['house and parrot']) s1.str.contains(r"\bparrot\b", case=False) 我得到了True，但当我得到 s1.str.match(r"\bparrot\b", case=False) 我找到False了。为什么是这种情况？

浏览 0提问于2019-09-10得票数 7

回答已采纳

1回答

使用Python3进行网页抓取

python-3.x

这段代码是关于网络抓取的。问题是，当我运行这段代码时，会得到一些错误，即"ValueError:传递的值的长度是6，索引隐含7“。如何修复此错误。值langth是，但是索引长度是7，这就是错误发生的原因。 import requests from bs4 import BeautifulSoup import pandas as pd url="https://en.wikipedia.org/wiki/List_of_Game_of_Thrones_episodes" page=requests.get(url) soup=BeautifulSoup(page.t

浏览 8提问于2019-12-20得票数 1

2回答

从df列中的列表中筛选项

python、pandas、list

我试图找出如何从列类型为list的另一列中创建一个具有值的新列。如果该值满足条件，我很难只从该列表中选择特定的值，而不是整个列表。更具体而言，我想创建一个新列，其中包含“批评者”的值。结果应该是这样的： ID LIST_COLUMN NEW COLUMN id1 ['moviecritic', 'movie', 'disney'] moviecritic id2 ['musiccritic',

浏览 1提问于2021-05-28得票数 2

回答已采纳

1回答

熊猫-如何按括号和唯一的列值进行分组？

python、pandas

所以，我偶然发现了一个有趣的条形图我发现了，我正在尝试重新创建数据是如何按范围箱(我使用过pd.cut)和按国家分组的。下面是我迄今为止尝试过的代码，但是我得到了错误，(错误的)行被注释掉了。 import pandas as pd ## csv file in zip http://ec.europa.eu/eurostat/cache/GISCO/geodatafiles/GEOSTAT-grid-POP-1K-2011-V2-0-1.zip url="C:/Users/Simon/Downloads/GEOSTAT-grid-POP-1K-2011-V2-0-1/Ver

浏览 0提问于2018-06-25得票数 0

回答已采纳

1回答

年龄组分类

python、pandas

我有dataframe，在我的年龄专栏，我想应用用户定义的功能，所以它安排年龄在垃圾箱。下面的函数试图应用于列，但我得到了错误。列名为“年龄” def ageGroup(x): if (data_drop_row['age'] > 0) & (data_drop_row['age'] <= 10): return '1' elif (data_drop_row['age'] > 10) & (data_drop_row['age'] <= 20

浏览 3提问于2019-11-28得票数 0

回答已采纳

1回答

修复代码以摆脱ValueError:无法使用长度不同的多索引选择索引器进行设置

python、pandas

当我尝试从另一列的值有条件地更新数据框列时，我得到了以下错误。 ValueError: cannot set using a multi-index selection indexer with a different length than the value. 在花了几个小时之后，我还没能找出原因。以下是演示此问题的简化代码： dfm = pd.DataFrame({'jim': [0, 0, 1, 1], 'joe': ['x', 'y', 'z', 'y

浏览 0提问于2019-04-06得票数 7

回答已采纳

2回答

ValueError:使用可迭代设置时必须具有相等的len键和值

python、python-3.x、pandas、dataframe

当我运行这个玩具代码 test = pd.DataFrame({'a': [1, 2, 3, 4]}) test['b'] = '' for i in range(len(test)): test['b'].loc[i] = [5, 6, 7] 我有个警告 SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation: https:

浏览 6提问于2022-03-31得票数 0

回答已采纳

3回答

用非唯一标签切开的熊猫

python、pandas

我正在尝试bin数据，并基于bin应用一个浮点值。我认为pandas.cut是解决这一问题的工具，但显然它需要为每个bin标签指定唯一的值。 values = [0.6, 0.5, 0.5, 0.6, 0.8, 0.9] bins = [0, 2, 5, 10, 15, 25, 200] binned = pd.cut(original_table[field], bins, labels=values) >>> ValueError: Categorical categories must be unique 我的数据(original_table)非常大，迭代地做任何事

浏览 0提问于2018-01-26得票数 3

回答已采纳

1回答

如何将数据导入现有数据集的特定列并保存为新数据集？

python、excel、pandas、selenium、openpyxl

当我继续我的项目在python抓取到excel，我设法提取我想要的信息，并把它放在一个新的excel文件。接下来，我不想在新的工作表上生成数据列表，而是将每个数据列表放到现有数据集的不同列中。下面是我的第一步代码，以整理我从网站上需要的所有细节，并将其放入数据框架中 import selenium from selenium.webdriver.common.by import By from selenium import webdriver import pandas as pd path = "C:\\Users\\ChloeChew\\Downloads\\chromed

浏览 5提问于2022-11-14得票数 0

1回答

在QTableModel中，带有日期时间列名的熊猫数据文件的行为是出乎意料的

python、pandas、qtablewidget、pyside6

我试图自动处理旧的Excel文件并导入数据库。使用pandas.read_excel()可以很好地处理某些文件，但对于其他文件则存在一些问题。我试图生成一个MWE (如下所示)，但是它的行为与pandas.read_excel()不完全一样，因为手动创建一个dataframe似乎很好。是pd.read_excel()函数做了一些事情.我想？我使用的excel文件就是旧.xls格式文件中的任何数据，其中第一行的值之一是日期。在使用pd.read_excel(filename, skiprows=4, header=None)导入excel文件并使用df.columns = ["1&

浏览 13提问于2022-10-21得票数 0

1回答

Dask -如何将系列产品串联成一个DataFrame？

python、pandas、dataframe、dask、dask-distributed

如何从应用于Dask系列的函数中返回多个值？我试图从dask.Series.apply的每一次迭代中返回一个系列，最后的结果是一个dask.DataFrame。下面的代码告诉我元数据是错误的。然而，全熊猫版本起作用了。这里怎么了？更新：--我认为我没有正确地指定元/模式。我该如何正确地做这件事？现在，当我放弃元参数时，它就起作用了。然而，它提出了一个警告。我想用达斯克“正确”。 import dask.dataframe as dd import pandas as pd import numpy as np from sklearn import datasets iris = dat

浏览 0提问于2019-03-05得票数 1

回答已采纳

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

python、python-3.x、pandas、data-science

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

1回答

将列的向量化分配给列的子集

python、pandas

我有一个Pandas DataFrame，包含i、行和j列。我希望将这个DataFrame中的值替换为第二个DataFrame中的所有值，后者具有相同的i行，但有k列，其中k是j的子集。有效的办法是： for col in df2.columns: df1[col] = df2[col] 有没有一种更快、更无头绪的方法？

浏览 2提问于2019-01-24得票数 1

回答已采纳

1回答

将DataFrame的最后一列附加到另一个DataFrame

python、pandas、python-3.4

我有一个大的csv文件，我把它转换成一个pandas.DataFrame。之后，我将这个数据分割成几个较小的数据，处理它们并将它们转换回一个csv文件。在处理步骤中，我需要将原始数据帧的最后一列附加到较小的数据帧。我试着用df.iloc[:,-1]和df.ix[:,-1]做这件事。当我这么做时： rating_column = df.iloc[:,-1] #get last column from original dataframe print(rating_column) 我得到了正确的结果： timestamp 2

浏览 0提问于2015-07-23得票数 1

回答已采纳

1回答

在数据帧的每个索引处输入值

python、pandas

我有一个熊猫数据帧，我正在视频中存储关于不同对象的信息。对于视频的每一帧，我将对象的位置保存在一个数据帧中，其中列'x'，'y‘’粒子‘，帧编号在索引中： x y particle frame 0 588 840 0 0 260 598 1 0 297 1245 2 0 303 409 3 0 307 517 4 这工作得很好，但我想保存有关视频的每一

浏览 15提问于2019-05-17得票数 0

1回答

使用两个pandas DataFrame将NaN值替换为实际值

python、pandas

假设我有两个DataFrames a和b，其中a大于b，并且都是NaN。b.index是a.index的子集，但是b具有实数值。我希望将b中的值合并到a中。 In [102]: mset Out[102]: <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 9446 entries, 2012-11-02 07:00:00 to 2012-11-05 15:24:00 Data columns: open 9207 non-null values high 9207 non-null v

浏览 2提问于2012-12-06得票数 1

回答已采纳

2回答

在Python中创建以另一个变量的值为条件的变量

python、pandas

我试图生成一个变量，它的值依赖于另一个变量的值。我的数据集是urban_classification，我正在尝试根据变量URBRUR的值创建变量prc_urbain。这是我的代码： if urban_classification.prc_urbain>0.5 : urban_classification['URBRUR'] = "urban" else: urban_classification['URBRUR'] = "rural" 我得到了这个错误信息： Traceback (most recen

浏览 1提问于2019-11-22得票数 0

2回答

ValueError:仅在一行上工作时，列必须与键的长度相同

python、pandas、dataframe、expand

我试图根据一列的拆分向DataFrame添加列。对于两行，所有操作都正常，空列的值为“None”。当我只有一行而DataFrame不能展开时，我希望它也被赋值'None‘。工作实例： >>> import pandas as pd >>> df = pd.DataFrame({'auth':['dbname_user','dbname']}) >>> df auth 0 dbname_user 1 dbname >>> df[[&#

浏览 19提问于2022-08-23得票数 0

回答已采纳

1回答

使用iloc对来自dataframe的值求和

python

--编辑-- 我正在遵循多标签类别预测的Kaggle上找到的脚本：我目前在命令行344，它是探索性分析部分的一部分： bar_plot = pd.DataFrame() bar_plot['cat'] = description_category.columns[1:] bar_plot['count'] = description_category.iloc[:,1:].sum().values bar_plot.sort_values(['count'], inplace=True, ascending=False) bar_plot.re

浏览 1提问于2021-06-25得票数 0

1回答

数据帧上的滚动窗口，多列输入和输出

python-2.7、pandas

我有一个函数myfunc，它对两个pandas DataFrame列进行计算。输出是一个Numpy数组。 def myfunc(df, args): import numpy return numpy.array([df.iloc[:,args[0]].sum,df.iloc[:,args[1]].sum]) 此函数在rolling_df_apply中调用： def rolling_df_apply(df, myfunc, window, *args): import pandas result = pandas.concat(pandas.DataFrame(

浏览 1提问于2015-07-28得票数 0

1回答

ValueError:当将新列分配给DataFrame时，无法从重复轴重新索引

python、python-3.x、pandas、dataframe

我试图在我的约会时间索引中找出几个小时在两个不同的时间之间。这是我的密码： rbe60['result'] = rbe60.index.hour.to_series().between(3,23) 唯一的问题是我一直在犯这个错误。 raise ValueError("cannot reindex from a duplicate axis") ValueError: cannot reindex from a duplicate axis 我看过其他一些帖子，并意识到这意味着我的索引或列中可能有一个重复的值。我试着跑去看看副本会在哪里，但都是空的。 d

浏览 0提问于2018-12-04得票数 3

回答已采纳

2回答

将查找表应用于DataFrame以查找回收箱或范围

python、python-3.x、pandas

我有一个类似于下面的DataFrame。假设这些是销售人员列表中的销售额。此外，我有一个查表，其中包含按美元计算的佣金。看上去如下所示。所以，0-50,000美元= 5%，50,001-250,000美元= 4%，等等。我想要做的是将查找表应用到sales表，以生成下面的DataFrame。尝试1： In [66]: a Out[66]: Sales_1 Sales_2 Sales_3 0 200000 300000 100000 1 100000 500000 500000 2 400000 1000000 2

浏览 6提问于2017-03-27得票数 3

回答已采纳

2回答

如何更改Pandas系列的索引值？

python、pandas、series

如何将Pandas系列的索引值从它们默认的常规整数值更改为我所拥有的列表中的值？例如： x = pd.Series([421, 122, 275, 847, 175]) index_values = ['2014-01-01', '2014-01-02', '2014-01-03', '2014-01-04', '2014-01-05'] 如何将index_values列表中的日期作为我创建的系列中的索引？

浏览 6提问于2020-01-04得票数 13

回答已采纳

1回答

使用np.select更改Pandas列中的混合数据类型(int和str)

python、pandas、dataframe、numpy、binning

我一直试图将一个列从我的df映射到4个类别(binning)，但是，该列中包含混合值: int和str，如下所示： df['data_column'] = ['22', '8', '11', 'Text', '17', 'Text', '6'] 我一直在尝试将它们更改为： - 1 to 10: superb - 10 to 20: awesome - 20 to 30: great - 'Text': text 这就是我一直试图解决的方法： my_cr

浏览 4提问于2022-10-01得票数 0

回答已采纳

1回答

根据N的值创建行的存储桶列表

python-3.x、pandas

我有一个有11行的熊猫数据帧。我想根据N的值创建一个列的列表，如下所示： import numpy as np import pandas as pd import math import sys df = pd.DataFrame({'group':[1,1,1,2,2,2,2,3,3,4,5]}) df 例如：如果N值被指定为2，那么我想创建2列表，如下所示： list = [[1,1,1,2,2,2,2], [3,3,4,5]] 以便每个组都留在相同的列表中。如果列表的长度不相同也没关系。

浏览 12提问于2019-12-13得票数 3

2回答

滚动窗口的问题: ValueError:传递值的长度为3，索引意味着2

python-3.x、pandas

我正面临着潘达斯的以下问题，我无法识别出任何错误。 churned_or_dormant_customers_by_month = jobs_by_customer_and_month.fillna(0).rolling(2, 2, axis='columns').apply(lambda window: 1 if not window[1] and window[0] else 0).sum(skipna=True) 上述内容提供了以下跟踪： Traceback (most recent call last): File "<console>"

浏览 0提问于2020-07-29得票数 3

2回答

仅将布尔掩码应用于数据框列的索引部分

python、pandas、indexing、mask

我有一个包含一些列的数据帧： >>> np.random.seed(0xFEE7) >>> df = pd.DataFrame({'A': np.random.randint(10, size=10), 'B': np.random.randint(10, size=10), 'C': np.random.choice(['A', 'B'], size=10)}) >>&g

浏览 4提问于2021-04-22得票数 3

回答已采纳

1回答

为什么我得到的矩阵不是DataFrame点函数的对齐误差？

python-3.x、pandas

我正在尝试使用Numpy和Pandas在Python中实现简单的线性回归。但是我得到了一个ValueError:矩阵不是对齐的错误，因为调用点函数实质上是计算矩阵乘法，正如文档所说的那样。下面是代码片段： import numpy as np import pandas as pd #initializing the matrices for X, y and theta #dataset = pd.read_csv("data1.csv") dataset = pd.DataFrame([[6.1101,17.592],[5.5277,9.1302],[8.5186,13.

浏览 4提问于2020-03-17得票数 3

回答已采纳