Python pandas:使用条件进行索引_Python:使用条件索引逐列附加Pandas DataFrame_Python pandas -基于条件的索引查找 - 腾讯云开发者社区

python、pandas、series、getvalue

我和潘达斯一起处理了一些温度数据。在一个名为“ data ”的中，我得到了第一个数据观察，这要感谢这行代码： first_obs = data['DATE'][0] 请记住，数据‘’DATE‘是一个pandas.Series对象。数据指标:台站高程、纬度、经度、PRCP、TAVG、TMAX、TMIN年月在进行了一些数据操作之后，我创建了一个新的'monthly_data‘，其索引为:月份TAVG年temp_celsius ref_temp diff abs_diff 现在，我希望在“abs_diff”列中获得具有最大值的该数据value行： weather_anom

浏览 1提问于2021-04-11得票数 2

回答已采纳

1回答

将pandas数据框保存到csv文件时的附加列

python、python-2.7、csv、pandas、dataframe

这里是处理和保存csv文件的代码，以及原始输入csv文件和输出csv文件的代码，在Python2.7上使用pandas并想知道为什么在保存文件时在开头有一个额外的列？谢谢。 c_a,c_b,c_c,c_d hello,python,pandas,0.0 hi,java,pandas,1.0 ho,c++,numpy,0.0 sample = pd.read_csv('123.csv', header=None, skiprows=1, dtype={0:str, 1:str, 2:str, 3:float}) sample.columns = pd.Index(dat

浏览 3提问于2016-08-28得票数 5

回答已采纳

1回答

尝试将输出写入列获取:尝试使用.loc[row_indexer，col_indexer] = value而不是error

pandas

这是我的示例数据， Close 46.119999 47.259998 52.000000 这就是我创建df的方式； data = pd.read_csv('logo_bist_merged.csv') #this is justbecause last 413 rows are NA data.drop(data.tail(413).index,inplace=True) data.Date=pd.to_datetime(data.Date) data=data.set_index(data.Date) d

浏览 196提问于2020-12-06得票数 0

1回答

Pandas日期数据索引的奇怪行为

python、pandas

我刚刚完成了Pandas教程，对下面的行为感到有点困惑。 In [28]: d Out[28]: Status CustomerCount StatusDate 2009-01-05 9 2519 2009-01-12 10 3351 2009-01-19 10 2188 2009-01-26 10 2301 2009-02-02 7 2204 2009-02-09

浏览 4提问于2015-02-02得票数 0

回答已采纳

1回答

在jupyter笔记本中从熊猫数据中选择单行时发生的Python键错误

python-3.x、pandas、dataframe、jupyter-notebook

我成功地用StackOverflow解决了许多问题，但这是我第一次在其他地方找不到问题，自己也解决不了. 我在jupyter笔记本上工作，里面有熊猫的数据，包括文字评论和亚马逊产品的评分。下面是我的代码： import pandas as pd data = pd.read_csv("AmazonSampleForStudentOffice.csv") reviews = data[['reviewText', 'score', 'len_text']] reviews.head(5) 其结果是： reviewText scor

浏览 0提问于2020-03-31得票数 1

回答已采纳

1回答

如何在Python Dask数据帧中执行位置索引

python、pandas、dataframe、dask

我一直在使用Dask Concurrent.futures ，但我在使用(过时的) 时遇到了一些问题。具体地说，使用位置索引将dask数据帧分成测试/训练拆分： train = dfs[:-1] test = dfs[-1] 我也尝试过，但都无济于事： train = dfs.loc[:-1] test = dfs.loc[-1] 这给了我一个错误： KeyError Traceback (most recent call last) /opt/anaconda/lib/python3.5/site-packages/panda

浏览 13提问于2018-02-14得票数 4

1回答

查找两个xlsx文件之间相同的行

python、pandas、dataframe、compare

我只看了几篇帖子，但没有找到解决方案。我正在尝试使用Python中的Pandas比较不同工作簿中的两个Excel文件。 work1： A B C 1 1 1 2 2 2 3 3 3 work2： A B C 1 1 1 2 5 2 3 3 3 所需输出： A B C 1 1 1 3 3 3 到目前为止，我得到的是： import pandas as pd df1 = pd.read_excel('/path

浏览 0提问于2017-12-29得票数 0

2回答

尽管指数看起来是正确的，但熊猫应用了返回索引错误

python、pandas、indexing、apply

我得到了一个索引错误，我不知道如何修复它：IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match).，我不明白它为什么要抛出这个错误，因为display()调用中显示的索引是一致的。我尝试了答案中的双括号，但没有起作用。下面的可重复示例基于一个严重简化的真实代码版本。在最后一行中抛出错误。使用Python 3.7。 import pandas as pd def myfcn(row,

浏览 5提问于2021-02-09得票数 1

回答已采纳

1回答

Pandas数据帧中两列的差异

python、pandas、xlwings

嗨，我试着从Excel中得到两列，并解析成一个DataFrame，之后我需要减去这两列。这是我的代码 ndf = xw.Range('AI1:AJ' + str(len(last_row))).options(pd.DataFrame).value #Error in this line below ndf['VC-BC'] = ndf['VC'] - ndf['BC'] #xw.Range("BH1").options(index=False).value = ndf print(ndf.head(20

浏览 16提问于2020-06-17得票数 0

回答已采纳

2回答

Python3.4熊猫分类市场-按日期分列的数据

python-3.x、sorting、pandas

我正在尝试设置Python (3.4)代码，以便按日期对时间序列进行排序。在python shell中，我输入以下内容 >>>data = quandl.get("YAHOO/INDEX_GSPC", start_date="2017-01-01", end_date="2017-01-20") >>>print(data) 所以，我可以加载数据。但是，当我尝试使用排序命令时 >>>data = data.sort_values(by='Date') 我得到以下错误消息列表。

浏览 0提问于2017-03-31得票数 2

3回答

ValueError:长度不匹配:在pandas数据帧中创建分层列时，预期的轴有0个元素

python、python-3.x、pandas、dataframe、multi-index

我浏览了有关Pandas中的分层索引的。我尝试测试其中的示例，以创建一个具有分层索引的空数据帧： In [5]: df = pd.DataFrame() In [6]: df.columns = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]]) 但是，它会抛出一个错误： ValueError Traceback (most r

浏览 1提问于2017-04-04得票数 11

回答已采纳

3回答

从pandas数据帧创建numpy数组

python、arrays、pandas、numpy

import pandas as pd import numpy as np df = pd.read_csv('~/test.txt') list(df.columns.values) 我得到以下输出： ['time', 'Res_fs1', 'angle1', 'Res_fs2', 'angle2', 'Res_ps1', 'Force1', 'Res_ps2', 'Force2', 'object'] 当我尝试使

浏览 2提问于2017-06-28得票数 0

1回答

查询hdf5日期时间列

python、python-3.x、pandas、dataframe、hdf5

我有一个hdf5文件，其中包含一个表，其中列time是datetime64ns格式的。我想得到所有比thresh老的行。我怎么能这么做？这就是我尝试过的： thresh = pd.datetime.strptime('2018-03-08 14:19:41','%Y-%m-%d %H:%M:%S').timestamp() hdf = pd.read_hdf(STORE, 'gh1', where = 'time>thresh' ) 我得到以下错误： Traceback (most recent call last):

浏览 0提问于2018-03-08得票数 1

回答已采纳

1回答

循环遍历熊猫数据框架并创建新的列值

pandas

我试图循环一个csv文件，我把它转换成一个熊猫数据帧。我需要循环遍历每一行，并检查我拥有的纬度和经度数据(两个单独的列)，并根据lat、长数据是否在某个范围内，将代码(0、1或2)附加到同一行。我对python有点陌生，我希望您能提供任何帮助。这让我犯了不少错误。 book = 'yellow_tripdata_2014-04.csv' write_book = 'yellow_04.csv' yank_max_long = -73.921630300 yank_min_long = -73.931169700 yank_max_lat = 40.832

浏览 1提问于2015-11-16得票数 1

回答已采纳

1回答

片警告的Python数据副本

python、python-3.x、pandas、dataframe

import pandas as pd df_run = pd.read_csv('UserEventSummary.csv') df_run.accountId[0] = 'first-' + str(df_run.accountId[0]) 第三行给出了以下错误： /home/ec2-user/anaconda3/envs/python3/lib/python3.6/site-packages/ipykernel/__main__.py:1: SettingWithCopyWarning: A value is trying to be set on a

浏览 1提问于2019-01-03得票数 1

回答已采纳

1回答

为什么我要使用多处理和熊猫获得这个KeyError？

python、pandas、multiprocessing

我试图在我编写的模糊匹配脚本上使用多重处理，我需要进行14亿次比较，不需要多处理需要花费30+小时，所以我尝试在这里集成它。 def fuzzyCompare(data1, data2): print("Performing Fuzzy Matches...\n") similarityDf = pd.DataFrame(columns = ["Similarity Ratio", "Id1", Id2]) count = 0 for i in range(len(data1)): str1 = d

浏览 2提问于2020-01-02得票数 1

回答已采纳

1回答

熊猫/拟图直方图:可以绘制df，但不能绘制子集

python、python-2.7、pandas、matplotlib、ipython-notebook

df是一个巨大的数据格式。我只需要Zcoord > 1的子集。 df = pandas.DataFrame(first) df.columns = ['Xcoord', 'Ycoord', 'Zcoord', 'Angle'] df0 = df[df.Zcoord>1] 绘制df直方图的相同代码将不适用于df0。 plot1 = plt.figure(1) plt.hist(df0.Zcoord, bins=100, normed=False) plt.show() Ipython发出KeyError:0。 pytho

浏览 2提问于2015-11-24得票数 1

回答已采纳

1回答

用于数据分析的Python :CHP2PG 38 "prop_cumsum“错误

python、cumsum、prop

我正在写这本书，并在运行"Prop_cumsum“时继续运行错误 ascending=False).prop.cumsum() = > prop_cumsum = df.sort_index(by='prop‘) /Users/anaconda/lib/python3.5/site-packages/ipykernel/main.py:1: FutureWarning:通过对sort_index的论证被否决，请使用.sort_values(by=.)如果名称为 == 'main'： KeyError跟踪(最近一次调用)/Users/anaconda/li

浏览 0提问于2016-12-23得票数 0

1回答

改变约化矩阵熊猫的值

python、pandas、matrix、dataframe

我正在尝试实现算法，其中给定的矩阵(矩阵代表城市)应该根据条件进行缩减：在这里，矩阵(数据帧矩阵)： 0 1 2 3 4 0 9992 1 0 2 0 1 2 99991 5 0 0 2 0 4 9992 0 1 3 3 0 1 9991 2 4 1 0 2 2 99989 然后，根据一个条件，删除矩阵中的0行和

浏览 2提问于2016-10-26得票数 0

回答已采纳

3回答

根据其他列的条件填充空熊猫列

python、pandas、dataframe

假设我有以下玩具dataframe： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['nick', 15], ['juli', 14]] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name', 'Age']) # print dataframe. df 我创建了一个空列，我想

浏览 1提问于2019-08-15得票数 4

1回答

Python pandas.core.indexing.IndexingError:提供不可对齐的布尔序列密钥

python、pandas

因此，我读取了一个包含29列的数据表，并添加了一个索引列(总共30列)。 Data = pd.read_excel(os.path.join(BaseDir, 'test.xlsx')) Data.reset_index(inplace=True) 然后，我希望将数据子集为只包括列名包含"ref“或”Ref“的列；我从另一篇Stack post中获得了以下代码： col_keep = Data.ix[:, pd.Series(Data.columns.values).str.contains('ref', case=False)] 然而，我一直收到这个错

浏览 5提问于2017-09-23得票数 6

回答已采纳

2回答

我不能使用熊猫loc功能，但是loc可以工作

python、pandas、google-colaboratory、geopandas

我不能使用熊猫loc功能，但是loc可以工作。我的代码： import geopandas as gpd import pandas as pd gdf=gpd.read_file('') df=pd.DataFrame(gdf) df.head() df.loc['gid'] 获取错误： KeyError Traceback (most recent call last) /usr/local/lib/python3.6/dist-packages/pandas/core/indexes/b

浏览 0提问于2019-08-27得票数 1

回答已采纳

2回答

尝试使用pandas比较行中的值时出错

python、python-3.x、pandas、dataframe

给定一个数据集，例如：link to data：我想要比较并找到平均葡萄糖的最大值，一旦我找到了最大值，我就想能够计算葡萄糖利用率错误发生在我写 if(df1['Avg. Glucose (mg/dL)'][i] > df1['Avg. Glucose (mg/dL)'][i + 1]): 在： import pandas as pd # reading sheet 1 df = pd.read_excel('data.xlsx', sheet_name=1) # removing all rows with null Avg Gl

浏览 47提问于2021-04-27得票数 2

回答已采纳

2回答

数据上简单循环中不支持的奇怪操作错误

python

我工作在一个dataframe上，我想在一个列上迭代，因为我使用了许多数据格式，这样做了几百次。今天我遇到了一个错误，我无法思考它的问题所在。也许值得一提的是，数据文件是连接的。 log = (pd.concat([log_entry,log_exit]).sort_values(by=['date'])) 数据文件： position order price PnL date 2022-03-27 20:45:00 short entry 29.242291 0 2022-03-

浏览 6提问于2022-04-09得票数 0

回答已采纳

2回答

Python / Pandas - KeyError合并数据格式

python、pandas、merge、keyerror

我有两个数据文件，我正试图合并： target: version city_id code id 4 2 4 5736201000175 26 2 3 8290265000183 27 3 3 9529184000156 30 3 3 9263064000150

浏览 2提问于2017-07-23得票数 2

回答已采纳

1回答

Python负索引差异

python、pandas

我使用的是python 3.6，pandas 24.2，遇到了一些不同之处。 >>> x = pd.Series(range(3)) >>> x[-1] >>> x = pd.Series(range(3), index=[0,1,2]) >>> x[-1] 两者都会产生错误 Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/opt/conda3/ml4t/li

浏览 3提问于2020-04-26得票数 5

2回答

为什么熊猫的索引这么慢？如何使它更快？

python、pandas

运行此代码显示了大熊猫与常规python列表在速度上的差异： ser = pd.Series(range(100)) lst = ser.tolist() for _ in range(10): pandas_time = 0 list_time = 0 for _ in range(100000): r = randint(0, len(ser)-1) t = time() ser[r] pandas_time += time() - t t = time() lst[

浏览 2提问于2019-01-01得票数 1

回答已采纳

2回答

有错匹配行数的Python和NumPy.where行为

python、numpy、pandas、where

在下面的所有示例中，我都使用了Pandas0.8.1，但我可以确认，当我使用Pandas 0.11时，相同的示例对我来说是一样的。依赖于将Pandas版本更改为较新版本的解决方案不适用于我当前的问题(尽管请随意添加评论(而不是答案)来说明是否在新的Pandas版本中修复了这个问题)。我有一个Pandas DataFrame对象示例 In [20]: dfrm Out[20]: A B C D 0 1.202034 -0.285256 0.392160 0 1 1.799628 -0.169389 -0.305984

浏览 3提问于2013-08-28得票数 1

回答已采纳

4回答

熊猫DataFrame切片有一个KeyError：-1错误

python、pandas、dataframe

我已经将问题缩小到以下代码： import pandas as pd d = {'b' : 1, 'a' : 0, 'c' : 2} c = {'one':[1,2,3], 'two':[4,5,6]} p = pd.Series(d) pc = pd.DataFrame(c) print(p[-1]) # This line works print(pc['two'][-1]) # This line does not work. 追溯(最近一次调用)：文件"jdoodle.py"

浏览 0提问于2019-01-21得票数 2

2回答

如何从Pandas数据帧中提取与日期对应的值？

python、pandas

我有一个股票市场市盈率数据框架，我想从其中获得与单个日期相对应的数据。然而，下面的代码抛出了一个错误。 from nsepy import get_index_pe_history from datetime import date nifty_pe = get_index_pe_history(symbol="NIFTY", start=date(2011,1,1), end=date(2015,1,10)) print(type(nifty_pe)) print(nifty_pe.loc[nifty_pe[

浏览 9提问于2019-09-03得票数 0

1回答

matplotlib:在dataframe行上绘制一条迭代行

python、pandas、matplotlib

在玩具例子dataFrame中有2组坐标: x，y和ex，ey。 d = {'x': [1, 2, 3, 4], 'y': [3, 3, 3, 3], 'ex': [1, 2, 3, 4], 'ey': [6, 6, 6, 6]} toy = pd.DataFrame(data=d) 每组都需要先绘制分散图，然后用一条线连接起来。 plt.scatter(toy['x'],toy['y'], color='b') plt.scatter(toy['ex'],toy[&

浏览 0提问于2018-11-01得票数 0

1回答

过滤pandas df来自pandas系列的多列

python、pandas、dataframe

我有一个数据帧，为了创建一些分区，我必须从中检索唯一的值。我有这个部分，我可以得到一个小的数据帧，每一行都是一个特定的分区。我遇到的挑战是，我需要将原始数据帧过滤到适当的数据(不修改原始帧，以便我可以过滤所有值)，以便可以将其发送到S3。根据小数据帧中的序列过滤数据帧时遇到问题。下面是我的代码： df_partitions = df.groupby(['grid_id', 'case_id', 'snapshot_year', 'snapshot_month', 'snapshot_day'])

浏览 10提问于2020-02-22得票数 0

回答已采纳

1回答

使用pandas提取具有特定列值的行，列上没有标题

python、pandas

因此，我运行以下代码： import pandas as pd df = pd.read_csv(filename, delim_whitespace=True, header=None) 我的文件很大，所以为了清晰起见，我隔离了前14行和所有10列。 X = df.iloc[0:14, 0:10].values X打印时，结果如下所示(如标题中所述，没有列标题)： 📷 到现在为止还好。现在，我想隔离在第9列中有'CYT‘字符串的行。假设第0个索引，我想隔离第5，9和12行。接下来，我想把这三行放入一个矩阵中供以后使用。我该怎么做？我是python

浏览 21提问于2021-02-02得票数 1

回答已采纳

1回答

如何在Pandas中选择字符数与3个不同或包含至少一个字母或没有数据(NaN)的行？

python、pandas、character

我在Python中有DataFrame，如下所示( col1的数据类型是string)： col1 ------- 1112224 222 111 123DDT 985T NaN 我只需要选择以下几行：字符数与3不同或至少包含一个字母或 no data (NaN) 因此，我需要下面这样的东西： col1 ------- 123DDT 985T NaN 我怎么能在Python Pandas中做到这一点呢？

浏览 2提问于2022-07-06得票数 0

回答已采纳

1回答

添加最后一行代码会导致以下错误："in get_loc KeyError(key) from err“。是什么导致了这个错误？

python、pandas、dataframe、keyerror

我正在尝试将2013年至2018年的日期进行子集，并将代码的最后一行添加到这个错误中。为什么会发生这种情况，谁能告诉我是否有更好的方法来划分日期？错误： File "C:\Users\Dev\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\indexes\base.py", line 3080, in get_loc return self._engine.get_loc(casted_key) File "pandas\_libs\index.pyx",

浏览 7提问于2021-04-25得票数 4

2回答

"KeyError: 0“配xgboost，scikit-learn和大熊猫

python、pandas、scikit-learn、xgboost

我创建了这个演示来演示从库内部抛出的错误。该代码将数据集拆分为train/eval/test，并使用train/eval进行超参数搜索、早期停止，同时保留测试集以供以后进行评估。我缩小了与GridSearchCV交叉验证相关的错误范围，但无法找出确切的根本原因和修复方法。 from sklearn import svm, datasets from sklearn.model_selection import GridSearchCV from sklearn.model_selection import train_test_split import numpy as np import p

浏览 0提问于2018-09-14得票数 3

回答已采纳

2回答

将序列索引设置为具有更多级别的另一个索引

python、pandas、dataframe

我试图用一个比系列的原始索引包含更多级别的索引( Series，ix)来设置a1的索引。 >>> a = pd.DataFrame({'a': [1, 2, 3], 'b': ['b', 'b', 'b'], 'x': [4, 5, 6]}).set_index(['a', 'b']) >>> a x a b 1 b 4 2 b 5 3 b 6 >>> >>> a1 = a

浏览 1提问于2019-05-15得票数 1

回答已采纳

1回答

尝试根据另一个datafrme中的列修改列值时出现键错误

python、pandas、dataframe、keyerror

我有两个熊猫数据帧(df1和df2)。 df1 address mon tue wed ... address1 40 40 40 ... address2 20 20 20 ... address3 30 30 0 ... address3 0 0 30 ... ... ... ... ... ... df2 address mon tue wed ... address1

浏览 15提问于2021-10-03得票数 0

回答已采纳

1回答

Python在matplotlib basemap中绘制逗号分隔坐标(lat，long)

python、pandas、matplotlib、matplotlib-basemap

我正在处理Alienvault的reputation.data文件。这是一个40k恶意IP地址及其位置的列表。我是这样读文件的 addresses_columns = ["IP", "Reliability", "Risk", "Type", "Country", "Locale", "Coords", "x"] ip_addresses = pd.read_csv('reputation.data', sep='#', names=a

浏览 1提问于2017-03-16得票数 1

回答已采纳

1回答

Python熊猫索引错误

machine-learning、python、pandas

尝试运行找到的代码这里时出现索引错误。错误发生在10中的部分： for n in range(len(dominantTheta)): shift = dominantTheta[n] regressionDelta += dominantAmp[n] * np.cos(n * np.array(range(len(df))) + shift) 错误消息： Traceback (most recent call last): File "C:/Users/xxx/Desktop/Python Workspace/DSP.py", line 62, in &l

浏览 0提问于2019-06-27得票数 2

回答已采纳

2回答

重新采样到DatetimeIndex会引发错误

python、time-series、pandas

我创建了一个DatetimeIndex，并希望使用该索引对数据进行重新采样。当我这样做的时候，我得到了一个异常： Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/dist-packages/pandas-0.8.1-py2.7-linux-i686.egg/pandas/core/generic.py", line 188, in resample limit=limit, b

浏览 0提问于2012-10-25得票数 0

2回答

大熊猫逐字过滤

python、pandas、csv、filter、contains

我有csv文件： df=pd.read_csv(Path(os.getcwd()+r'\all_files.csv'), sep=',', on_bad_lines='skip', index_col=False, dtype='unicode') 栏： column=input("Column:") 字： word=input("Word:") 我想过滤一个csv文件： df2=df[(df[column].dropna().str.contains(word.lower()))] 但当我写信给专

浏览 14提问于2022-07-06得票数 0

1回答

我如何能够修复这个警告SettingWithCopyWarning？

python、pandas、dataframe

当我输入这段代码时，有人能帮我修复这个警告吗？ rh_can = df1.loc[(df1["hotel"] == "Resort Hotel") & (df1["is_canceled"] == 0)] ch_can = df1.loc[(df1["hotel"] == "City Hotel") & (df1["is_canceled"] == 0)] rh_can['adr_pp'] = rh_can['adr'] / (rh_can['

浏览 3提问于2022-06-18得票数 0

回答已采纳

1回答

可以使用dataframe ix进行赋值，但不能进行检索

python、pandas

我循环遍历pandas df的行，循环索引i。我可以使用ix函数分配几列，其中循环索引作为第一个参数，列名作为第二个参数。但是，当我尝试使用此方法检索/打印时， print(df.ix[i,"Run"]) 我得到一个下面的Typerror: str对象不能解释为整数。在某种程度上与Keyerror有关：“Run” 我不太确定为什么会发生这种情况，因为Run确实是数据帧中的一列。有什么建议吗？ Traceback (most recent call last): File \!"C:\WPy-3670\python-3.6.7.amd64\lib\site-packa

浏览 0提问于2019-07-27得票数 2

3回答

为什么'in‘连接器给了我错误的值？

python、pandas

我正在使用pandas做一个简单的数据分析，我想检查正在绘制的圆的数字是否在数据中。变量data是一个pandas数据帧，这里我只使用了'DayCount‘列。完整的csv文件和python脚本可在中查看 cont = 1 for i in range(1, 21): for j in range(1, 19): if cont in data['DayCount']: p = mpatches.Circle((i, j), 0.5, color='#01770b'

浏览 14提问于2019-07-30得票数 0

回答已采纳

4回答

python pandas:过滤出给定字段中包含null或空字符串的记录

python、pandas、dataframe

我正在尝试过滤数据框中field_A为null或空字符串的记录，如下所示： my_df[my_df.editions is not None] my_df.shape 这给了我一个错误： --------------------------------------------------------------------------- KeyError Traceback (most recent call last) <ipython-input-40-e1969e0af259> in <module&g

浏览 126提问于2016-09-14得票数 18

回答已采纳

1回答

熊猫df:检索具有单元格值的记录，==浮点不起作用。我做错了什么？

python、pandas

我有这段代码，我不知道如何检索我想要的行。我正在尝试检索具有device_id=16384035的行。我尝试了浮点数和整数，并在那里进行了字符串(因为它告诉我列是对象)，但都没有工作。 print(s_devices['Device ID']) print(s_devices.columns) print(s_devices.iloc[0,1]) print(type(s_devices.iloc[0,1])) print(s_devices[['Device ID']==float(16384035)]) 以上打印如下： 0 16384035.0

浏览 4提问于2022-02-12得票数 -1

回答已采纳

1回答

使用pandas中的索引列查看或过滤？

python、pandas

使用Python的pandas库，我导入了一个csv并将多个列设置为我的索引。出乎意料的是，当我显示数据帧时，索引列不再存在，并且我不能使用索引列作为过滤器选项。这让我想知道我是否错误地认为pandas索引类似于SQL索引。 date, exchange, symbol, low, high, open, close, last exchange和symbol足以唯一标识一行。它是加快了查找速度，还是添加了一些对stack/unstack/pivot/groupby之类的东西有用的语义信息？它能减少内存使用量吗？为什么要将日期、交换和符号移出数据帧(并移到索引系列中？)？把它们留在dat

浏览 1提问于2014-09-19得票数 0

2回答

我在读取这个csv文件并将第一列命名为"team“时遇到了问题。

python、python-3.x、csv

由于某些原因，我无法将csv文件正确读取到代码中。下面是我的代码： df_playoffs = pd.read_csv('/Users/hannahbeegle/Desktop/playoff_teams.csv', encoding='latin-1', index_col = 'team') df_playoffs.fillna('None', inplace=True) 以下是错误消息： Warning (from warnings module): File "/Library/Frameworks/Pyt

浏览 0提问于2019-07-18得票数 1

1回答

熊猫高级索引作业

python、pandas

在Pandas (v0.8.0) DataFrame中，我希望用另一列覆盖一段列。下面的代码将引发列出的错误。实现这一目标的有效替代方法是什么？ df = DataFrame({'a' : range(0,7), 'b' : np.random.randn(7), 'c' : np.random.randn(7), 'd' : np.random.randn(7), 'e' : np.random.randn(7), 'f' : np.random.randn(7), 'g' :

浏览 5提问于2012-07-13得票数 2

回答已采纳