在Pandas中从满足一定条件的多指标数据帧构造时间序列 - 腾讯云开发者社区

、、

sktime库需要一个非常“特殊”的data format。对于n个时间序列，每个序列的T值需要存储在长度为T的pandas序列的pandas Dataframe中，如下所示： DataFrame： index | Data 0 | pd.Series 1 | pd.Series ... | ... n-1 | pd.Series 我试图通过读取另一个数据帧来填充循环中n=2和T=3的空数据帧，但没有成功。下面是我的简化版本，在每一行中使用一个常量pd.Series： import pandas as pd df = pd.DataFrame(

浏览 14提问于2020-06-17得票数 1

回答已采纳

1回答

服务终结点的Azure Traffic Manager警报配置

、

我想在一个包含6个应用程序服务端点的TM配置文件上配置一个警报，如果一个端点在超过3分钟的时间内返回的值小于其最低值的20%，则该端点将使用“按端点返回的查询”指标生成警报。在Azure门户中配置警报看起来非常基本，所以我想知道这是否可能，是否有人有类似的警报？谢谢

浏览 0提问于2018-11-30得票数 0

1回答

如果为x==True，则启动数组；如果为y==False，则启动数组为true

、、、

我有两个数据帧。 PPASbool= 0 True 1 True 2 False 3 True 4 False CPASbool= 0 True 1 False 2 False 3 False 4 True 我在下面尝试了一下，但收到了一个错误 File "Typology.py", line 66, in <module> if PPASbool==True : File "C:\Users\Jim\Anaconda3\lib\site-packages\pandas\core\generic.py&

浏览 2提问于2018-11-21得票数 0

2回答

根据条件对数据帧中的正负连续元素进行计数

、、

我有一个这样的数据帧。 import pandas as pd df = pd.DataFrame({ 'col': ['neutral', 'neutral', 'neutral', 'positive', 'positive', 'negative', 'neutral']}) 现在我想更新'col‘，这样当从正到负或相反的变化时，我会得到真，否则会得到假(即连续的相等值)，当从正/负到中性的变化时，我也会得到假，反之亦然。我尝试了grouby

浏览 11提问于2018-12-20得票数 2

回答已采纳

1回答

合并条件灵活的两个数据帧

、

我有两个pandas数据帧： import pandas as pd df1 = pd.DataFrame({'Counterparty':['Bank','Client','Bank','Bank'], 'Maturity':[200, 400, 200, 400], 'Amount':[100, 100, 100, 100], 'Factor':[0,0,0,0]}) df2 = pd.Da

浏览 3提问于2018-02-18得票数 2

2回答

确定日期时间是否在python中的其他两个日期之间

、、

我在一组数据中有多个“开始”和“停止”时间序列，我想看看一组特定的日期/时间是否落在一组给定的“开始/停止”时间之间。我在python中使用pandas，并尝试将数据作为数据帧或时间序列-两者都不起作用。我一直在使用这段代码： print (start1 < test1[0:LenS] < stop1).any() (请注意，"test10:LenS“只是为了确保test1与start1和stop1的长度相同)，我得到了这个错误： ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bo

浏览 12提问于2017-03-14得票数 0

回答已采纳

1回答

excel中的2种时间格式，带有日期

我有一个5000行的excel数据。但是，我需要对数据进行过滤，因为数据是从Oracle数据库中提取出来的，它是用日期和时间戳捕获的。现在我只需要在时间基础上过滤数据，因为日期是相同的，即3月31日。所以有两个问题：- 1)我应该如何过滤数据只有基本时间。2)另一个问题是时间以两种方式捕获- 9:01 pm和21:01 pm你能建议将这2个时间帧格式合并为1，并应用过滤器。谢谢。

浏览 1提问于2015-04-02得票数 0

1回答

如何在Excel文件中使用If语句和DataFrame？

、、

我正在处理Excel文件中的一些数据。我导入了这个文件，并将其转换为一个数据帧，现在我想迭代一个名为'Category‘的列，查找它们，然后返回另一个列('Asin')。我很难找到正确的语法来让它工作。下面的代码是我在if语句中的尝试： import pandas as pd import numpy as np file = r'C:/Users/bryanmccormack/Downloads/hasbro_dummy_catalog.xlsx' xl = pd.ExcelFile(file) print(xl.sheet_names) df

浏览 12提问于2019-08-24得票数 0

回答已采纳

1回答

从多索引创建数据帧

、、

我有一个pandas序列的值，存储在变量s中，它是使用Multi Indexing形成的。代码- s = pd.Series(np.random.rand(50), index=idx) 下面是s的样子- ? 创建此数据帧的最佳方式是什么？

浏览 18提问于2021-11-19得票数 0

回答已采纳

1回答

基于RNN (LSTM)的手势识别系统

、、、、

我正在尝试建立一个手势识别系统，用于对ASL (美国手语)手势进行分类，因此我的输入应该是从摄像机或视频文件中获得的一系列帧，然后它会检测该序列并将其映射到相应的类(睡眠、帮助、进食、跑步等)。问题是，我已经建立了一个类似的系统，但对于静态图像(不包括运动)，它对于翻译字母表很有用，因为在这种情况下，构建CNN是一项直接的任务，因为手不会移动太多，而且数据集结构也是可管理的，因为我正在使用keras，而且可能仍然打算这样做(每个文件夹都包含一组特定符号的图像，文件夹的名称是这个符号的类名: A，B，C，.) 在这里，我的问题是，如何组织我的数据集以便能够将它输入到keras中的RNN中，以及

浏览 0提问于2018-04-25得票数 11

1回答

将二维pandas数据帧重新映射到三维xarray

、、、、

我目前有一个很大的2-d pandas时间序列值(1年或更长时间)的数据帧，我想将其重新映射到3-d xarray。pandas数据帧具有对应于另一个引用数据帧中的(经度，经度)坐标的column_id。在xarray中有什么固有的功能可以实现这一点吗？

浏览 25提问于2019-07-31得票数 0

5回答

使用字典过滤Pandas

、

我有一个包含多列的Pandas数据帧，我想对其进行过滤，以获得与不同列中的特定值相匹配的子集。我使用了isin()方法并传递了一个字典，但我一直在获取带有消息TypeError: only list-like or dict-like objects are allowed to be passed to DataFrame.isin(), you passed a 'str'的TypeError。以下是该问题的一个示例： x = pd.DataFrame({'surname':['wang','park','park&

浏览 1提问于2019-10-18得票数 6

1回答

UDP VideoChat程序

嘿，我正在考虑制作一个UDP视频传输程序，我想知道它是否应该传输关键帧和帧间帧，还是只传输整个帧？我正在考虑让摄像头以很小的时间间隔拍摄照片，并将它们作为UDP数据包发送到另一个客户端，但这似乎会占用太多带宽。有没有办法大幅降低图片的大小和分辨率？

浏览 3提问于2011-08-09得票数 0

回答已采纳

1回答

Delta Lake:性能挑战

、

方法1:我的输入数据是一堆json文件。经过预处理后，输出为pandas数据帧格式，该格式将写入Azure SQL数据库表。方法2:我已经实现了delta lake，其中输出pandas数据帧被转换为Spark数据帧，然后将数据插入到分区的Delta Table中。这个过程很简单，而且将pandas数据帧转换为spark数据帧所需的时间以毫秒为单位。但与方法1相比，性能很差。使用Approach1，我能够在不到方法2所需时间的一半内完成。我尝试了不同的优化技术，比如ZORDER，压缩(装箱)，使用insertInto而不是saveAsTable。但没有一种方法真正提高了性能。如果我错过

浏览 8提问于2020-10-28得票数 1

1回答

在相扑逻辑上设置警报，哪个选项更好？

、、、

我在sumologic中配置了我的服务器，并且日志记录在sumologic中完成。我想启用一些基于日志记录完成的警报。我看到两个选项1)计划搜索2)指标。我的警报应该基于请求的一些执行时间，这是在相扑逻辑上记录的。目前，我做了预定的搜索，它起作用了。有没有更好的方法来处理指标?？换句话说，这些指标是否有不同的用途/额外的优势？

浏览 17提问于2019-06-10得票数 0

2回答

为什么这段代码试图调用复制构造函数？

、、、、

我刚刚在Visual Studio中花了过多的时间处理编译错误。我已经将代码提炼到下面的小的可编译示例中，并在IdeOne上进行了尝试，得到了与您看到的相同的错误。我想知道为什么下面的代码尝试调用B(const B&)而不是B(B&&) #include <iostream> using namespace std; class A { public: A() : data(53) { } A(A&& dying) : data(dying.data) { dying.data = 0; } int data;

浏览 0提问于2012-01-25得票数 18

回答已采纳

2回答

熊猫:将行索引改为列索引。反之亦然

、、、、

import pandas as pd df = pd.DataFrame(data={'start':[1,2,3],'zone':['a','b','c']}); df['end']=[4,5,6] df.set_index('zone',drop=True,inplace=True,append=False) print(df) start end zone a 1 4 b 2 5 c

浏览 3提问于2017-06-07得票数 3

回答已采纳

1回答

高效地将大型Pandas数据帧写入磁盘

、

我正试图找到使用Python将大型数据帧(250MB+)有效地写入磁盘和从磁盘中写入的最佳方法。我已经尝试过 performance 中的所有方法，但是性能非常令人失望。这是探索将当前分析/数据管理环境从Stata迁移到Python的更大项目的一部分。当我将测试中的读/写时间与Stata中的读/写时间进行比较时，Python和Pandas通常要花费20倍以上的时间。我强烈怀疑我是问题所在，而不是Python或Pandas。有什么建议吗？

浏览 2提问于2013-10-28得票数 5

3回答

Pandas中的层次多指标计数

、

假设我在Pandas中有一个多索引数据帧，例如： A B C X Y Z bar one a -0.007381 -0.365315 -0.024817 b -1.219794 0.370955 -0.795125 baz three a 0.145578 1.428502 -0.408384 b -0.249321 -0.292967 -1.

浏览 0提问于2014-08-05得票数 21

回答已采纳

1回答

排除pandas数据框中超过500年的日期

、

我有一个数据帧，其中包含一个带有日期的列。一些日期丢失(空)，一些日期在1500年。我只想获取日期在过去10年内或缺少日期的那些行。由于Pandas的时间范围是584年，我这样做是为了避免引发错误： import arrow as ar import pandas as pd df[(pd.to_datetime(df['date'], errors = 'coerce') >= ar.utcnow().shift(days=-3650).date())] 但是，这也删除了缺少日期的行，而我不希望这样。是否有一种方法可以排除超过10年的日期，但不排

浏览 17提问于2019-02-28得票数 0

回答已采纳

3回答

pandas数据帧条件检索值

、、

有一个数据帧： df = pd.DataFrame({'Place':[1,2,5,6], 'Event':['Music', 'Poetry', 'Theatre', 'Comedy'], 'Cost':[10000, 5000, 15000, 2000]}) 还有另外两个我从user那里得到的变量： a=input("Enter Event:") b=input("Enter Place:&

浏览 14提问于2021-08-02得票数 0

3回答

Pandas:基于列中的多个对象值选择行

、、

我有一个pandas数据帧，其中一列包含用户信息。该列的每条记录都是一个列表，该列表又包含用户信息的字典。就像下面的歌词： USER id 1 [{u'STATUS': u'INACTV', u'NAME': 'abc'},{u'STATUS': u'ACTV', u'NAME': 'xyz'}] 634618 2

浏览 3提问于2017-04-20得票数 3

1回答

处理ValueError的便捷方法:不能从重复轴重新索引

、、、、

我能够搜索到显示此错误消息的“原因”的建议，但不知道如何解决它- 每次尝试通过连接两个现有列中的字符串值来向pandas数据帧添加新列时，我都会遇到这个问题。例如： wind['timestamp'] = wind['DATE (MM/DD/YYYY)'] + ' ' + temp['stamp'] 如果第一个项目和第二个与‘’合并的项目都是单独的dataframe/series，那么它就会起作用。这些尝试是将日期和时间合并到同一列中，以便它们被pandas库识别为日期时间戳。我不确定是我错误地使用了这个命令，还是panda

浏览 1提问于2018-08-22得票数 5

回答已采纳

2回答

为什么Pandas apply函数返回None

、

我尝试用pandas dataframe列中的条件替换某些字符串中的字符。该函数可以工作，但数据帧的行将显示None。 def char_replace(string): if string.startswith(tuple(list)): return string.replace("_", "-", 1) df["col1"] = df["col1"].apply(char_replace)

浏览 59提问于2020-08-11得票数 1

回答已采纳

1回答

Pandas:使用workalendar检查日期是否为假日，并为英国和其他国家的日历分配布尔值

、、

我有几个国家的金融时间序列，对于这些时间序列中的每一个，我想删除在那个特定国家的公共假日的观察结果。为此，我在我的时间序列中创建了一个新列，其中包含布尔值，以指示该日期是否为假日。因此，我找到了这段代码来分配布尔值，它对我的美国时间序列非常有效：但我不能让它在其他国家工作。我尝试使用工作日历，如下面的代码，但得到错误消息。如果有任何关于使用workalendar或其他方法的建议，我将不胜感激。 from datetime import date from workalendar.europe import UnitedKingdom cal = UnitedKingdom() holid

浏览 44提问于2019-08-08得票数 0

回答已采纳

2回答

如何过滤groupby对象，使列值位于某个范围内？

、、

我有一个分组在列PID上的数据帧。数据框包含另一个列year。我想找出所有那些存在year > 1990和year < 1970的单独记录的PID。我尝试了以下方法，但结果与我预期的不同： g = df.groupby('PID') g.filter(lambda x: ( ((x['year'] < 1970) | (x['year'] > 1990)).all() ) 但这包括仅满足两个条件中的一个的PID。我需要的PID都有年< 1970年和年>1990年的记录。以下是数据示例： ? 此数据

浏览 21提问于2019-06-24得票数 0

回答已采纳

2回答

根据参数!= None的条件对DataFrame进行切片？

、

让我们假设这个数据帧有三列'ABC‘包含随机数。用户可以选择他想要对此数据帧进行切片的阈值条件。如果其中一个条件为'None‘，则表示没有限制条件。如何跳过按阈值为None的条件进行切片？ import pandas as pd import numpy as np condition_A = [75,66,None] condition_B = [50,14,30] condition_C = [66,None,37] df = pd.DataFrame(np.random.randint(0,100,size=(100, 3)), columns=list('

浏览 29提问于2021-06-29得票数 0

回答已采纳

1回答

使用Pandas将文本文件导入为Dataframe，其中列可以包含多个单词、单个单词或数字

、、

我得到了一个10000行的.txt文件，其中包含标题、imdb评分、投票数、流派和其他有关电影的信息。我们应该将其导入到包含pandas的数据帧中，但我不知道如何告诉pandas在哪里正确分隔列。例如，第一行是电影“肖申克的救世主”，但第二行是“低俗小说”。.txt中的信息之间没有逗号分隔，只有空格。因此，Pandas将"The“、"Shawshank”、"Redemption“作为单独的字段。我该如何告诉Pandas如何正确地分解.txt文件呢？我现在的代码是： from IPython.core.interactiveshell import Interactiv

浏览 12提问于2021-11-18得票数 0

1回答

Chop系列构建数据帧的列

、、

有时我会得到一个序列，其中所有的片段(长度都相等)属于一起。在这种情况下，我需要将序列分割，并将数据段排列到数据帧的列中。例如，序列的长度为30，我想制作一个包含三列的数据帧，其中每列分别由序列的第一个、第二个和最后10个条目组成。我使用下面的代码，这是一个for循环，获取序列的每个块并将其作为列附加到dataframe。问题是，由于for循环，这是相当慢的。在Pandas中有没有更好的方法呢？ def series_to_dataframe(series,length,interval_length): #function to convert series to datafra

浏览 16提问于2020-06-23得票数 0

回答已采纳

1回答

pandas绘制时间跨度聚合列

、

我正在尝试使用时间跨度绘制数据。我使用的是pandas数据帧，时间跨度足够直接，但在所有示例中，它们生成的数据都符合时间跨度。如何生成聚合列中数据以匹配时间范围的timespan图？目前，我正在将索引转换为时间序列，并将值绘制为列值，如下所示 series = pd.Series(df['value'], index=df.index) series.resample('12T',how='sum') series.plot() plt.show() 但是，值为0和1的值似乎不会取平均值，而是在图形中从0到1或相反，而不是在指

浏览 0提问于2016-06-13得票数 0

2回答

使用嵌套的if语句python pandas在数据框中填充无

、

下面是我的数据框架。在这里，我尝试使用多个if条件在列中填充none值。但我尝试的代码不起作用。 import pandas as pd # intialise data of lists. data = {'Region':['APAC', 'EMEA', 'EMEA', 'APAC'], 'Country':['Germany', 'None', 'UK', 'India'],'Site':['No

浏览 27提问于2020-01-10得票数 1

回答已采纳

2回答

如何在数据框某些行的所有列上使用pandas apply函数

、、

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

1回答

在Corda中，构造函数参数不引用属性错误

我定义了以下接口： open class IsBustCommand(val bustParty: Party, val isBust: Boolean) 以及以下命令： interface Commands : CommandData { class GoToDirect(party: Party, isBust: Boolean) : IsBustCommand(party, isBust), Commands } 当我运行一个流，它抛出：构造函数参数-- "party“--不引用”在com.cordacodeclub.directAgreement.contract.

浏览 0提问于2018-11-08得票数 0

1回答

火花数据帧

、、

星火数据帧和Pandas数据帧的区别是什么？我的理解是，Pandas数据框架主要用于将CSV数据读入DF，在DF中，Spark数据帧用于将弹性分布式数据( RDD )加载到数据帧中，并且可以操作数据帧。请分享你的反馈

浏览 6提问于2020-09-01得票数 0

回答已采纳

1回答

报告sonarqube结果的趋势

我想要更好地了解我的声音历史的趋势/报告。我们将在每次签入时发布项目的结果。有没有办法获得代码覆盖率随着时间的推移的报告，或者测试数量如何随着时间的推移而增加？

浏览 15提问于2017-08-25得票数 0

1回答

使用序列匹配器比较文本相似性:为什么小写和大写字符串的结果不同？

、、、

我在pandas数据框中有一组文本(字母数字)，我想计算成对文本(例如文本1和2、2和3、3和4...)的相似度分数。我正在使用序列匹配器进行计算，并能够获得分数。我认为在将文本转换为小写后，也值得比较它们。我创建了2个分数列来比较结果:分数1=非小写文本对的相似性分数(保留文本的原始大小写)分数2=小写文本对的相似性分数。我预计小写文本对的相似度得分(得分2)会更高，因为会有更多的字符匹配(例如"This SamPle pHrase“将与"this sample phrase”匹配，因此相似度更高)。然而，我发现在某些情况下，分数1比分数2要高得多。你们中有谁知道为什么会

浏览 0提问于2021-04-05得票数 0

1回答

播放录制的游戏回放

我在播放录制的游戏回放时遇到了问题。重放数据由用户输入时的时间戳和输入本身的元组组成。在播放回放时，我尝试在回放数据中找到匹配的用户输入。但由于每一帧中的时间大多不会与重放数据中的时间戳完全匹配，所以我只能从重放数据中获取最接近的时间戳，它与当前帧时间平均相差0.01秒。这使得回放非常不精确。我有什么可能对这种差异做出反应？

浏览 3提问于2012-04-07得票数 1

回答已采纳

3回答

如何在pandas dataframe中添加新列的值？

、、

我想在Pandas数据帧中创建一个新的命名列，在其中插入第一个值，然后向同一列中添加另一个值：类似于： import pandas df = pandas.DataFrame() df['New column'].append('a') df['New column'].append('b') df['New column'].append('c') etc. 我该怎么做？

浏览 1提问于2018-07-24得票数 3

回答已采纳

1回答

如果在pandas dataframe中找不到值，则会正常失败

、

当我想要基于多个条件从数据帧访问一个值时，什么是一种优雅的失败方式： #Select from DataFrame using criteria from multiple columns newdf = df[(df['column_one']>2004) & (df['column_two']==9)] 如果不存在满足上述条件的值，那么pandas会返回一个keyerror。如何将NaN值存储在newdf中。

浏览 3提问于2016-06-21得票数 0

1回答

在Pandas中，我们可以按名称和正则表达式选择列吗？

、

假设我的Pandas数据帧如下： import pandas as pd df = pd.DataFrame( dict(ID = [1, 2, 3], xz = [0, 1, 1], yz = [4, 5, 6], yx = [7, 11, 18], xy = [10, 10, 11]) ) 如果我想选择名称中包含x的所有列，我可以执行以下操作： df.filter(regex = 'x', axis=1) 如果我还想按列名进行选择，我会执行以下操作，但这将不起作用。 df.filter(ite

浏览 0提问于2020-05-23得票数 0

2回答

从转置的熊猫数据帧中选择系列

、

使用名为mrna的数据帧，如下所示： id Cell_1 Cell_2 Cell_3 CDH3 8.006 5.183 10.144 ERBB2 9.799 12.355 8.571 ... 如何选择ERBB2行作为pandas序列(如果我不知道它的索引)？我尝试过：mrna.iloc['ERBB2']，但它只接受一个整数，并且不能映射到字符串我也试过了： mrna_t = mrna.transpose() mrna_t['ERBB2'] 但是我得到了KeyError：'ERBB2‘

浏览 0提问于2015-10-12得票数 0

1回答

如何根据条件更新2d numpy数组，但仍然使用它的绝对值？

、、、、

具有以下功能： def one_more_fix(matrix): height, width = matrix.shape for i in range(height): for j in range(width): if abs(matrix[i,j]) >= 180: matrix[i,j] = abs(matrix[i,j]) - 360 输入和输出示例： simple_matrix = np.array([ [179, 181, -182], [179, 181, -182], [361, -362, -183], ]) arr

浏览 16提问于2022-08-30得票数 0

回答已采纳

1回答

Pandas根据具有多个条件的另一列的求值创建列

、

我想创建一个布尔值列，基于另一个使用pandas的列的计算结果。理想情况下，我希望使用与我复制的语法相似的语法，但如果这是不可能的，我愿意接受其他建议。 df是一个熊猫数据帧。AggRow是一列包含整数的数据。所以，我有一个AggRow的数据，它有一个值范围。如果我想让conditionmet在AggRow小于或等于6001的地方为True，我可以基于一个标准成功地创建一个新列conditionmet，如下所示： conditionmet = df['AggRow'] <= 6001 但是，如果我希望在AggRow为<= 6001或10001和10009之间(包括

浏览 0提问于2018-02-24得票数 4

2回答

对pandas groupby对象中的值进行有条件的计数

、、

我有一个pandas.core.groupby.DataFrameGroupBy对象，其中我试图计算TOTAL_FLOOR_AREA的值为> 30的行数。我可以使用以下命令计算groupby对象中每个数据帧的行数： import numpy as np grouped = master_lsoa.groupby('lsoa11') grouped.aggregate(np.count_nonzero).TOTAL_FLOOR_AREA 但是如何有条件地计算TOTAL_FLOOR_AREA的值大于30的行数呢？相同的

浏览 4提问于2017-08-16得票数 4

回答已采纳

1回答

Android --是否有精确的计时器或睡眠功能？

、、

当我的应用程序正在进行物理模拟时，我希望它在一个恒定的FPS (例如30)下运行，因为这在某种程度上影响了物理。然而，计算结束当前“帧”和调用Thread.sleep(1000/FPS -时间已经花费)所需的时间是个坏主意，因为操作系统的调度会给FPS带来很高的误差/不准确性。另一个坏主意是让模拟完全不睡觉，而只是在(！time_has_come) time += System.nanotime()时运行，因为它会浪费CPU资源和电池。有没有一种更精确，而不是资源昂贵的方法来创造一个定时器，使我的模拟脉冲在一个恒定的FPS？

浏览 1提问于2013-09-08得票数 0

回答已采纳

3回答

根据条件保存大熊猫的上n行数据

、、、、

如何删除在某一满足条件之后出现的数据文件中的所有行？例如，我有以下数据： import pandas as pd xEnd=1 yEnd=2 df = pd.DataFrame({'x':[1,1,1,2,2,2], 'y':[1,2,3,3,4,3], 'id':[0,1,2,3,4,5]}) 如何获得删除最后4行并保持上2行与第2行相同的数据帧，以满足条件x=xEnd和y=yEnd。编辑:应该提到数据不一定是上升的。也可能是下降，我仍然想得到上层的。

浏览 1提问于2018-10-27得票数 1

回答已采纳

3回答

ValueError:长度不匹配:在pandas数据帧中创建分层列时，预期的轴有0个元素

、、、、

我浏览了有关Pandas中的分层索引的。我尝试测试其中的示例，以创建一个具有分层索引的空数据帧： In [5]: df = pd.DataFrame() In [6]: df.columns = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]]) 但是，它会抛出一个错误： ValueError Traceback (most r

浏览 1提问于2017-04-04得票数 11

回答已采纳

1回答

使用pandas中的索引列查看或过滤？

、

使用Python的pandas库，我导入了一个csv并将多个列设置为我的索引。出乎意料的是，当我显示数据帧时，索引列不再存在，并且我不能使用索引列作为过滤器选项。这让我想知道我是否错误地认为pandas索引类似于SQL索引。 date, exchange, symbol, low, high, open, close, last exchange和symbol足以唯一标识一行。它是加快了查找速度，还是添加了一些对stack/unstack/pivot/groupby之类的东西有用的语义信息？它能减少内存使用量吗？为什么要将日期、交换和符号移出数据帧(并移到索引系列中？)？把它们留在dat

浏览 1提问于2014-09-19得票数 0

1回答

如何根据另一个变量中的连续值对变量应用函数

、、、

我有一个数据帧，图像编号(sliceno)、x和y坐标(x位置和y位置)。这些图像是随着时间的推移而拍摄的，相同的切片编号表示在同一时间点记录的多个坐标。我想把图像的坐标和前面的比较一下。如果后续图像的x坐标为+/-1或等于上一幅图像的x坐标，则这种情况发生两次，即有两次相同的sliceno记录满足坐标要求。Y坐标也一样。 import pandas as pd print(dataframe) x-position y-position radius (pixels) r-squared of radius fitting sliceno 0 220

浏览 0提问于2019-04-11得票数 5

回答已采纳

1回答

使用字典python的pandas数据帧中的StopIteration问题

、、、、

我有3列(DM1_ID，DM2_ID，pairs)熊猫数据帧和100万records.Also，我有一个包含键和多个值的字典。该函数检查字典值并获取关键字，然后将该关键字放入new_ID字段。函数对于熊猫数据帧的一小部分工作得很好，但当我将它应用于整个数据帧时，它会给我"StopIteration“错误。 DM1_ID DM2_ID pairs 86503 11945.0 11945.0 [11945.0, 11945.0] 86504 11945.0 362380.0 [11945.0, 362380.0]

浏览 15提问于2020-09-10得票数 0

回答已采纳