如何从数据帧中的任意一天选择行？_如何从R中的数据帧列表中选择行_如何判断数据帧中任意连续行的差值大于0.1？ - 腾讯云开发者社区

、、

我有一个包含99行的两列数据帧，这些行已经“升序”排序，但是现在我希望根据第二列("Change")只保留数据帧的第一行和最后十行(1:10，90:99)。例如。 ID_NUM Change 1 -55223 42 -2321 6 -201 20 17 99 93 53 1009 ...etc。如何创建一个新的数据框，从现有的数据框中排除中间的11:89行？

浏览 2提问于2014-02-09得票数 0

2回答

从dataframe中随机选择小时

、、、、

我很难从数据帧中随机选择行。通常，使用np.random.choice(data,size=1000)选择一行不是问题。我假设replacement=True. .。但是，我需要随机选择一个小时，作为输出，接收每个季度的4行。可供选择的数据帧如下(1132行)： data= Price Consume Feed StartTime 2018-07-04 02:00:00 45.80 67.91 67.91 2018-07-04 02:15:00 45.80

浏览 26提问于2019-08-19得票数 1

回答已采纳

2回答

如何使用python在指定的年份季度生成一年中的任意一天？

、、

让我们假设在一个熊猫数据帧中，我有一条特定的记录： x.index.quarter 是3 我需要生成一个从1到365的整数作为一年中的某一天，这将属于同一季度。熊猫是如何决定年份的季度的？有没有数学公式？这只取决于月份吗？

浏览 16提问于2020-06-18得票数 0

回答已采纳

2回答

在pandas数据帧顶部插入行，并在1天前使用索引

、、、、

我有一个由日期和每日频率组成的索引的熊猫数据帧。如何在数据帧顶部添加一行，索引比原始数据帧的第一个元素早一天？致谢问候

浏览 1提问于2014-04-14得票数 1

1回答

将不同时间戳格式的多个数据帧堆叠到一个时间戳中

、、、、

我有多个数据帧，每个数据帧的数据从1分钟到1440分钟(一天)不等，.Each数据帧相似，列相同，长度相同。时间列值为hhmm格式。假设df_A有第一天的数据，也就是2021-05-06，它是这样的。 >df_A timestamp col1 col2..... col80 0 1 2 . . . 2359 第二天的数据是df_B格式的，这也是一样的。日期是2021-05-07 >df_B timestamp col1 col2..... col80 0 1 2 . . . 2359 我如何将它们堆叠在一起，并创建一个数据帧，同时用具有类似YYYYMMDD

浏览 17提问于2021-07-20得票数 0

回答已采纳

1回答

每天从DataFrame取样

、、

在我的数据框架中，我有3个月的数据，而且每天都有。(每一天，我都有不同数量的样本，例如在1月1日我有20K行样本，在1月2日有15K个样本) 我需要的是取平均值，并将它应用到所有数据帧中。例如，如果平均值为8K，我希望从1月1日的数据中得到随机的8k行，从1月2日开始得到8k行，以此类推。据我所知，rand()将给出整个数据帧的随机值，但我需要每天应用它。因为我的数据框架是每天的，并且数据帧的一列中提到了日期。谢谢

浏览 3提问于2022-07-18得票数 1

回答已采纳

2回答

根据任意列中的特定值选择dataframe中的行

我有一个数据帧，它包含例如5行和3列：我想选择那些包含例如文本黄色(第1行和第4行)的行？

浏览 3提问于2021-06-11得票数 1

1回答

如何为R中的数据帧指定行和列

、

对于矩阵，我可以使用matrix(nrow=5,ncol=100)指定列的行。我的问题是，如果我想指定行和列，我如何处理数据帧。

浏览 4提问于2016-06-15得票数 3

回答已采纳

1回答

TSQL将查询返回的数据量减少为参数定义的样本

、、、

我有一个包含大量数据的表，这些数据是在更改时存储的。 tbl_bigOne ---------- timestamp | var01 | var02 | ... 2016-01-14 15:20:21 | 10.1 | 100.6 | ... 2016-01-14 15:20:26 | 11.2 | 110.3 | ...` 2016-01-14 15:21:27 | 52.1 | 620.1 | ... 2016-01-14 15:35:00 | 13.5 | 230.6 | ... ... 2016-01-15 09:18:01 | 94.4 | 140.0

浏览 2提问于2016-01-14得票数 0

1回答

在R中拆分Dataframe，使用拆分并保存在新数据帧中

、

我是R的新手，有以下问题：我处理气象数据(温度和降水)。在我们一年多的时间里，每隔一半就对数据进行量化。所以我有一个大约有17520行的数据帧。我的第一列以以下形式包含日期："year-month-day hour:minute:second" 现在，我只想为每天的参数获取一个值，这意味着我需要对每天进行平均。我设法使用以下表达式按日期拆分数据帧： split(data, as.Date(data$DATE)) 但是现在我有一个问题，那就是我不知道如何处理这种分裂。如果我想保存它，我只能得到某种类型的列表。有没有人知道如何处理拆分后的数据，也就是说，如何平均每天的值，并将平

浏览 1提问于2014-01-06得票数 0

3回答

R:用平均值替换相同的行

我有如下所示的数据： patient day response Bob "08/08/2011" 5 然而，有时，我们在同一天有几个反应(来自同一个患者)。对于所有这样的行，我希望将它们全部替换为一行，其中患者和日期当然是所有这些行的碰巧值，响应是它们的平均值。所以如果我们也有 patient day response Bob "08/08/2011" 6 然后，我们将删除这两行并将它们替换为 patient day response Bob "08/08/2011" 5.5 如何在R中编写代码，以便对跨越数万行的数据帧执行此操作？编辑:我可

浏览 0提问于2017-04-23得票数 0

1回答

当函数需要多个输入时，如何将函数应用于R中数据帧的每一行？

我需要对R中数据帧的每一行的数据运行一个七平方测试，到目前为止，我有一个函数，可以创建一个矩阵并在矩阵上运行测试。当我手动向函数中输入数据时，这是很好的。 chisquare.table <- function(var1, var2, var3, var4){ t <- matrix(c(var1, var2, var3, var4), nrow = 2) chisq.test(t) chisquare.table(80, 99920, 85, 99915) 但是，我想要做的是将这个函数应用到数据帧的每一行，例如var1是行x列1，var2是行x列2，var3是行x列3，

浏览 2提问于2019-09-21得票数 1

回答已采纳

1回答

在R中合并会产生比其中一个数据框更多的行

、、、

我有两个数据帧，第一个包含9994行，第二个包含60431行。我想合并两个数据帧，以便合并后的数据帧包含两个数据帧的组合列，但只包含9994行。然而，我在合并时得到了超过9994行。我如何确保这种情况不会发生？ df1 = readRDS('data1.RDS') nrow(df1) # [1] 9994 df2 = readRDS('data2.RDS') nrow(df2) # [1] 60431 df = merge(df1,df2,by=c("col1","col2")) nrow(df) # [1] 10057

浏览 2提问于2015-05-23得票数 7

1回答

如何在R中将多个数据帧日期列组合成一个堆叠的日期列

、、、、

我有以下数据框架，它记录了个人的姓名、他们的工作，以及他们在一天中工作了多少小时： test_df <- data.frame(Name = c("Mark", "Stacy", "Anthony", "Colette"), Job = c("Bartender", "Bartender", "Host", "Server"), "01-Jan" = c(4,

浏览 6提问于2021-01-12得票数 0

回答已采纳

1回答

从excel创建Dataframe

、

我正在尝试导入excel并使用pandas read_excel函数创建数据帧。问题是，我只需要使用从excel开始的C到F列和第17行。如何在pandas中仅选择excel文件的那部分并将其转换为数据帧？谢谢！

浏览 0提问于2020-03-21得票数 0

2回答

删除在整个数据帧中迭代的具有特定条件的观测值

、

我相信这个问题已经提出了好几次，但由于某种原因，我找不到答案。基本上，我有一个包含500个变量(列)和15000个观察点(行)的数据帧。在所有的观察值中，变量的值从-140到100。基本上，我需要删除一些值介于-20和0之间的观察值(行)。我尝试过(X_train是500个变量)： for i in X_train.columns: a=X_train[(X_train[i] >= -20) & (X_train[i] <= 0) ] 还有这个： a = X_train[(X_train.iloc[:,:].values > -20) &

浏览 29提问于2020-02-15得票数 0

2回答

如何检查SQL表列中的数字或字符？

、、

我觉得这个问题肯定在某个地方得到了答案，但我阅读了大量的帖子，尝试了许多不同的解决方案，但我无法让它起作用。我有一个名为schedule的数据库表，我只想使用python从days列中选择包含特定数字的行。days列包含从1到7的一些数字组合，每个数字代表一周中的某一天。它可以是一天，也可以是几天的组合(“1”、"135“、"1234567”等)。给定一个特定的日期索引(例如3)，我希望从调度中选择天数列中有3的所有行。我将列类型设置为VARCHAR，因为我认为检查字符串比检查整数值更容易。这是我当前的语句，其中day是所选日期的索引(例如3)： "SELEC

浏览 22提问于2019-06-06得票数 0

回答已采纳

2回答

将pandas to_excel的写入限制为每张100,000行

、、、

我有一个大约有2800万行(5列)的dataFrame，我正在努力将它写入excel，它被限制为1,048,576行，我不能在超过一个工作簿中拥有它，所以我需要将Thoes28Mi拆分为28张表，依此类推。这就是我要用它做的： writer = pd.ExcelWriter('NAME_XX-' + mes +'-' + ano + '_XXX.xlsx', engine = "xlsxwriter") notMor.to_excel(writer, engine='xlsxwriter', index=Fal

浏览 26提问于2020-09-24得票数 0

1回答

使用df['var'].str.extract() (Python)找到多个单词？

、、、、

我尝试使用str.extract()提取数据帧一行中的任何单词，但最终只得到了一个单词。例如，在我的数据帧的某一列中： var1 THIS IS A STRING 当我使用： df['words'] = df['var1'].str.extract('([A-Z]\w{0,})') 输出为 var1 words THIS IS A STRING THIS 如何提取整个短语“THIS IS A STRING”？谢谢!

浏览 1提问于2016-04-14得票数 1

1回答

如何比较一个数据帧的元素与另一个数据帧的元素？

、、、、

我有一个名为PORResult的每日温度数据帧，其中行是年，每列是一天(121行x 365列)。我还有一个名为Percentile_90的数组，其中包含每天的阈值温度(length=365)。对于PORResult数据帧中每一年的每一天，我想知道该天的值是否高于Percentile_90数组中该天的值。我希望将其结果存储在一个名为Count (121行x 365列)的新数据帧中。首先，Count数据帧中全是零，但如果PORResult中的日值大于Percentile_90中的日值。我想将Count中的每日值更改为1。这就是我要开始的： for i in range(len(PORResult

浏览 13提问于2021-11-05得票数 0

2回答

从合并的熊猫时间序列中获取索引值？

、、

我有不同的时间序列熊猫数据帧，看起来像：数据‘F_NQ’= OPEN HIGH LOW CLOSE VOL OI P R RINFO DATE 1996-04-10 12450 12494 12200 12275 2282 627 0 0 0 1996-04-11 12200 12360 12000 12195 1627 920 0 0 0 我将它们合并到一个数据帧中，以便可以使用concat mergeData = pd.concat(data, axis=1, keys=data.

浏览 0提问于2016-10-04得票数 0

3回答

删除数据帧中的每第n行

、、、

如何从R中的数据帧中删除每第n行？

浏览 2提问于2011-10-30得票数 19

回答已采纳

2回答

R按索引(日期)与多个数据帧的列表之和

、、、

我有大约6000个数据帧，数据如下： over10 over20 over50 over100 2014-01-02 1 1 0 0 每个数据帧都有数百行。我需要按索引(日期)对所有数据帧的四列进行求和。结果将是每个日期一行，其中包含求和值。因此，在6000个数据帧之后，结果可能是： over10 over20 over50 over100 2014-01-02 3121 2551 1670 985 这种情况将继续下去，每一天一行。我可以轻松地将6000个数据帧放入列表中，也可以将其重

浏览 4提问于2014-08-19得票数 2

回答已采纳

1回答

如何根据两个条件从一个数据帧追加到另一个空数据帧？

、、

我将一个API调用(成功地)存储到一个名为df1的数据帧中。API调用将每天运行两次。我需要在满足以下条件的df2中添加df1： 1. append rows from df1 into df2 if ID in df1 is not present in df2 2. append rows from df1 into df2 if column 'Updated_Date' in df1 is greater than todays date in df2. 脚本每天会从应用程序接口中提取两次数据，因此在脚本运行的第一天，df2中没有数据，但在第一天之后，将有来自应用程序

浏览 7提问于2018-02-22得票数 1

回答已采纳

1回答

如何在pandas中对日期相似的数据进行分组

、

我有两个csv文件。这两个文件都包含日期、股票、打开、高、低、关闭一天的列。我从这两个文件中创建了一个数据帧。因此，在这个数据帧中，首先打印股票1的数据，从开盘到收盘，然后打印股票2的数据，从开盘到结束.The数据的间隔为15分钟，一天从2019-01-01 09:15:00开始，2019-01-01 15:15:00结束。我想要的是创建一个数据帧，其中打印2019-01-01 09:15:00的stock1数据，然后同时打印2019-01-01 09:30:00,2019-01-01 09:45:00的stock2数据，依此类推。检查图像：

浏览 2提问于2021-09-16得票数 0

2回答

使用Python在特定列中缺少数据时删除数据集中的行

我正在尝试确定特定列(索引2)中哪些行的值为nan，然后删除具有nan的行，或者将没有nan的行移动到自己的数据帧中。有没有任何关于如何进行这两种方法的建议？我试图创建一个包含所有行和指定列的向量，但数据类型对象给我带来了麻烦。另外，我尝试创建一个列表，并将该特定列中!= 'nan'的所有行添加到该列表中。 patientsDD = patients.iloc[:,2].values ddates = [] for value in patients[:,2]: if value != 'nan': ddates.append(val

浏览 14提问于2019-10-23得票数 1

1回答

使用自定义分类索引顺序在Python中重新排序heatmap行

、、

我有以下数据帧索引是星期的天数，列是从0到23 (一天中的小时)的数字，单元格值是计数 0 1 2 .... Mon 2 2 4 Tue 5 6 2 Wed 3 1 1 . . . dataframe的结果是 df.crosstab(df['DoW'],df['Hour']) 我试着用 hourdow.reindex(["Mon", "Tue", "Wed","Thu","Fri","Sat",'Sun']) 来对数据帧进行排

浏览 15提问于2020-05-10得票数 1

回答已采纳

1回答

如何在R中调用多个对象(数据帧)，所以我只需要运行一次函数？

、、、、

我的环境中有几个数据帧，从SPECIALITY开始我希望能够只在自定义函数中调用一次数据帧(可能使用应用函数)，而不必为每个数据帧运行一行代码，如下所示：我正在考虑将数据帧合并到一个列表中，但我不确定我将如何做到这一点，或者这是否是最有效的方法。

浏览 0提问于2018-08-14得票数 1

回答已采纳

2回答

如何在限制行数的同时拆分一个Pyspark数据？

、

我将数据从dataframe发送到有5万行限制的API。假设我的dataframe有70000行，我如何将其分割成不同的数据帧，每一行的最大行数为50,000行？这些不一定是均匀的，数据顺序也不重要。

浏览 4提问于2020-05-06得票数 4

回答已采纳

3回答

在dataset中每个月(和每周)返回最后一天

我有大量的每日股市收盘数据，我需要报告，但我只需要从每个数据集月的最后一天。鉴于每个月的日期每年都会因周末和公共假日而异，我不能只使用=EOMONTH(A2,0) 如何从数据集中提取数据集(可能以某种方式使用MAX功能)，这是每个月的最后一天。然后我就可以做一个Vlookup来获取那个日期的数据， [![Share Price Sheet][1]][1]

浏览 1提问于2019-11-20得票数 1

回答已采纳

1回答

如何删除部分匹配子字符串的pandas行？

、

我有一个数据帧，我想删除具有部分子串匹配的行，如下所示，并将这些行保存到新的csv文件中。下面这行代码运行良好，但我不知道如何从原始数据帧(df2)中删除这些行，并将输出保存到其他csv文件中。 df2_output=df2[df2['Name'].str.contains("planning|Test|tgt",case=False)] 感谢您的支持，

浏览 18提问于2020-06-19得票数 1

回答已采纳

2回答

将函数应用于数据帧；timestamp.dt

、

最终，我希望从df['start']中的每个日期计算到该月最后一天的天数，并用结果填充'count'列。作为实现该目标的第一步，calendar.monthrange方法接受(年，月)参数并返回(第一个工作日，天数)元组。在对数据帧或序列对象应用函数时，似乎存在一个普遍的错误。我想知道，为什么这不起作用。 import numpy as np import pandas as pd import calendar def last_day(row): return calendar.monthrange(row['start'].d

浏览 10提问于2018-02-25得票数 3

3回答

如何从数据帧中获取每个月的最后一天，并将其从数据帧中删除？

、、

大家好，图像是我学习python的数据框架。从这个数据中，我试图找到行记录，这是每年12月的最后一天。我的目标是在数据帧中保留以黄色突出显示的记录，并删除白色行。例如，对于2010年，我只想保留第3条记录，删除第1行到第2行。至于2011年，我想删除第4行到第7行，保留第8行。下面是我写的代码。我打算使用循环来查找我想要保存的记录，并删除其余的记录。为了使用月份值保留记录，我设法通过保存Dec和删除Jan到11月的记录来达到我的目标。然而，有几天(最后3行代码)，我意识到最后一天并不总是以数据帧中的31结尾，而且我不能使用我的初始逻辑来删除。如果有更好的解决方案，在数据帧

浏览 7提问于2021-07-03得票数 1

回答已采纳

0回答

统计滚动窗口中存在多少日期索引的行

、

举个例子，我有一个熊猫数据框，它代表了我在2016年做练习的所有日子。日期表示为DateTime64ns。我要生成的是从2016年1月1日到2016年12月30日的时间序列，其中任意一天(例如2016年3月30日)的值等于我在之前的六天中执行练习的天数24Mar到30Mar每天练习一行将出现在原始数据帧中。我想不出一个好的pythonic/矢量化的方式来定义新的数据帧来做这个计数。它的索引应该是2016年1月1日到2016年12月31日，但是我看不到如何很好地定义“count”列。我真的想避免一些讨厌的循环/迭代结构。

浏览 1提问于2017-06-13得票数 0

1回答

在执行diff函数时，如何只在数据不是零时执行，或者不考虑零之后的第一个和最后一个值。

、、、

我有一个数据帧X，它总是以零开头，并以零结尾，所以我在太阳柱上执行.diff()函数，以得到当前间隔与前一个间隔的差值，当我这样做时，我在一天开始时和在数据帧Y中用黄色标记的一天结束时得到了这个大值，我试图看看如何从3:30时间戳中计算出差异，这样我们就得到了一个数据框架z，其中我们有0而不是100和-142。

浏览 3提问于2020-08-15得票数 0

回答已采纳

1回答

基于分割帧的CNN视频分辨率识别模型的建立

、、、、

我正在做一个学生项目，涉及到视频中的分辨率识别我的工作是从视频中准备一个训练数据集(我从YT下载这些电影)，并按照以下步骤完成下载预选影片的每一个质量(2160 p，1440 p，1080 p，720 p. 从下载的视频中提取帧(大约20-30帧) 将每一帧放大到相同分辨率(在我的例子中，我将所有帧提升到4K) 提取的帧有不同的尺寸，所以我需要将它们都扩展到相同的分辨率。将这些高比例尺帧拆分为100x100块在完成这个过程之后，他获得了大量已排序的数据。下面是它的样子的图片。在左边，您可以看到按分辨率排序的目录() 任意下载视频的中间目录中的，位于第四点1

浏览 5提问于2021-12-14得票数 1

回答已采纳

2回答

组合来自全局环境的多个数据帧

、

在我的全局环境中，我有来自不同.csv文件的多个数据帧。每个数据帧都是一天的交易活动观察。由于一些性能挑战，我在上传R中的每个.csv文件时必须执行一些数据预处理。结果如下图所示： ? 现在，我想以连续的顺序组合每个数据帧:例如 masterDataFrame <– rbind(durData_IBM_AskSide1, durData_IBM_AskSide2) masterDataFrame <– rbind(masterDataFrame, durData_IBM_AskSide3) masterDataFrame <– rbind(masterDataFra

浏览 29提问于2021-04-04得票数 0

回答已采纳

1回答

将不同大小的数据集拆分成单独的数据帧

、

我是Python和pandas的新手。我有一个从一些测量设备导出的.csv文件，它在一个.csv文件中提供了一天中进行的所有测量。我已经设法生成了一个相当整洁的数据框架，但我不能计算出来。如何分离测量结果？？数据帧的结构如下： +-------------------------+-------------------+--------------------+-----------+------+-------------+------+--------------+ | SetupTitle | measurement_type | nan

浏览 25提问于2019-06-14得票数 1

回答已采纳

1回答

删除后Pandas重复的索引

、、、

我得到："ValueError:索引包含重复条目，无法重塑“ 我正在处理的数据非常庞大，我不能提供样本数据，也不能用较小的数据集复制错误。我试图用虚拟数据生成副本来复制我的原始帧，但由于某种神秘的原因，代码只适用于虚拟数据，而不适用于我的真实数据。这就是我所知道的我正在处理的形状。 <code>A0</code> 现在我想找出哪些行是重复的。 <code>A1</code> 为了确保我删除了所有的副本，只保留了第一个： <code>A2</code> 这是我拿到ValueError的时候： <code>

浏览 17提问于2020-08-01得票数 0

回答已采纳

1回答

如何从UA查询浏览器中获取未采样数据？

、

我试图从UA查询未采样的数据，但无论我如何尝试(我尝试只查询一天，并且只查询单个事件标签，结果数据仍然与采样一起显示)，我也设置了采样级别，但它不起作用。它应该向下列出一天的30k+行。我该怎么办？非常感谢！ ? ?

浏览 20提问于2021-10-12得票数 -1

1回答

为什么registerTempTable从数据帧中删除了一些行？

、、、、

我试图在HDInsight上使用星火数据帧创建一个熊猫数据框架，其方式如下： tmp = sqlContext.createDataFrame(sparkDf) tmp.registerTempTable('temp') 看起来，registerTempTable从数据帧中删除了一些行。以下命令返回11000 sparkDf.count() 而tmp只有2500行。下面是描述的步骤。

浏览 2提问于2016-07-26得票数 0

回答已采纳

2回答

如何比较两个大小相同的数据帧并创建一个新的数据帧，而不是在一列中包含相同值的行

、、

我正在创建一个数据采集设备，它每隔5分钟检索传感器数据(从API)，并将其保存在CSV文件(每隔24小时导出到数据库)中，我想通过仅在值发生变化时保存数据来减小这些文件的大小。我的想法是将所有数据保存在一个“内存”CSV文件中(该文件将在一天结束时被删除)，并将最后X行(df1 -> T1)与新的数据帧(df2 -> T2)进行比较，然后创建数据帧(df3 -> T2)，其中不包含值保持不变的行。此df3将在另一个CSV中写入，并在当天结束时导出到数据库。这是继续下去的正确方式吗？如何比较两个相同大小的数据帧，并创建第三个数据帧，而不是值不变的行？ df1 Ti

浏览 7提问于2019-07-10得票数 0

回答已采纳

1回答

mySQL和与序

、、、

我们有一个表，它每天插入一行并用数据更新它。我有以下查询，以从该表中获取单击的总数： SELECT SUM(`total_clicks`) AS clicks, `last_updated` FROM `reporting` WHERE `unique_id` = 'xH7' ORDER BY `last_updated` DESC 当从数据库中提取此信息时，它正在提取正确的点击总量，但last_updated字段来自第一行(昨天)，而不是今天插入的新行。如何才能获得最新的last_updated字段？

浏览 2提问于2015-02-20得票数 1

回答已采纳

1回答

使用一行访问Pandas数据帧中的数据

、、、

我使用Pandas dataframes来操作数据，我通常将它们可视化为虚拟电子表格，由行和列定义单个单元格的位置。我对分割数据帧的方法很满意，但当数据帧只包含一行时，似乎有一些奇怪的行为。基本上，我希望从满足特定条件的大型父数据帧中选择数据行，然后将这些结果作为子数据帧传递给单独的函数进行进一步处理。有时，父数据帧中只有一条满足定义的标准的记录，因此，子数据帧将只包含一行。尽管如此，我仍然需要能够以与父数据库相同的方式访问子数据库中的数据。为了说明这一点，请考虑以下数据帧： import pandas as pd tempDF = pd.DataFrame({'group':

浏览 2提问于2016-04-23得票数 2

回答已采纳

1回答

如何通过从R中的每个组中抽取1个案例(行)来创建数据帧

、

我想从R中的每个组中随机选择一个案例(因此从数据帧中选择一行)，但我不知道如何做到这一点。我的数据是长格式的: 400个案例(行)聚集在250个组中(有些组只包含一个案例，另一些组包含2、3、4、5甚至6个案例)。因此，我想要结束的是一个包含250行的数据帧(每行代表从250个不同组中随机选择的一个案例)。我的想法是，我应该使用示例函数，但我可以弄清楚如何做到这一点。有人有什么想法吗？

浏览 1提问于2021-03-16得票数 2

1回答

Python Pandas数据帧-如何缩短帧

、、

我有一个有一百万个条目的数据帧。python程序正在搜索特定的条目，并将这些条目冒泡到框架的顶部。然后，我想将仅包含感兴趣的条目的帧写入csv文件。有没有办法缩短帧的长度，使其现在只包含感兴趣的条目，而不是保留1m行的长度？示例-假设有100个条目是感兴趣的。它们现在是帧的前100个条目--有没有办法缩短结果帧的长度，使其只有100个条目，而不是1m？ To问题-这些条目在宽度上与原始数据相同。就知道有多少-在程序运行之前不知道有多少是好的，但程序会计算感兴趣的条目，所以我会知道有多少条目-所以我会知道是100还是125，等等。

浏览 0提问于2020-10-12得票数 0

2回答

“循环”Pandas Dataframe中的每一天，并从相应的列中提取值

、、

所以我有我的pandas数据帧，它的格式是这样的。日期为datetime.date类型 print(dataTime) Date Text Sentiment 2021-01-28 Some text 1 2021-01-28 Some text 0 2021-01-28 Some text 1 ... 2021-03-05 Some text 1 2021-03-05 Some

浏览 58提问于2021-03-26得票数 1

回答已采纳

1回答

闪亮:数据帧仅显示10行

、

我有一个闪亮的应用程序，既可以显示一个情节，也可以打印一个数据。同时，它只打印数据帧的前10行，并添加“. 86行”。我想至少显示40行数据帧。我尝试了两个a& head(a，n=50)，但它只显示了总数的10行。如何让它显示更多的行。这就是我所拥有的 server.R output$IPLMatch2TeamsPlot <- renderPlot({ printOrPlotIPLMatch2Teams(input, output) }) # Analyze and display IPL Match table output$IPLMatch2TeamsPrin

浏览 3提问于2017-01-04得票数 2

回答已采纳

4回答

基于向量值的数据帧行过滤

、、

当要删除的值存储在向量中时，从数据帧中筛选行的最佳方法是什么？在我的例子中，我有一个包含日期的列，希望删除几个日期。我知道如何使用!=删除与某一天对应的行，例如： m[m$date != "01/31/11", ] 为了删除向量中指定的几个日期，我尝试： m[m$date != c("01/31/11", "01/30/11"), ] 但是，这会产生一个警告消息： Warning message: In `!=.default`(m$date, c("01/31/11", "01/30/11")) : longe

浏览 7提问于2011-09-21得票数 18

回答已采纳

1回答

我应该使用什么分类模型？机器学习的新手。需要推荐

、、

目标：嘿，伙计们，我正在尝试用Python创建一个分类模型来预测共享单车站点何时会有过多的每小时相对流入或流出。我们正在做的工作是：我的数据帧的前5行(总共超过200,000行)看起来像这样，我在'flux‘列中分配了值0，1，2-如果没有重要的动作，1如果流入太多，2如果流出太多。我正在考虑使用station_name (超过300个站点)、一天中的某小时和一周中的某一天作为预测变量来对“流量”进行分类。模型选择：我应该配什么？朴素贝叶斯？KNN？随机森林？还有什么适合的吗？GDM？SVMs？仅供参考: always 0的基线预测相当高，为92.8%。不幸的是

浏览 2提问于2015-07-25得票数 0