同时根据多个参数过滤数据帧_根据多个条件过滤数据帧_根据常用日期过滤多个数据帧 - 腾讯云开发者社区

python、pandas、dataframe

我有一个数据帧，为了创建一些分区，我必须从中检索唯一的值。我有这个部分，我可以得到一个小的数据帧，每一行都是一个特定的分区。我遇到的挑战是，我需要将原始数据帧过滤到适当的数据(不修改原始帧，以便我可以过滤所有值)，以便可以将其发送到S3。根据小数据帧中的序列过滤数据帧时遇到问题。下面是我的代码： df_partitions = df.groupby(['grid_id', 'case_id', 'snapshot_year', 'snapshot_month', 'snapshot_day'])

浏览 10提问于2020-02-22得票数 0

回答已采纳

1回答

使用布尔掩码创建新的数据帧

python、pandas、dataframe

我有一个数据帧，其中包含名为text的列中的文本，以及lang列中存储的文本所使用的相应语言。我要做的是创建一个辅助数据帧，其中只包含英语文本wrritten (在lang列中也包含值en )。dataframe还包含其他值，所以我不能直接复制它。这是我尝试过的： english_only = df['lang'] == 'en' df_2 = pd.DataFrame(df[english_only]['text'],columns = ['text','sentiment']) 当我运行代码时，我得到一个与原始

浏览 8提问于2020-05-28得票数 1

回答已采纳

1回答

WinPcap中的离线过滤是线程安全的吗？

multithreading、thread-safety、pcap、libpcap、winpcap

使用WinPcap 4.1.2，我需要收集给定接口上的所有基于IP的流量，然后为第7层处理过滤用户选择的基于TCP和UDP的“会话”。由于同时需要对每个传入帧进行唯一标记一次，因此我不能使用明显的解决方案，即让多个pcap_t设备对每个设备使用唯一的过滤器。相反，我使用单个pcap_t设备收集数据，标记每个帧，然后利用pcap_offline_filter应用程序接口在单独的线程中过滤每个选定的“会话”(即，X个会话将在X个不同的线程中过滤)，以充分利用此应用程序将在其上运行的多核系统。问题很简单。pcap_offline_filter应用编程接口是线程安全的吗？

浏览 3提问于2012-11-25得票数 1

回答已采纳

2回答

Pyspark动态过滤数据帧

python、pyspark、filter

我希望动态过滤输入数据帧中的空值，因为值列可以来自value(1) ...值(N) 输入数据帧： |dim1|dim2|TR_LIST|value1|value2| | 101| 201|MTD0001| 1| 21| | 101| 201|MTD0001| null| null| | 101| 201|MTD0001| null| null| | 102| 202|MTD0002| null| null| | 102| 202|MTD0002| 2| 22| | 102| 202|MTD0002| null| null| | 103| 203|M

浏览 17提问于2020-04-18得票数 0

回答已采纳

2回答

DataFrame错误：“重载方法值select with alternatives”

scala、apache-spark、dataframe

我尝试通过从数据帧中选择小时+分钟/60和其他列来创建新的数据帧，如下所示： val logon11 = logon1.select("User","PC","Year","Month","Day","Hour","Minute",$"Hour"+$"Minute"/60) 我得到的错误如下： <console>:38: error: overloaded method value select with alternatives: (

浏览 0提问于2017-02-12得票数 2

回答已采纳

1回答

Google Analytics工作表中的品牌数据插件

google-analytics

我希望获得的品牌扫描电镜数据从谷歌分析使用的插件，可在谷歌工作表。我最初认为我可以用ga:medium==cpc进行过滤，但意识到这并没有特别给我提供品牌数据，所以我想知道我需要做些什么才能获得这些数据。这是另一个过滤器吗？是否是ga:keyword之外的另一个维度？如果有人能帮我，那就太棒了！干杯

浏览 2提问于2017-05-01得票数 0

2回答

通过检查列值的等价性来子集数据帧

python、pandas、dataframe

我有个人X(角色为‘A’)的数据框架： Friend Role Alice A Bob A Cooper B Don C 我想要子集这个数据帧，并且只保留朋友也有'A‘角色的那些行。此外，如果人员X具有角色B或C，我希望保留角色不是“A”的行。因此，如果个人X有A，那么结果将是： Friend Role Alice A Bob A 如果人员X具有角色'B‘或'C’，则结果将为： Friend Role Cooper B Don C 我如何在Python中实现这一点？编辑:根据答案，我意识到我应该更具体。我不想硬编码

浏览 29提问于2020-10-26得票数 1

回答已采纳

2回答

在商店中添加“永久”过滤器，直到我手动调用clearFilter

extjs、extjs4.1、extjs-mvc

我正在使用一家商店来获取所有徒步旅行者的专长(所以徒步旅行者有很多专长)。但是，我有一个详细的窗口，在这个窗口中添加/删除/显示当前选定的徒步旅行者(是，它是一个详细的窗口)。我在这里的问题是，我的商店为所有徒步旅行者获取数据，但我希望它能够显示，当详细窗口打开时，只显示给定徒步旅行者的数据。还请注意，我在数据网格中显示数据，这样用户就可以添加过滤器。我注意到，如果我用store.filter({...})添加一个过滤器，而用户添加一个带有数据网格的过滤器，那么我的过滤器就会被删除(基本上它们是无用的)。我应该使用哪种方法？你有什么建议吗？我想给每个徒步旅行者买一家店，但我不喜欢这个解决方

浏览 1提问于2012-08-12得票数 0

回答已采纳

2回答

删除pandas 0.23+中的空列

python、pandas

在早期版本的pandas中，您只需使用以下命令即可删除空列： df.dropna(axis='columns') 然而，dropna在后来的构建中已经被贬低了。现在如何从数据帧中删除多个(而不是专门索引)空列？

浏览 1提问于2018-08-11得票数 15

回答已采纳

1回答

SSRS报告，共享布局，使用不同的数据集

sql、reporting-services、sql-server-2012、ssrs-2012

我们需要创建几个报告，但它们都具有相同的布局。与创建多个报告相比，是否可以创建单个报告，该报告可以由不同的数据集有条件地填充？例如，假设报表是客户姓名和地址的简单列表。我想有一个参数，要求客户类型。第二个下拉参数列表将仅显示与父客户类型直接相关的客户子类型。一个参数下拉菜单是否可以根据另一个参数下拉菜单中的选择进行过滤？我还可以通过哪些其他方式管理单个报告布局，但根据参数填充不同的数据集？

浏览 2提问于2016-01-27得票数 0

1回答

基于其他数据帧索引在特定级别上重新索引多索引数据帧

python、pandas

我有一个Multiindex dataframe id，currency作为输入。我希望它通过货币级别上的price数据帧索引进行过滤。任何贡献都将不胜感激。 balance数据帧： balance id currency 1 JPY 2322 USD w3r234 KWN 23423 2 POPO 234234 USDC 3w4234 BTC 54545 ETH 2323412 price

浏览 14提问于2020-07-12得票数 0

回答已采纳

3回答

将带有多个参数的函数传递给DataFrame.apply

python、function、pandas、multiple-arguments

假设我有一个这样的数据帧： df = pd.DataFrame([['foo', 'x'], ['bar', 'y']], columns=['A', 'B']) A B 0 foo x 1 bar y 当涉及到数据帧时，我知道如何使用Apply的单参数函数，如下所示： def some_func(row): return '{0}-{1}'.format(row['A'], row['B'])

浏览 18提问于2018-03-12得票数 19

回答已采纳

2回答

基于多列从pandas数据帧中删除行

python、pandas

从一个pandas数据帧中，我想要删除"rois“，其中有一半或更多行的s、b1或b2列的值小于50。下面是一个数据帧示例： roi s b1 b2 4 40 60 70 4 60 40 80 4 80 70 60 5 60 40 60 5 60 60 60 5 60 60 60 应当仅留下对应于ROI5的三行(ROI4具有3行中的2行，其中s、b1、b2的值中的至少一个低于50)。我已经实现了这一点，但不知道是否有一个更短的(即。更快、更干净)的方法： for roi in data.roi.unique():

浏览 24提问于2019-12-11得票数 1

回答已采纳

2回答

如何将多个动画导入到统一中的同一个文件中？

unity、maya

在我的开发过程中，我遇到了一个重要的问题:将过渡动画应用到相同的模型中。我已经学会了如何使用关键帧来制作一个动画，但不知道如何处理多个关键帧。我试着分别导入不同的动画，并将它们应用到相同的模型中，但没有奏效。我怎么能通过这个绊脚石？

浏览 0提问于2017-10-25得票数 0

2回答

在Pandas中计算两个数据帧之间的集合差异

python、pandas

想知道如何在Python的Pandas中使用两个不同的数据帧来计算集合差值。其中一个数据帧(df1)的格式为： State City Population NY Albany 856654 WV Wheeling 23434 SC Charleston 35323 OH Columbus 343534 WV Charleston 34523 并且第二数据帧(df2)是 State City WV Wheeling OH Columns 并且我需要一个返回以下数据帧的操作

浏览 5提问于2017-02-24得票数 4

回答已采纳

1回答

使用多个下拉菜单筛选Report Studio

report、reporting、cognos、activereports

我有一个关于Cognos Report Studio/Active Report的问题：我正在创建一个由多个(大约5个)不同下拉菜单过滤的报告。假设报告针对的是一所大学，下拉列表按学院、专业、性别等进行筛选。我希望这些下拉列表连接在一起，以便使用所有这些下拉列表来过滤数据(如果需要)。我知道如何使用一个下拉菜单，并将其连接到包含图表和图形的数据卡片组。然而，我很难理解如何将2个或更多的下拉列表连接在一起，并最终连接到数据板。任何帮助都将不胜感激。我可以提供更多的细节。谢谢

浏览 3提问于2014-08-04得票数 0

1回答

转换数据帧以便能够过滤值

r、filter、dplyr

我想要将以下数据帧转换为新的数据帧，在其中我将能够过滤如下系数：示例：示例%>%过滤器(年龄== "18-30") 结果应该给出年龄系数"18-30“。我不想用match方法！我已经尝试过pivot_longer()，但它没有生成我想要的数据帧结构。 sample <- data.frame (GLM_Coefficient = c(0.6, 1, 0.4, 0.2, 0, 3 ,1 ,2,1), Category = c("France", "UK", "USA",

浏览 0提问于2021-05-24得票数 0

1回答

ADF中由管道参数运行的过滤管道

azure、azure-data-factory

我们有一条关于Azure数据工厂的管道，每天运行超过一次。每个管道运行都有不同的参数。当需要查看管道运行状态时，可以按时间范围、管道名称、运行和状态筛选管道运行。我们的问题是，我们能通过传递给管道的参数过滤管道运行吗？

浏览 3提问于2021-09-03得票数 1

回答已采纳

1回答

如何将具有多个参数的自定义函数应用于每组数据帧，并在Scala Spark中合并生成的数据帧？

scala、dataframe、apache-spark、group-by、user-defined-functions

我有一个自定义函数，如下所示，它返回不同的数据帧作为输出 def customizedfun(data : DataFrame, param1 : Boolean, param2 : string) : DataFrame = {...} 我想把这个函数应用到每一组 df.groupBy("type") 然后将来自每个type的输出数据帧附加到一个数据帧中。这与将自定义函数应用于分组数据帧的其他问题略有不同，因为此函数除了df.groupBy("type")中的数据帧外，还接受其他输入。做这件事最好的方法是什么？

浏览 21提问于2021-04-12得票数 1

回答已采纳

1回答

同时使用多个提示点。从After Effects到Flash

actionscript-3、flv、after-effects

我在after effects中创建了一个包含一个视频层和4个不同形状层的构图。这些形状都在跟踪视频上的对象。我希望能够在播放期间随意打开和关闭这些形状的visible属性。我已经将它们的关键帧转换为提示点，然后导出flv。这些形状在整个视频中同时具有关键帧，从而在完全相同的时间产生多个提示点。在flash中，我只能听到从after effects构图的最低层发出的提示点。例如，在第10帧上，层1和层3都有一个更改形状位置的关键帧。使用after effects中的脚本，我已经将它们转换为提示点。所以我现在在第10帧上有两个提示点。我的flash程序只会听到第一层发送的提示点，而似乎忽略了

浏览 1提问于2012-12-17得票数 1

回答已采纳

1回答

同时过滤r中的各种文本

r、dataframe、filter

我有一个这样的数据帧： v1 v2 v3 2 4 hello 3 1 hello 4 5 hi 7 8 hi 6 0 greetings 8 0 greetings 9 7 hola 我需要从v3，hello，greetings和hola中过滤。我试过这个： x = filter(data$v3, c("hello","greetings","hola")) 但是不起作用，我的原始数据是一个非常广泛的数据帧，有110000行和86列。我需要过滤三个以上。我寻找的数据帧是这样的： v1 v2 v3 2 4 hello

浏览 2提问于2018-03-10得票数 1

1回答

获取基于索引的行，然后创建另一个单独的数据帧

python、pandas

我编写了一段代码来从数据帧中提取索引，但我不知道如何使用这些索引从原始数据帧创建另一个数据帧。是否也可以缩短我当前的代码？它相当长。 EDITED== import pandas as pd a = pd.DataFrame({"a":["I have something", "I have nothing", "she has something", "she is nice", "she is not nice","Me", "He"],

浏览 16提问于2019-09-27得票数 2

回答已采纳

3回答

Microsoft Azure Iot中心

c#、iot

我有一个设备发送数据帧到azure iot集线器，什么是“转换这些帧”并将其保存到SQL Db或Cosmos Db的最佳实践？

浏览 0提问于2018-10-31得票数 1

3回答

同时播放两个或多个视频

video、multimedia

如何使用帧级同步在不同窗口中播放两个或多个视频文件/流？我可以使用什么工具、库或API来做到这一点？所谓帧级同步，我的意思是我的解决方案必须保证每个视频文件的每一帧都必须同时显示其对应的帧(来自其他文件)。例如： in sync out of sync Time -+-+-+-+-+-+ ... +-+-+-+-+-+-+ video 1 fr1 fr2 fr3 fr1 fr2 fr3 video 2 fr1 fr2 fr3 ... fr2 fr3 fr4 video N fr1 fr2 fr3

浏览 5提问于2008-11-04得票数 2

1回答

如何在Pandas数据帧上应用带模式的布尔过滤器？

python、python-3.x、pandas、dataframe、filter

我有一个这样的数据框架： userId eventType 1 action 1 action 1 inactive 1 action 1 inactive 1 action 1 action 1 action 2 action 2 inactive 2 inactive 2 action .... .... 我的目标是过滤来自用

浏览 17提问于2019-02-03得票数 1

回答已采纳

1回答

如何根据另外两列中满足的条件对最后一列中的pandas DataFrame元素进行索引？

python、pandas、dataframe、indexing

pandas数据帧有4列： df.columns = ['col1', 'col2', 'question', 'answer'] 如何根据满足第一列的标准对数据帧进行索引，从而为'answer'列的单个条目编制索引？即： df['col1'=='apple' and 'col2'=='guitar'].answer

浏览 10提问于2021-01-11得票数 0

1回答

检查全局环境中的任意两个数据帧是否相同

有没有办法检查全局环境中的数据帧是否相同？换句话说，假设我刚刚将几个(像几十个)文件作为数据帧导入到R中，其中一些文件有可能是同一文件的副本，该文件被赋予了不同的名称。有没有一种简单的方法来检查这是不是真的，如果是的话，哪些是相同的数据帧？我知道我可以使用以下命令检查给定的一对数据帧是否相同 identical (df1, df2) ...but有没有一种方法可以在不对每个可能的对执行此操作的情况下找到重复项？

浏览 10提问于2019-01-24得票数 3

回答已采纳

1回答

基于两个字段中的日期创建Tableau计算字段

date、filter、tableau-api、calculated-field

在Tableau中，我有一些报告我喜欢与我们的实时数据库交叉引用，但由于它是实时的，我必须根据生效日期和终止日期筛选出在ran报告时处于活动状态的帐户。有没有办法使用计算字段将底部的两个筛选器合并为一个？需要注意的一点是，文件中的每个帐户都有一个生效日期，只有终止的帐户才有终止日期，截至今天，当前活动的帐户的值为空值。如果我甚至可以将报告日期复选框合并到字段中，那就太好了。

浏览 4提问于2016-07-11得票数 0

1回答

计算字段中的日期筛选器引用

tableau-api

是否有方法引用日期筛选器中定义的日期范围？假设我指定了一个日期过滤器2017-05-01直到2017-05-31。然后我创建了一个高度依赖于范围的计算字段。例如： ELSEIF min_date >=范围开始日期和min_date <=范围结束日期然后1 我希望根据设置的日期筛选器调整计算的字段。

浏览 2提问于2017-07-14得票数 2

回答已采纳

1回答

有没有一种计算成本较低的方法来替换数据帧中的名称？

python、string、performance、indexing、list-comprehension

我只想将'-PD‘添加到大型数据帧(约600万行)中满足特定条件的名称子集。我列出了我想要更改的名字： bool_list = df_geo_clean_tag['index'].isin(lessorequalto0_ids) 然后，我循环遍历bool_list为true的数据帧，以查找应该替换名称的索引： for row in range(len(df_geo_clean_tag)): if bool_list[row] == True: name = df_geo_clean_tag.iloc[row, 0] df_ge

浏览 12提问于2020-10-12得票数 0

回答已采纳

1回答

在python中从某个阈值绘制

python、pandas、dataframe、matplotlib

我有一个数据帧，它有3列: Date，value1，value 2。我已经用matplotlib把它们画在了一个图上。在python中可以从某个日期开始绘图吗？例如，我的数据集从1950开始，但我希望它在date = 1990而不是1950时开始绘图。下面是我的数据帧的一个示例 df = pd.DataFrame({ 'date': [1950, 1951, 1952, 1953,1954,1955,1956], 'value1': [23, 57, 78, 62, 80, 67, 98], 'value2': [42, 55, 45, 80,

浏览 15提问于2020-03-06得票数 0

回答已采纳

3回答

本地数据库和服务器数据库之间的数据同步

c#、sql、sql-server-ce

我使用Ado.Net数据实体模型每秒向本地Sql Compact数据库添加记录。我想把它同步到服务器上的数据库。你能告诉我正确的方向吗？

浏览 1提问于2011-08-16得票数 1

2回答

Linq to SQL -视图与存储过程

sql、linq-to-sql、stored-procedures、view

我想知道当我在app中使用L2S并从多个表中获取数据时，哪个更喜欢sql过程(select...join - tables)或sql view (select...join- tables )。谢谢/Yogesh

浏览 2提问于2011-04-07得票数 2

回答已采纳

1回答

在R中删除一元变量

如果变量是一元的，只包含一个值，那么我想了解如何从R中的数据帧中删除变量。有时，我有数千个变量的数据帧，我的第一步就是去掉这些变量(这些变量通常是从数据仓库交给我的)。我知道我可以像 drops <- c("x","z") DF[,!(names(DF) %in% drops)] 如下所示：但是我想要一些方法来搜索所有的变量，并且只删除一元。

浏览 0提问于2015-09-02得票数 2

回答已采纳

2回答

Hibernate hbm文件中的过滤机制对于动态谓词来说不是很灵活

java、hibernate、security、filter、orm

我正在开发一个Spring框架和hibernate应用程序，该应用程序具有一个中央数据库，用于一个每天有大约1000个在线用户的企业web应用程序。你可以假设有一个帐单应用程序，任何人都可以自己做任何事情(例如增加他的帐单金额或减少他的帐单金额)。任何用户都有自己的数据，这些数据通过hbm文件中的过滤机制保护到特定用户： <?xml version="1.0"?> <!DOCTYPE hibernate-mapping PUBLIC "-//Hibernate/Hibernate Mapping DTD 3.0//EN" "http

浏览 1提问于2017-05-01得票数 1

1回答

连接多个数据帧和重复的列

python、pandas

我确信我做错了什么，但这对我来说并不明显。我有很多想加入的数据帧。我使用pd.merge左连接加入，我是这样做的 Database=pd.merge(df1, df2, left_on='key', Right_on='key',how='left') Database=pd.merge(df3, df4, left_on='key', Right_on='key',how='left') 重复但总是写回数据库数据帧，一切正常，但最后我有多个副本，即df1_code已被重复为df1_code_x

浏览 1提问于2016-04-28得票数 0

2回答

什么是key_0，为什么我会在合并的数据帧中看到它，有什么方法可以防止它吗？

python、python-3.x、pandas

根据我的juptyer笔记本查询，Python 3.6.5和Pandas 0.23.0。我正在合并两个数据帧： df_merged1=pd.merge(df_RL, df_BR, how='left',left_on=df_RL['Business Service Manual'], right_on=df_BR['Names']) 左边的数据帧df_RL.dtypes Server object Server Farm object Business Service Man

浏览 4提问于2018-08-30得票数 2

1回答

Linq 2 SQL并行处理

c#、multithreading、linq-to-sql、parallel-processing

我有一个长期运行的任务，它受益于多线程。随着时间的推移，每个线程都会添加一个L2S实体，每个线程都需要访问该实体中的属性。由于需要实体的单个实例，因此很难为每个线程使用多个datacontext。有没有一种推荐的方法来实现这种情况？在使用Linq to SQL之前，我是在经过一定数量的并行迭代后序列化到XML的。这工作得很好，但此后数据变得更加复杂，需要SQL中提供的关系/查询；一些附加信息:任务是分析视频的帧，以找到相似帧的序列。有媒体，帧和镜头的表格。具有多个帧和镜头的媒体具有多个帧的镜头；帧提取和比较是处理器密集型操作，并受益于多线程。问题是，对于每个提取的帧。它需要将它自己与

浏览 0提问于2012-12-13得票数 0

回答已采纳

2回答

按多个值筛选一列

python、python-3.x、jupyter-notebook、jupyter

我是Python的新手，我想通过多个列值来筛选行。我的数据帧的名称是df，列的名称是values，我想用以下值来过滤这一列： 2, 4, 5, 9 我的数据帧是这样的： name value Jon 4 Ron 5 Paul 10 Max 3 太感谢了，亨里克。

浏览 2提问于2021-06-11得票数 0

2回答

如何将多个过滤器应用于数据帧？

python、apache-spark、apache-spark-sql、pyspark-sql

我有一个数据框架看起来 +-------+-------+ | Code1 | Code2 | +-------+-------+ | A | 1 | | B | 1 | | A | 2 | | B | 2 | | C | 2 | | D | 2 | | D | 3 | | F | 3 | | G | 3 | +-------+-------+ 然后，我想应用一组独特的过滤器，如下所示：场景1 ->滤波器在Code1 IN (A，B)中的应

浏览 4提问于2019-09-20得票数 1

1回答

例如iOS项目使用CIFilters处理视频？

ios、objective-c、cifilter

核心图像过滤器的iOS实现包括一类CICategoryVideo过滤器，这些过滤器大概可以用来处理实时视频流。这意味着工作流的速度足够快，可以获取视频帧，对其应用一个或多个过滤器，然后将结果帧传递给显示/保存。有没有人知道一个示例项目，说明了这是如何完成的？到目前为止，我对CIFilters所做的就是将一个UIImage转换为一个CIImage，用一个CIFilter处理它，然后将它转换回一个UIImage来显示。我假设要在视频处理流中使用CI过滤器，必须使用核心视频pixelBuffers，将它们映射到CIImages，处理它们，然后将结果映射回像素缓冲区。我已经用OpenGL完成了这类

浏览 0提问于2014-03-26得票数 1

1回答

将输入数据和标签数据以何种形式输入到Keras函数中？

r、tensorflow、keras、deep-learning、neural-network

我试着训练一个顺序分类器，有一个输入神经元，三个输出神经元。数据位于数据帧X和Y中，但是如何将这些数据输入keras库中的fit函数？换句话说，train_x和train_y的变量类型应该是什么(例如，它是数据框架、矩阵、列表等等)？ [...] predictor <- keras_model_sequential() %>% layer_dense(units = 8, activation = "relu", input_shape = c(1)) %>% layer_dense(units = 8, activation = "rel

浏览 5提问于2020-05-16得票数 1

回答已采纳

1回答

获取列表中数据帧的名称

如何获取列表中数据帧的名称？不是数据帧中的列，而是数据帧本身。所以这就是我所拥有的： mydata <- lapply(myfiles, read.csv, stringsAsFactors=FALSE) fileNames <- list.files(pathx,pattern = "*.csv") names(mydata) <- gsub("\\.csv", "", fileNames) results <- lapply(mydata,myFUN) 假设这些名称是[df1,df2,df3...]。现在，根据数据

浏览 0提问于2014-12-07得票数 1

1回答

基于另一个数据帧将熊猫数据帧拆分成两个数据帧

python、pandas、dataframe

我试着在Stackoverflow上搜索这个问题的答案，虽然有类似的答案，但我试图改编公认的答案，我正在努力获得我想要的结果。我有一个数据框架： df = pd.DataFrame({'Customer': ['A', 'B', 'C', 'D'], 'Sales': [100, 200, 300, 400],

浏览 13提问于2019-06-24得票数 1

回答已采纳

1回答

删除R中数据帧中的重复行

r、duplicates

我有一个问题：我的dataframe有很多列。我想删除在列X、Y和Z中具有相同值的行。查看我的数据帧： A B C X Y Z 1 2 3 4 5 6 2 5 4 4 5 6 在上面的数据框中，我想删除第一行，因为X、Y和Z在两行中是相同的。我试过了，但它返回了一些不同的东西： newtable <- df[!duplicated(df$X, df$Z, df$Z), ] 非常感谢!

浏览 2提问于2019-12-11得票数 0

1回答

基于切片和选择的熊猫索引

python、pandas、dataframe、indexing、slice

无法想象这之前没有人问过，但是找不到类似的帖子。问:假设您有一个具有m列的pandas数据帧(df.shape == (nxm))。我想通过切片和选择列来提取列的子集，如下所示：df1 = df.iloc[:,[a,b,c:d]]。这个是可能的吗？在这个例子中，结果应该在df1中实例化一个数据帧，其中包含数据帧df的列a、b和c到d。

浏览 15提问于2021-09-13得票数 0

回答已采纳

1回答

是什么决定了spark应用程序中的作业数量

apache-spark、pyspark

以前我的理解是，一个动作会在spark应用程序中创建一个职位。但是让我们看看下面的场景，其中我只是使用.range()方法创建一个数据帧 df=spark.range(10) 因为我的spark.default.parallelism是10，所以结果数据帧是10个分区。现在我只是在数据帧上执行.show()和.count()操作 df.show() df.count() 现在，当我检查了spark历史记录时，我可以看到.show()的3个作业和.count()的1个作业。为什么.show()方法有3个任务？我读过一些文章，其中.show()最终将在内部调用.take()，它将遍历

浏览 1提问于2021-03-24得票数 0

1回答

使用字典从数据帧中选择多列

python、pandas、numpy、dataframe、dictionary

我有一个列名的数据帧 ** RI Na Mg Al Si K Ca Ba Fe类型** 类型列是分类的，由4种类型组成。如何使用字典只提取类型为2的RI、Al、Si、Ba柱？我尝试使用以下代码： pd.DataFrame.from_dict(data=df[df['Type']==2], orient='index',columns=['RI','Al','Si','Ba']) 我收到了一个错误： 'numpy.ndarray' object is not callable 如何

浏览 0提问于2020-02-23得票数 1

回答已采纳

1回答

在Scala Spark中，如何根据列的百分位值过滤数据帧

scala、apache-spark

假设我有这个数据帧： val df = Seq(("Mike",1),("Kevin",2),("Bob",3),("Steve",4)).toDF("name","score") 我想过滤这个数据帧，以便它只返回"score“列大于等于第75个百分位数的行。我该怎么做呢？非常感谢，祝你有愉快的一天！

浏览 1提问于2020-11-03得票数 0

2回答