Filter函数在数据帧中抛出错误_angular typescript中的Find/Filter函数抛出错误_Symfony 2.7.18在prod中抛出"Unknown 'truncate‘filter“错误，但在dev中未抛出 - 腾讯云开发者社区

r、error-handling、runtime-error

我在R中有一个代码，它在一段时间通过一个data.frame读取一行，如果满足某一组条件，就会更改data.frame中的一个变量的值。在伪码中： for(i in 1:nrow(data)) { if (conditions on data[i,]) { change value } else {do nothing} } 当代码运行时，它会在某一时刻停止并抛出以下错误消息：Error in if (condition : missing value where TRUE/FALSE needed 我理解，错误消息意味着，在某一时刻，当计算if语句中的条件时，结果是Na，而不是TRUE

浏览 4提问于2015-06-08得票数 1

回答已采纳

1回答

关于spark scala Array()需要澄清

scala、apache-spark、apache-spark-sql、scala-collections、nothing

比如说，我有一个数据帧。该数据帧中的列值很少是Array()，即ArrayNothing。如何过滤这些内容？因为如果我不这样做，那么如果有人尝试打印数据帧或其他内容，就会抛出错误。

浏览 5提问于2020-09-26得票数 0

1回答

Select (dplyr)在用户定义的函数调用中抛出对象错误？

我正在尝试定义一个函数，它可以用来对整个数据集的多个部分进行统计测试，而无需手动键入多行相同的代码。我的原始函数看起来像这样； #Mann-Whitney test for non-normal continuous variables MW_fn = function (var) { wilcox.test(x = df %>% filter(Diagnosis == "Control") %>% select(var) %>% pull(), y = df %>% filter(Diagnosis == "Schizophrenia

浏览 5提问于2020-10-28得票数 0

1回答

在数据帧上使用素数函数的运行

r、dataframe、apply

我使用apply在数据帧行上应用素数函数来查找索引数据帧。给定的输出应该保留以任意或所有数字为素数的行。示例数据帧名称c4： c1 c2 c3 1 8 2 6 2 9 5 4 3 10 4 5 4 7 1 8 5 3 1 2 6 7 5 9 7 5 1 4 8 2 1 3 9 7 2 4 10 10 4 8 给定的输出应该是 c1 c2 c3 1 8 2 6 2 9 5 4 3 10 4 5 4 7 1 8 5 3 1 2 6 7 5 9 7 5 1 4 8 2 1 3 9

浏览 0提问于2018-08-06得票数 0

1回答

如何在转换后过滤spark数据帧中的坏行或损坏行？

pyspark、pyspark-sql

df1 +-------+-------+-----+ | ID | Score| hits| +-------+-------+-----+ | 01| 100| Null| | 02| Null| 80| | 03| spark| 1| | 04| 300| 1| +-------+-------+-----+ 在将Score转换为int并将hits转换为float之后，我得到了以下数据帧： df2 +-------+-------+-----+ | ID | Score| hits| +-------+-

浏览 9提问于2019-05-15得票数 0

2回答

如何在pyspark中实现数据框(而不是数据框列)的“别名”

apache-spark、pyspark

使用spark 2.3.2和python，我尝试在单行中应用一些过滤器后实现"alias“来连接两个数据帧，如下面的代码所示。但它的抛出低于错误代码： orders.filter(orders.order_status.isin("CLOSED","COMPLETE")).select("order_id","order_date").alias("a").\ join(orderitems.select("order_item_order_id","or

浏览 14提问于2019-02-17得票数 0

回答已采纳

1回答

如何过滤R中的“任何值”？

r、dataframe、filtering

奇怪的问题，但是我如何过滤，以使数据帧的所有行都被返回？例如，假设您有以下数据帧： Pts <- floor(runif(20, 0, 4)) Name <- c(rep("Adam",5), rep("Ben",5), rep("Charlie",5), rep("Daisy",5)) df <- data.frame(Pts, Name) 假设您想为此数据帧设置一个预定的筛选器，例如： Ptsfilter <- c("2", "1") 然后，您将运行该数据帧，以获得新的

浏览 1提问于2016-03-08得票数 0

6回答

在dplyr错误中筛选函数:找不到对象'name‘

r、dplyr

我在R中有一个数据帧，类似于所谓的UK_profiles row.names id name 1 1 8131437 Profile 2 2 8131719 WolverineCompetition 3 4 8132011 www.vaseline.com 4 10 23265829 www.keepingskinamazing.co.uk 5 23 8042743 Mobile 6 24 8043312 Test 7 25 90914664 Join Our Core 8 26

浏览 6提问于2015-08-28得票数 29

回答已采纳

1回答

这个R函数有什么问题？

我想定义一个简单的函数来过滤数据框，类似于您在SPSS中使用"Select Cases“菜单选项所做的事情。如果我只想保留q3a为1：subset(df, q3a==1)的情况，可以在控制台中使用subset函数对其进行过滤。这将毫无问题地运行，并返回一个数据帧，其中只包含q3a为1的那些情况。但是，当我使用以下函数时，我得到一个错误： filter <- function(frame, var, val) { newFrame <- subset(frame, var==val) return(newFrame) } 当我尝试运行filter(df,

浏览 2提问于2017-01-05得票数 0

1回答

从pandas数据帧的所有列的列表中删除nans (pythonic方式)

python、pandas、list

我有一个满是列表的数据帧(在许多列中)，这些数据帧中有nan。我需要删除每一列中的nans，留下一个正确的列表。单元格示例： ['tag_001', 'tag_07', nan, nan, nan] 我怎样才能以蟒蛇的方式移除这些nan呢？谢谢!

浏览 18提问于2019-05-08得票数 2

回答已采纳

2回答

删除具有特定NA编号的组

r、filter、grouping、na

很抱歉打扰你提一个相对简单的问题。我有这种类型的数据帧：列"NAME“c(a，b，c，d，e ...)中的一长串名字，列"SURNAME”c(A，B)中的两个可能的类，以及包含值的第三列。我希望删除在值列中至少有一个SURNAME类的名称超过2个"NA“的所有名称。我想发布一个示例数据集，但我正在努力将其正确格式化我在试着用 df <- df %>% group_by(NAME) %>% group_by(SURNAME) %>% filter(!is.na(VALUE)) %>% filter(length

浏览 0提问于2018-07-23得票数 1

2回答

有没有使用循环更新一系列数据帧的简单方法？

r、loops、dataframe

我正在寻找一种方法来遍历R中的一系列数据帧，以便重组它们，为推动它们通过多个线性回归模型做准备。以下是基本结构。假设你有3个数据帧： StateList <- c(AL, AR, AZ) 其中每个状态表示不同的数据帧(具有不同记录计数的相同列)。我想要将所有3个数据帧从原始形式的列重组到ETL版本，在ETL版本中，我只以不同的顺序选择某些列，然后是原始格式。我可以通过运行以下命令轻松完成此操作： AL <- AL[var5,var3,var2] AR <- AR[var5,var3,var2] AZ <- AZ[var5,var3,var2] 有没有什么简单的方法可以

浏览 1提问于2020-05-28得票数 0

1回答

在R中检查包的对象的类

r、dataframe

我想检查哪些对象是称为"datasets“的包中的数据帧，如果为它们找到了，我想检查是否这些数据帧的维度是248个观测值和8个变量，然后打印这些对象--这是我尝试过的代码，但是无法得到输出。 library(datasets) lsf.str("package:datasets") listname <- as.list((ls("package:datasets"))) lst=c() for(i in listname){ lst <- is.data.frame(as.name(listname[[i]])) } 任何帮助都将不

浏览 2提问于2016-12-13得票数 0

回答已采纳

1回答

如果包含特定单词，如何从R中的列表中删除元素(dataframe

r、list、dataframe、tidyverse、data-wrangling

我有一个数据框架。我将这个数据帧分成6行的子帧，每个子帧在一个列表中。我希望如果在这些子帧中存在单词"#ERROR“，则删除所有数据帧(甚至在一行中包含特定单词)，并接收具有较少数量的数据帧的列表。然后，我将再次将列表转换为dataframe。我的问题是，我尝试了不同的代码，但我不知道如何从列表中消除带有特定单词的subdataframe。我尝试了下面的方法 a<-dataset View(a) my.list<-split(a, rep(1:119, each = 6)) z=lapply(1:length(my.list), function(i) my.li

浏览 14提问于2020-07-01得票数 0

2回答

通过主键将Pandas数据帧附加到sqlite表

python、sqlite、pandas

我想将Pandas数据帧附加到名为“NewTable”的sqlite数据库中的现有表中。NewTable有三个字段(ID、Name、Age)，ID是主键。我的数据库连接： import sqlite3 DB='<path>' conn = sqlite3.connect(DB) 我想要附加的数据帧： test=pd.DataFrame(columns=['ID','Name','Age']) test.loc[0,:]='L1','John',17 test.loc[1,:]=&

浏览 2提问于2014-05-10得票数 14

回答已采纳

2回答

函数中出错:参数已求值

r、dplyr、purrr

我正在尝试编写几个嵌入式函数，它们最终过滤了一组由向量(load_data()中的id_types)定义的列(filter_data()中的id_type)。基于新的，我试图使用enquo来运行我的代码，但我收到了一个错误，我不知道如何处理。实际的代码比较复杂(实际上需要不同的函数)，但这是我可以用来复制错误的最简单的代码： library(dplyr) library(purrr) data <- tibble(id_a = c(1,1,2,2,3), id_b = 991, id_c = c(45,45,45,1,80),

浏览 1提问于2017-10-05得票数 1

2回答

如何正确应用R中的滤波函数？

我不能在R中应用一个简单的过滤器，它会抛出一个错误，导致参数找不到，而且我也不知道如何解决它。我使用imdb数据库，下面是代码： imdb_ratings <- imdb_ratings %>% filter(nrOfWins > 0) 错误：Error in filter(., nrOfWins > 0) : object 'nrOfWins' not found

浏览 6提问于2020-04-18得票数 2

回答已采纳

1回答

如何在aws glue dynamicframe上创建过滤掉一组(文字)值的过滤器

aws-glue-spark

在glue脚本中(运行在zeppelin notebook中，转发到glue中的开发端点)，我已经从glue表创建了一个动态框架，我希望过滤不在静态值列表中的字段"name“，即("a"，"b"，"c")。对不相等进行过滤就像这样： def unknownNameFilter(rec: DynamicRecord): Boolean = { rec.getField("name").exists(_ != "a") } 我试过几种方法，比如 !rec.getField("name"

浏览 8提问于2021-02-12得票数 0

回答已采纳

4回答

如何在Python中动态命名数据帧？

python、python-3.x、pandas、list、dataframe

我有一个包含30多张工作表的excel文件。然而，我在每个工作表上所做的操作或多或少都是相同的。但我的目标是为每个工作表创建单独的数据框架，以便将来可以参考这就是我所尝试的，但它抛出了一个错误 xls = pd.ExcelFile('DC_Measurement.xlsx') sheets = xls.sheet_names for s in sheets: print(s) 'df '+ s = pd.read_excel(xls, sheet_name=s) 因此，就像我想要创建30个数据帧，并且每个数据帧都将以工作表名称作为后缀名称。我

浏览 38提问于2019-07-24得票数 1

回答已采纳

2回答

在Python中，自定义函数适用于整个数据框，但不适用于分组的数据框(通过'groupby‘函数应用

python、function、pandas-groupby

我有一个简单的数据框架，我希望在列'A‘上应用groupby函数，并生成从定义的函数(函数内的循环)计算的新列，该函数从列'B’和列'C‘中获取值。我的问题是，我能够实现整个数据帧的功能，但不能实现分组数据帧(Exception: Column(s) B already selected)的功能。我不明白为什么它在分组的数据帧上抛出错误，而不是在整个数据帧上抛出错误。我的实现如下： >>> import pandas as pd >>> >>> df = pd.read_csv("foo.txt",

浏览 5提问于2019-07-05得票数 0

2回答

将列表中的输入变量存储到R中的循环中

r、dataframe、for-loop

我相信有更好的方法来做这件事，我愿意接受建议。我有这样的载体： vkt1 <- c("df1", "df2", "df3") vector2 <- paste("sample", wSheatx, sep="_") 第一个向量包含存储在环境中的数据文件名的列表。它们作为字符串存储，但我想将它们称为变量名。第二个向量只是在乞讨处添加“样本”的第一个向量，相当于： vector2 <- c('sample_df1', 'sample_df2', 'sample

浏览 3提问于2020-05-24得票数 0

回答已采纳

1回答

具有dplyr的r- For循环，用于在多个数据帧之间设置数据。

r、for-loop、dplyr、subset

我有50个具有温湿度数据的数据帧，我想创建一个新的数据框架，其中包括每个数据帧中的一个特定行。首先，我创建了一个list (onomata_list)，其中导入了所有50个数据帧；其次，我创建了一个虚拟数据框架(All_stations_30_6_17)，用于从每个数据帧“发送”行，最后我编写了以下for循环，以实现上述目标： for(i in 1:length(onomata_list)){ new_df <- onomata_list[[i]] %>% filter(date == "2017-06-30" & time == "17:00

浏览 4提问于2021-05-20得票数 0

回答已采纳

2回答

R:如何使dataframe中的列不被识别为变量

r、csv、dataframe

我在R中有一个5列的数据帧。第一列包含行名，但R将其识别为变量，因此这将在后续步骤中抛出错误。关于如何让R识别这些是行名而不是变量，有什么想法吗？非常感谢大家的帮助！ **我正在做一些基因测序分析，数据框包含临床信息。因此，我更喜欢保持数据帧的完整性，因为行名包含用于跟踪单个样本的标识符。

浏览 40提问于2017-01-26得票数 0

1回答

如何应用过滤器

r、function、lapply

我使用Filter()从数据帧中删除NAs列。 Filter(function(x) !all(is.na(x)), df) 我有一个包含NAs列的数据帧列表，我想在其中运行这个函数。我不明白在lapply()中运行这些参数时如何将这些参数传递给Filter()。文件上写着“.”。我最好的猜测是： > lapply(mylist, Filter, function(x) !all(is.na(x))) Error in get(as.character(FUN), mode = "function", envir = envir) : object 'f&#

浏览 1提问于2019-03-01得票数 2

回答已采纳

3回答

在Spark Dataframe中，如何获取两个数据帧中的重复记录和不同记录？

scala、apache-spark

我正在解决一个问题，在这个问题中，我正在将数据从一个hive表加载到spark dataframe中，现在我希望所有唯一的帐户都在一个数据帧中，所有重复的帐户都在另一个数据帧中。例如，如果我有帐户id 1,1,2,3,4，我想在一个数据帧中获取2,3,4，在另一个数据帧中获取1,1。我该怎么做呢？

浏览 2提问于2016-10-14得票数 9

回答已采纳

2回答

FIltering一个pandas数据帧，其函数缺省为无过滤器

python、pandas、dataframe

我正在尝试创建一个python函数，该函数使用函数定义中的默认属性动态过滤熊猫数据帧。其思想是，如果没有向函数传递任何值，则默认值将接管(我将其声明为列本身)，因此根本不会过滤数据帧。到目前为止，我得到了以下信息： import pandas as pd def filter(df, foo="df['foo']"): newdf = df[df['foo']==foo] print(newdf) data = { 'foo': ['First value', 'Second

浏览 17提问于2020-05-20得票数 1

回答已采纳

1回答

在scala中，Seq[unit]类型的表达式不符合预期的Seq[DataFrame]类型

scala、apache-spark、dataframe

在我的函数中，我返回一个finalDF，一个数据帧序列。在下面所示的循环中，map返回Seq[DataFrame]，并将其存储在finalDF中以便能够返回给调用者，但是在有些情况下，在需要进一步处理的情况下，我希望为每个迭代存储过滤后的数据，并将其传递给下一个循环。我该怎么做呢？如果我尝试将其分配给某个临时val，则会抛出Seq[unit]类型的表达式不符合预期类型Seq[DataFrame]的错误。 var finalDF: Seq[DataFrame] =null for (i <- 0 until stop){ finalDF=strataCount(i).map

浏览 1提问于2016-11-29得票数 0

回答已采纳

1回答

如何通过索引从列表中删除元素？

我有两个数据帧。其中之一，我们称之为df，它非常大，包含多列和多行。其中一个列是"admin“，另一个是”name“。通过搜索包含特定管理员和特定名称的行的索引，我创建了第二个名为xmatches的数据框架。我想从df中删除这些行。我怎样才能做到这一点？我尝试了一下，这样我就可以查看我可能删除的内容，它会抛出一个错误(我在这方面非常新，但我确实期望会出现一些错误，这就是为什么我没有尝试在这里实际删除)。 a_df[xmatches] 错误： Can't subset columns past the end. ℹ Locations 52762, 52763, 52764,

浏览 4提问于2022-10-13得票数 0

回答已采纳

1回答

如何在不合并r中数据帧的情况下，从多个数据帧的列名中删除"-“和空格

r、data-cleaning

我有30个数据帧显示: data_01，data_02，....、data_30.我正在尝试删除列名中的空格和"-“，并使用以下代码将它们转换为小写： names(data_02) %<>% stringr::str_remove_all("-") %>% str_replace_all( "\\s", "_" ) %>% tolower 对于30个数据帧，我必须重复此过程30次。有没有什么方法可以在不合并数据帧的情况下，用一个代码对所有数据帧进行这个过程。我尝试过这个:创建数据帧列表 df

浏览 13提问于2020-11-03得票数 1

回答已采纳

1回答

Pyspark:如何使用UDF过滤表？

python、pyspark、filter

我有一个数据帧，我想根据一列过滤掉一些行。但我的条件相当复杂，需要一个单独的函数，这不是我可以在单个表达式或where子句中完成的事情。我的计划是根据是保留还是过滤掉该行来返回True或False： from pyspark.sql.types import BooleanType from pyspark.sql.function import udf def my_filter(col1): # I will have more conditions here, but for simplicity... if col1 is null: return

浏览 0提问于2021-07-16得票数 0

1回答

“subset”的奇怪问题

r、subset

我对subset有一个奇怪的问题:它不能识别我数据帧中的变量。例如，如果我想要数据帧DF中变量v1的摘要，我会得到： summary(DF$v1) Min. 1st Qu. Median Mean 3rd Qu. Max -123.00 4.00 14.00 84.62 49.00 13140.00 现在，这个变量应该总是非负的，所以我想通过将dataframe DF子集到dataframe PROBS中来检查负值。但如果我试着这样做： PROB <- subset[DF, v1 < 0] 我得到了： Error: object "v1

浏览 3提问于2012-11-27得票数 3

回答已采纳

1回答

按数组列过滤Scala数据帧

scala、apache-spark-sql

我的scala dataframe有一个数据类型为array(element: String)的列。我想要显示该列中包含单词"hello“的数据帧的那些行。我有这个： display(df.filter($"my_column".contains("hello"))) 我得到一个错误，因为数据不匹配。上面写着：argument 1 requires string type, however, 'my：' is of array<string> type列。

浏览 4提问于2018-09-07得票数 0

回答已采纳

2回答

朱莉娅DataFrame错误: BoundsError试图访问在索引false处有X行的数据帧

julia

我试图将朱莉娅中的DataFrame分类如下： df = DataFrame(a=[1,2,3], b=["x", "y", "z"]) df2 = df[df.a == 2, :] 我希望只返回第二行，但是却得到了一个错误：错误: BoundsError:尝试访问“尝试访问索引为false的3行数据帧” 这个错误意味着什么?我如何子集DataFrame？

浏览 0提问于2019-06-25得票数 2

2回答

使用"[]“在tibble上设置”对象未找到“错误

r、dplyr

关于dplyr 的文章说，"[]“(方括号)可以用于对过滤后的Tibbles进行子集，如下所示： filter(mammals, adult_body_mass_g > 1e7)[ , 3] 但是我得到了一个“对象找不到”的错误。下面是错误在一个更知名的数据集"iris“上的复制。 library(dplyr) iris %>% filter(Sepal.Length>6) [,c(1:3)] filter_(.data，.dots =lazyeval：：lazy_dots(.))中的错误:找不到对象'Sepal.Length‘ 我还想提到，我

浏览 2提问于2017-06-05得票数 2

回答已采纳

2回答

在数据帧列中添加所有值，其中每个单元格是另一个向量

r、data-science、data-cleaning

我有一个如下结构的数据框架： MonthYear Total 01/2020 c(1, 1, 1, 1, 1...) 02/2020 c(2, 14, 6, 12, 91...) ... ... 我如何制作这个数据框架，以便我可以将每个向量中的所有值相加，并将它们再次存储在数据帧中？那么，假设第一个向量的总数是100，我怎么能得到这个和，并将它存储在我的数据帧中呢？到目前为止，我已经尝试了一种聚合，但这又抛出了一个错误。我的聚合看起来是这样的:然而，当我这样做的时候，我得

浏览 0提问于2021-12-15得票数 0

回答已采纳

1回答

错误:无法重建数据帧。X类的`[`方法]<findFn/data.framework>必须返回带有1列的数据帧

我需要一点帮助。我是R.关于在R studio中运行以下代码的新手。 library(sos) library(htmlTable) library(stringr) library(dplyr) # Get auc functions auc.search <- findFn("auc") auc.functions <- auc.search %>% filter(Function == "auc", Package != "pROC") %>% select(Package, Functi

浏览 1提问于2021-12-04得票数 0

回答已采纳

1回答

单元测试中的Spark Dataframe比较以检查功能

scala、dataframe、unit-testing、apache-spark、apache-spark-sql

我已经创建了一些方法来将数据帧转换为所需的格式，并根据错误规则过滤多个错误检查和更新数据帧。我是一个在intelliJ上用scala编写单元测试的新手。我必须编写单元测试来将实际数据帧与预期结果进行比较。下面是我为数据帧的pivot功能编写的单元测试用例。类似地，我必须将获得的数据集与预期的数据帧进行比较。 @Test def testPivotingDataFramePositive(): Unit = { val inputDf = spark.read.option("header",true).csv("src/test/resources

浏览 4提问于2021-09-13得票数 1

1回答

如何迭代数组(字符串)以进行虚空/空白值检查

python、apache-spark、pyspark、pyspark-dataframes

浏览 1提问于2020-03-27得票数 2

回答已采纳

3回答

过滤掉在数据帧列表中没有列Z的所有数据帧？

r、dplyr、filter

我有一个由6个数据帧组成的列表，其中5/6的数据帧中有一列"Z“。为了继续我的脚本，我需要删除没有Z列的数据框架，所以我尝试了以下代码： for(i in 1:length(df)){ if(!("Z" %in% colnames(df[[i]]))) { df[[i]] = NULL } } 这似乎确实完成了这项工作(它从列表中删除了一个数据帧，其中没有列Z)，但是我仍然收到了一条消息“df[i]中的错误:下标超出界限”。为什么是这样，我怎样才能避免错误呢？

浏览 5提问于2022-06-01得票数 1

回答已采纳

2回答

过滤器语句中的错误-闪亮的应用程序

r、shiny

我在我闪亮的应用程序中添加了一个日期过滤器。现在我想根据数据输入动态地过滤数据帧。我在ui.R中尝试了如下方法 fluidPage( selectInput( "analysis_period", "analysie period:", c( "Last Year" = "LY", "Past 90 days" = "ND", "Past 30 days" = &

浏览 0提问于2018-11-19得票数 0

回答已采纳

2回答

使用tidytext删除停用词

r、dplyr、tidyverse、tidytext

使用tidytext，我有以下代码： data(stop_words) tidy_documents <- tidy_documents %>% anti_join(stop_words) 我希望它使用内置到包中的停止字，将名为tidy_documents的数据帧写入同名的数据帧，但如果它们在stop_words中，则删除这些字。我得到了这个错误：错误:没有公共变量。请指定by参数。回溯： 1. tidy_documents %>% anti_join(stop_words) 2. withVisible(eval(quote(`_fseq`(`_lhs`))

浏览 1提问于2017-04-17得票数 2

回答已采纳

2回答

以字符串开头的星火数据帧搜索列

apache-spark、apache-spark-sql

我需要根据列值应该以预定义字符串开头的条件来筛选数据帧。我正在尝试以下几点： val domainConfigJSON = sqlContext.read .jdbc(url, "CONFIG", prop) .select("DID", "CONF", "KEY").filter("key like 'config.*'") 并得到例外：由: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException:引起，您的SQL

浏览 4提问于2017-08-07得票数 15

回答已采纳

2回答

R筛选行: where子句: from数据帧

r、select、filter、dplyr

我正在尝试过滤R中的一个数据帧，如下所示。假设mydf是具有两列A和B的数据帧。假设udf是具有1列A的另一个数据帧。我想做以下几件事。 Select rows from mydf where mydf[A] is in udf[A] 我正在使用dplyr，并尝试了以下命令 T = filter(mydf, A %in% udf['A']) 这显然是行不通的。在不显式编写for循环的情况下，有没有简单的解决方法？非常感谢!

浏览 5提问于2014-12-11得票数 2

1回答

Pyspark over zeppilin:无法导出为csv格式？

pyspark、export-to-csv、apache-zeppelin

我正在尝试将数据帧导出到S3存储桶的.csv文件中。不幸的是，它保存在拼图文件中。谁能让我知道，如何得到出口火花源数据帧到.csv文件。我尝试了下面的代码: predictions.select("probability").write.format('csv').csv('s3a://bucketname/output/x1.csv') 它抛出这个错误: CSV数据源不支持结构，values:array>数据类型。感谢任何人的帮助。注意:我的spark设置是基于zepplin的。谢谢，Naseer

浏览 15提问于2019-02-11得票数 2

回答已采纳

1回答

在数据帧上应用筛选器时出错- PySpark

python、python-3.x、pyspark

我需要从run_date中减去10天，然后对数据帧应用过滤器。然而，在运行下面的代码时，得到了错误。-错误: AnalysisException：“给定输入列cust，activity_day；；\n‘’Filter (to_date(activity_day#1341，Some(YYYY-MM-DD)) > date_sub(cast(to_date('2020-01-10，Some(YYYY-MM-DD)) as date)，10))\n+- LogicalRDD cust#1340L，activity_day#1341\n”。数据： df = spark.createD

浏览 7提问于2021-09-03得票数 0

回答已采纳

3回答

：未设置IMFSinkWriter WriteSample API返回错误采样

windows、media、ms-media-foundation

我需要接收RTP流(H264)并将它们导出到MP4文件中。我们使用媒体基础将在RTP流中接收到的帧导出到mp4文件中。因此，我们从RTP数据包中提取H264帧，并通过设置WriteSample API(采样时间、采样持续时间等)将其提供给用户。这似乎奏效了，我得到了可玩的mp4。但是，当我不设置示例持续时间(使用SetSampleDuration API)时，writeSample会抛出错误(MF_E_NO_SAMPLE_DURATION)。错误不是对前几个帧抛出的，而是在一定时间后( 1.48秒后的帧)才抛出的: 1.为什么需要SetSampleDuration ?如果我们为每个样本提供采样

浏览 4提问于2020-01-30得票数 1

回答已采纳

1回答

R中的模式匹配字符向量

r、dataframe

我尝试在两个单独的数据帧中匹配两个向量之间的字符，让我们将这两个数据帧称为“租赁”和“包裹”，这两个数据帧都包含向量“地址”，这是一个县的所有租赁地块的地址和一个城市的所有地块的地址的字符。我们想要找出"parcels“数据帧中的哪些地址与"rentals”数据帧中的地址相匹配，方法是在"parcels“中的地址矢量中搜索与”rentals“中的地址相匹配的地址。租赁$address中的值如下所示： rentals$address <- c("110 SW ARTHUR ST", "1610 NE 66TH AVE", "

浏览 17提问于2021-05-15得票数 0

3回答

使用数据帧列的名称作为筛选数据帧中该列的函数的参数值

r、function、filter、dplyr、names

我想在函数中编写一个使用dplyr::filter()的函数。在编写函数时，我遇到了在函数中使用参数名称时遇到的问题，该参数名称也是我正在筛选的数据帧的一个列的名称。假设我调用数据帧来过滤dat library(dplyr) dat <- data.frame( a = c(1:10), b = c(2,2,2,2,2,3,1,1,4,4) ) 将函数命名为test.filter()， test.filter <- function(b, test.data = dat){ dat.t <- filter(test.data, b == b) r

浏览 2提问于2019-09-30得票数 3

3回答

在python中有应用的实现吗？

python、python-2.7

在python中有apply的实现吗？有没有人能举一个简单功能的例子？我已经尝试过了，它抛出了一个错误 dfsub.apply(dfsub,function(x){sum(x)) 其中dfsub是包含两列a和c的数据帧，这两列具有整数值，我想知道每行的总和？

浏览 2提问于2014-01-23得票数 1

1回答

如何在pyspark dataframe中不聚合地分组

dataframe、apache-spark、pyspark、group-by、apache-spark-sql

我有一个非常庞大的数据集，我需要使用pyspark dataframe。请参考数据的简化版本： product_type series_no product_amount date 514 111 20 2020/01/01 (YYYY/MM/DD) 514 111 30 2020/01/02 514 111 40 2020/01/03 514

浏览 30提问于2021-01-23得票数 0

回答已采纳