如何遍历R Dataframe中的向量

遍历R Dataframe中的向量可以使用循环结构或者应用函数来实现。

使用循环结构：在R中，可以使用for循环或者while循环来遍历DataFrame中的向量。例如，假设有一个名为df的DataFrame，其中包含一个名为vec的向量，可以使用如下代码遍历向量中的每个元素：
使用循环结构：在R中，可以使用for循环或者while循环来遍历DataFrame中的向量。例如，假设有一个名为df的DataFrame，其中包含一个名为vec的向量，可以使用如下代码遍历向量中的每个元素：
在循环中，变量i从1到向量的长度逐渐增加，通过df$vec[i]可以访问向量中的每个元素。
使用apply函数： apply函数是一种更为简洁和高效的遍历方式，可以应用于DataFrame的行或列。例如，可以使用apply函数遍历DataFrame的列向量：
使用apply函数： apply函数是一种更为简洁和高效的遍历方式，可以应用于DataFrame的行或列。例如，可以使用apply函数遍历DataFrame的列向量：
在这个例子中，apply函数的第一个参数是DataFrame对象df，第二个参数是2表示按列遍历，第三个参数是一个匿名函数，用于处理每个向量。

需要注意的是，以上的方法可以用于遍历DataFrame中的向量，但是在实际应用中，可能更多地是对DataFrame的行或列进行遍历和处理。

以上是关于如何遍历R Dataframe中的向量的基本方法，具体的应用场景和使用推荐的腾讯云产品取决于具体的业务需求和数据处理方式，可以根据实际情况选择相应的技术和产品进行开发和部署。

页面内容是否对你有帮助？

有帮助

没帮助

在rpy2中，是否有一种简单的方法可以生成不同值长度的数据？

、、

当我这么做时： import rpy2.robjects as R exampleDict = {'colum1':R.IntVector([1,2,3]), 'column2':R.FloatVector([1,2]), 'column3':R.FloatVector([1,2,3,4])} R.DataFrame(exampleDict) 我得到的错误是，这些行不是相同的长度：“参数意味着不同的行数: 2、4、3”。我之前是如何解决这个问题的:先遍历这些列表，然后再将它们作为向量，然后将NA添加到所有小于最长的列表中，直到它们都具有相同的长

浏览 5提问于2012-04-03得票数 0

回答已采纳

1回答

使用循环在R中创建计数器

我是R的初学者，我在论坛上搜索了一下，没有找到这个问题的答案。我尝试在R中创建一个循环，用于计算数据帧中的两行之间是否满足某个条件。我知道这不是一种有效的方法，但这是针对班级作业的。我的问题是，我的代码创建了一个无尽的循环，而不是给我计数器输出，我不清楚如何修复它。如果有任何建议，我将不胜感激。代码如下： counter=0 for (i in 1:nrow(dataframe)) {if (dataframe$column1[i]>dataframe$column2[i]==TRUE) { counter=counter+1} } print(counter)

浏览 4提问于2017-03-26得票数 0

1回答

将列表中的元素保存到函数中的".Rda“文件

、、

例如，我有一个列为name、n、mean和sd的dataframe。如何提取列表中的元素并将其保存到单个rda文件中。文件应该包含生成的数据集，而不是列表。 random.r <- function(df, filename) { save.random <- function(name, n, mean, sd) { rn <- rnorm(n=n, mean=mean, sd=sd) assign(deparse(name), rn) } rlist <- sapply(1:nrow(df), function(x) save

浏览 1提问于2014-02-16得票数 1

回答已采纳

1回答

向R中的数据列表中添加新的单字符变量。

、、

我需要合并R中的一长串数据，并且我希望使用purrr::map和dplyr::mutate为每个数据创建一个标识符变量。结果将是一个新的变量的每个数据是唯一的和一个字符串。这是我所得到的错误的重述。我怎么才能解决这个问题？ library(tidyverse) df_1 <- mtcars %>% as_tibble() %>% select(1:3) df_2 <- mtcars %>% as_tibble() %>% select(4:6) df_ls <- list(df_1, df_2) ne

浏览 0提问于2019-08-13得票数 1

回答已采纳

2回答

朱莉娅遍历了几行数据

、、、

我正在尝试迭代朱莉娅中的DataFrame行，以便为数据帧生成一个新列。我还没有找到一个清楚的例子来说明如何做到这一点。在R中，这种类型的东西是向量化的，但据我所知，不是所有的Julia操作都是向量化的，所以我需要遍历行。我知道我可以用索引来做这件事，但我相信一定有更好的方法。我希望能够按名称引用列值。这里我有： test_df = DataFrame( A = [1,2,3,4,5], B = [2,3,4,5,6]) test_df["C"] = [ test_df[i,"A"] * test_df[i,"B"] for i in 1:siz

浏览 2提问于2014-03-15得票数 5

回答已采纳

3回答

循环遍历R中的列

、、

我正在使用R's stats包，并希望在all the rows of a dataframe中遍历column[x]，使用函数对列中的each cell中的数据进行操作，并将结果传递给一个新列( new column中的calculated result与column[x]中的数据对齐)。我有两个问题： --我无法让它开始工作--在我读过的R articles中，循环似乎是不鼓励的。是否有其他方法可供选择，如果没有，是否有关于如何执行循环的示例？

浏览 4提问于2009-10-25得票数 8

1回答

摆脱"AsIs“类属性

、

我想是一个简单的问题，但还没有找到答案。如何摆脱我的数据框上的"AsIs“类属性。它阻止foreign包中的write.dbf转换为dbf。我是从rpy2工作，但它与没有"AsIs“的R数据帧工作。我把完整的代码放在错误消息的下面。dbfs = write_dbf(r_dataframe) Error in function (dataframe, file, factor2char = TRUE, max_nchar = 254) : data frame contains columns of unsupported class(es) AsIs --------

浏览 1提问于2012-10-13得票数 8

1回答

seq.default(1，1，length.out = nrow(x))中的错误:参数'length.out‘必须长度为1

、、

我试图创建一个简单的函数，如果它不是异常值，则查找异常值并将相应的观察标记为valid.obs=1，如果它确实是异常值，则标记为valid.obs=0。例如，对于可变的“收入”，将根据以下公式确定异常值： income>=(99percentile(income)+standard_deviation(income))，，那么它就是一个离群点。如果是income<(99percentile(income)+standard_deviation(income))，，那么它就不是孤立点。 rem= function(x){ u=quantile(x,probs=0.99,n

浏览 2提问于2016-12-18得票数 0

1回答

带有条件的Pandas数据帧操作

、、

如何遍历Pandas DataFrame字段并使用同一数据框中另一个字段的输入填充空值我的目标是用z列中的相应值填充y列中的na值

浏览 4提问于2019-11-26得票数 0

回答已采纳

2回答

通过引用传递data.frame并使用rcpp更新它

、

看着图库中的rcpp文档和Rcpp::DataFrame，我意识到我不知道如何通过引用修改DataFrame。谷歌了一下，我在SO上找到了这篇文章，也在存档上找到了这篇文章。没有什么明显的东西，所以我怀疑我错过了一些重要的东西，比如“它已经是这样了”或“它没有意义，因为”。我尝试了以下已编译的代码，但传递给R中updateDFByRef的data.frame对象保持不变 #include <Rcpp.h> using namespace Rcpp; // [[Rcpp::export]] void updateDFByRef(DataFrame& df) { i

浏览 0提问于2013-03-31得票数 12

回答已采纳

2回答

检查字符是否在数据框中

、、

我正在寻找一种简单的方法来检查R数据框中的值是否包含逗号(或任何字符)。假设我有以下数据帧： df <- data.frame(A = c("apple","orange", "banana","strawberries"), B = c(23,12,10,15), C = c("2,53", "1.35","0,25","1,44")) 如果我知道其中包含逗号的列，我会使用以下命令：

浏览 21提问于2019-03-24得票数 1

回答已采纳

5回答

为R中的循环遍历列

、、

我想在dataframe中遍历列，对于每一列，如果NAs的数量大于所有条目的50%，我想从dataframe中删除该列。到目前为止，我有这样的事情，但它不起作用： for (i in names(df_r)) { if (sum(is.na(df_r[,i]))/length(df_r) > 0.5) { df_r <- df_r[, -i] } } 我更像个蟒蛇，我正在学习R，所以我可能会在这里混合语法。

浏览 0提问于2018-02-27得票数 1

回答已采纳

1回答

在Rcpp中调用`[ data.frame中的data.frame`时，避免使用SIGSEGV

、、

我的Rcpp代码偶尔会失败(SEGFAULT等等)因为我不明白的原因。代码创建一个大型data.frame，然后通过调用R子集函数( [.data.frame)，尝试从创建框架的同一方法中获取该data.frame的子集。它的一个非常简化的版本如下： library(Rcpp) src <- '// R function to subset data.frame - what will be called to subset DataFrame test() { Function subsetinR("[.data.frame"); // Make a dat

浏览 6提问于2016-07-19得票数 3

回答已采纳

1回答

Python删除熊猫数据中的停止词，给出错误的输出

、、、

我从多个文件中删除停止字。首先，我读取每个文件并从dataframe中删除停止字。之后，我将dataframe与下一个dataframe连接起来。当我打印dataframe时，它会给出如下的输出： 0 [I, , , , , r, e, , h, , h, , h, v, e, ... 1 [D, , u, , e, v, e, n, , e, , h, e, , u, ... 2 [R, g, h, , f, r, , h, e, , e, c, r, , w, ... 3 [A, f,

浏览 2提问于2017-04-03得票数 2

回答已采纳

3回答

在给定三个点的坐标的情况下，如何在二维空间中找到这些点的方向？

、

实际上我找到了这个公式，但我不知道它是如何工作的。假设p,q和r是三个点， k=(q.y - p.y)*(r.x - q.x)-(q.x - p.x) * (r.y - q.y); if(k==0): They are all colinear if(k>0) : They are all clockwise if(k<0) : They are counter clockwise 如果有人解释它是如何工作的，我会很高兴的。

浏览 0提问于2013-07-11得票数 7

回答已采纳

1回答

在R中读取系统命令的内容

、

我想列出目录中的所有文件(包括子目录)，然后将其读入R. 目前，我已经尝试使用系统命令。我已经使用如下命令列出了所有文件： system("ls -l $(find ~/starting_location/ -type f)") 但是，我想不出如何将它放到R中的dataframe中，我一直在尝试将它写到文本文件中，然后导入它，但这也没有起作用(下面的例子)。 system("ls -l $(find ~/starting_location.prague.UDM/ -type f) > ~/starting_location/file_list.txt")

浏览 1提问于2016-01-19得票数 0

回答已采纳

1回答

如何基于列值筛选H2OFrame (scala)中的行？

、、

我正在从CSV文件中读取一个H2OFrame： val h2oFrame = new H2OFrame(new File(inputCsvFilePath)) 如何执行相当于.filter()操作的操作(可用于SparkDataFrame或RDD)。例如，如何获得一个新的H2OFrame，其中"label“(它是列名)是>1？我尝试了如下转换为org.apache.spark.sql.DataFrame (简化的示例)： val df = asDataFrame(h2oFrame) val dff = df.filter(s"label > 1") pri

浏览 0提问于2016-05-17得票数 2

1回答

如何计算R中数据帧的组合

、、、

我是R程序的初学者。我导入了一个csv文件。该文件只包含一个包含50个字符的列，但R将其归类为一个dataframe。我需要本专栏元素中所有可能的组合。我认为我需要使用向量，而不是数据框架，我怎么做呢？谢谢!

浏览 1提问于2017-04-09得票数 0

回答已采纳

1回答

r-使用和匹配来查找高频的第一次出现。

、、、

我有从dbf导入的几个宽格式的数据帧。因此，每一列都是一个日期，每一行都是一个观察。因此，根据我所观察的地理形状的大小，我每天都有500-2000次观测。为了便于复制，我创建了两个虚拟数据帧，其值范围可以在实际的数据框架中看到。 Data1<- data.frame(replicate(10, sample(0:1000, 20, rep= TRUE))) Data<- data.frame(replicate(10, sample(0:1000, 20, rep= TRUE))) 因为我有很多这样的数据框架，所以我把它们放在一个列表中，这样我就可以同时运行许多函数。 filen

浏览 1提问于2020-01-29得票数 1

回答已采纳

3回答

计算向量中列出的每个基因发生改变的样本数量

我是一个R newby，想知道人们是否可以给我一点建议，关于我如何处理我拥有的一些数据。我有一个数据框，其中包含观察到基因变化的样本列表(示例如下) Dataframe1: Sample Gene Alteration 1 A -1 1 B -1 1 C -1 1 D 1 2 B 1 2 E -1 ... 我还有一个数据框，其中包含我感兴趣的基因列表(示例如下) Dataframe2: Gene B D E 我想计算dataframe2中每个基因有多少个-1改变的样

浏览 1提问于2017-02-20得票数 1

2回答

在Rcpp中按列对数据帧进行排序

、

有没有什么简单的方法可以在RCpp中按两列(或多列或一列)对DataFrame进行排序？网上有许多可用的排序算法，或者我可以使用带有DataFrame包装器的std::sort，但是我想知道在RCpp或RCppArmadillo中是否已经有可用的东西？我需要将这种排序/排序作为另一个函数的一部分 DataFrame myFunc(DataFrame myDF, NumericVector x) { //// some code here DataFrame myDFsorted = sort (myDF, someColName1, someColName2) // how to

浏览 2提问于2014-05-31得票数 9

1回答

将数据列转换为字符向量

、

我有一个dataframe，我想对一个特定的专栏进行情感分析。 mysentiment <- get_nrc_sentiment(hud['review_body']) 但是，当我在R studio上使用 get_nrc_sentiment function I get the error "Error in get_nrc_sentiment(hud["review_body"]) : Data must be a character vector." 我尝试使用以下方法将dataframe列转换为向量 as.vector(hud[

浏览 2提问于2022-04-14得票数 0

1回答

有延迟的源多个R脚本

我试图在每个脚本之间找到多个R脚本，并有一个较短的延迟时间。所有被“源”的15R脚本都从GA收集数据，转换/清理/分析数据，然后在一个Google表中将数据放入自己的工作表中。因此，我希望在每个脚本之间设置一个等待1分钟的时间，以确保我没有重载Google文件。在每个source()命令之间有等待时间的情况下，我如何将代码(如下所示)转换为一个迷你函数？ source("/code/processed/script1.R") source("/code/processed/script1.R") source("/code/pr

浏览 2提问于2015-07-24得票数 0

回答已采纳

4回答

将数据帧列设置为R data.frame对象的索引

使用R，我如何使一个数据的列作为数据的索引？假设我从.csv文件中读取数据。其中一个列名为'Date‘，我希望使该列成为我的dataframe的索引。例如，在Python、NumPy、Pandas中，我将执行以下操作： df = pd.read_csv('/mydata.csv') d = df.set_index('Date') 在R里我该怎么做呢？我试过了R： df <- read.csv("/mydata.csv") d <- data.frame(V1=df['Date']) # or d <

浏览 11提问于2013-12-17得票数 41

回答已采纳

2回答

大熊猫如何逐行阅读excel

、、、、

我想问如何在熊猫中逐行阅读excel。我希望它在一个循环中，可以逐行获取使用selenium登录facebook的信息。希望大家都能随和，因为我是新手 import pandas as pd pd.options.display.max_rows = 28 data = pd.read_excel(r'file.xlsx') #load data into a DataFrame object: df = pd.DataFrame(data) username = pd.DataFrame(f1,columns=['Name']) password = pd

浏览 9提问于2022-12-04得票数 0

2回答

如何使用熊猫在dataframe python中编码多个列(但不是所有列)

、、、、

我想用两个数据(测试数据，训练数据)构建一个朴素的bayes模型。 dataframe包含13列，但我只想在5-6列中将数据从str编码为int值。如何使用一段代码来实现这一目的，从而可以直接对6列进行编码，我遵循以下答案： import pandas as pd from sklearn.preprocessing import LabelEncoder df = pd.DataFrame({ 'colors': ["R" ,"G", "B" ,"B" ,"G" ,"

浏览 2提问于2021-04-26得票数 1

回答已采纳

1回答

将字符串输出用作数据格式的变量名的一部分

、

我是从斯塔塔来的，我想做如下几件事： dataframe = data.frame( a = c("test1", "test2", "test3"), b = c(1,2,3) ) varnames = colnames(dataframe) head(dataframe$b) # second last line head(dataframe$varnames[2]) # last line 我的目标是最后两行给出相同的输出。基本上，我希望以某种方式使用变量名称中存储的值，并将其用作最后一行的输入(正如在最后一行中使用的那样)。

浏览 2提问于2020-08-07得票数 1

回答已采纳

1回答

R:从dataframe中移除单元

如何从R中的dataframe中的某些列中删除这些单元？我有一个dataframe (三行，三列)，如下所示： 1 mm apple 4 cm 11 mm car 8 cm 22 mm 3 3 cm 结果应该是： 1 apple 4 11 car 8 22 3 3

浏览 0提问于2016-10-08得票数 1

回答已采纳

1回答

数据帧中的R向量值

我有一个dataframe，并且想要添加一个新列，其中的值是向量。这在R中是可能的吗？谢谢,

浏览 2提问于2012-03-26得票数 3

回答已采纳

2回答

文本数据中每个类别中n个最频繁词的有效查找方法

、、

我试着优化下面的计算，因为如果不加减法，就很难在普通笔记本电脑上计算它(因为RAM)，这只是实际问题的例子。我需要指导如何加快速度。我认为我需要利用稀疏矩阵，因为这是典型的问题，但我不知道如何处理它没有熊猫。或者可能有一个帮助程序库，它被优化来执行类似的事情。如果不是的话，我正在考虑使用dask并行计算一些计算。示例数据： from sklearn.datasets import fetch_20newsgroups import pandas as pd import random data = fetch_20newsgroups(subset='train') d

浏览 4提问于2021-08-30得票数 1

2回答

如何将SPSS数据转换公式应用于多变量？

、、、

我是相对较新的R，并试图了解如何转换特定的列，其中包含日期，在一个大的数据，我从SPSS导入。604个变量中有241个是日期，R显示为1582-10-14的秒.我成功地使用as.Date函数转换了一个这样的列 dataframe$column.date <- as.Date(dataframe$column.date / 86400, origin = "1582-10-14") 我将如何将这个函数应用到我的dataframe中的这些特定的241 / 604列中，而不必编写240行额外的代码呢？

浏览 2提问于2019-12-20得票数 1

回答已采纳

2回答

R dataframe -折叠多个列为一个数字向量，逐行。

如果这是初级问题还是重复问题，我很抱歉。但我已经找了好几个小时了，没什么用。我想在一个dataframe (比方说100)中接受多个数字列，并将它们组合成一个数字向量，我可以将其存储在一个列中。我计划使用dplyr::transmute()函数来存储结果并删除原始的100列。然而，这不是问题所在。我的问题是让操作在dataframe中的每个行上迭代。简单地说，想象一下我正在使用mtcar dataframe： as.numeric(mtcars[x,2:8]) 会给我一个x行的数字向量，列2 (cyl)到8 (vs)，然后我可以将它存储在一个新列中。但是，如何在不键入32行数据帧的情

浏览 1提问于2016-09-02得票数 1

回答已采纳

2回答

带IF语句的条件舍入

、

我试图将数据帧中的数值舍入到最近的间隔。我想根据这个数字有多大，每隔一段不同的时间圈一圈。我从这个开始(来自于excel思维)，但是我不得不把它转换成R代码。注round_any将一个数字舍入到最近的间隔(例如5.13->5，5.85->6) library(plyr) DataFrame <- sapply(DataFrame, function(x) { if(x>1) round_any(x,0.25), if(x>5) round_any(x,0.5), if(x>10) round_any(x,1)

浏览 2提问于2018-05-11得票数 1

回答已采纳

1回答

如何按模式从数据中提取元素？

、、、、

我有一个dataframe dat，它有许多变量，如 "x_tp1_y" "g_tp1_z" "f_tp2_h" 我想提取包含"tp1"的元素。我已经试过了 grep("tp1", dat) grepl("tp1", dat) dat["tp1",] 我只想让R给我这个模式的元素，这样我就不必在dataframe dat中输入所有变量名了。如下所示：提取具有模式"tp1“R的元素的命令返回具有模式”tp1“的部分数据： x_tp1_y g_tp1_z

浏览 0提问于2019-07-13得票数 0

回答已采纳

1回答

将dataframe列类型从整数更改为因数

、、、

我在R中的代码有以下一些琐碎的任务： df$a<-factor(df$a,levels=c("3","2","1")) (级别的顺序在绘图中很重要，所以这很可能必须通过这样的任务来完成) 如何使用rpy2实现相同的结果？假设我的DataFrame是这样构造的： from rpy2 import robjects d = {'a': robjects.IntVector((1,2,3)), 'b': robjects.IntVector((4,5,6))} dataf = robjects.DataFra

浏览 2提问于2013-10-30得票数 1

回答已采纳

1回答

在指定特定条件的dataframe中，计算每列中的行数

我对R不太熟悉，所以我很抱歉，如果这看起来是个愚蠢的问题。基本上，我有一个100行和3列不同数据的数据。我也有一个向量，有3个阈值，每列一个。我想知道如何筛选出每个列的值，这些值都优于每个阈值的值。编辑: Sry对不完整的问题。因此，从本质上讲，我想要创建的是一个函数(它使用一个dataframe和一个treshold向量作为参数)，它将每个重持卡器应用到其各自的dataframe列中(因此，对于dataframe的每一列都有一个treshhold )。每个列中“尊重”它们的属性的元素的数量以后应该放在一个向量中。例如：列1: value= 1,2,3. Treshold =(仅值低于3)

浏览 2提问于2022-01-31得票数 -1

回答已采纳

1回答

如何在Julia中从单列DataFrame中提取column_name字符串和数据向量？

、

我能够使用正则表达式提取我想要的向量的列，但是现在我想从该DataFrame列中提取一个包含列名的字符串和一个包含数据的DataFrame。如何构建下面的f和g？其他方法也很受欢迎。 julia> df = DataFrame("x (in)" => 1:3, "y (°C)" => 4:6) 3×2 DataFrame Row │ x (in) y (°C) │ Int64 Int64 ─────┼──────────────── 1 │ 1 4 2 │ 2 5

浏览 28提问于2021-09-24得票数 2

回答已采纳

1回答

如何改变R中数据变量的n个结果数？

、、

这似乎是非常基本的，但我在R中还是新手，想办法在R中的dataframe variable中更改n really 值的数量。假设在mtcars dataset中，我想执行以下操作：将前20行mtcars$mpg值更改为NA 我使用了下面的scripts，但是它们当然没有用！ mtcars$mpg[, 1:20] <- NA 任何对解释的帮助都是非常感谢的。 Tnx

浏览 2提问于2017-02-27得票数 0

回答已采纳

3回答

用于选择(并返回)子数据的Rcpp函数。

、

是否可以编写一个C++函数，将R dataFrame作为输入，然后修改dataFrame (在我们的例子中是一个子集)并返回新的数据框架(在这个问题中，返回一个子数据)？下面的代码可能会让我的问题更加清楚：码 # Suppose I have the data frame below created in R: myDF = data.frame(id = rep(c(1,2), each = 5), alph = letters[1:10], mess = rnorm(10)) # Suppose I want to write a C++ function that gets id a

浏览 7提问于2014-04-03得票数 6

回答已采纳

1回答

在R中复制ewm pandas函数

我正在尝试在R中复制ewm python (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.ewm.html)函数，但没有成功。以下是python代码： import pandas as pd df = pd.DataFrame({'B': [0:100]}) df.ewm(span=100).std() 我不能在R中得到相同(或相似)的结果。

浏览 9提问于2021-01-17得票数 0

1回答

如何将数据分割为R中的if循环中的特定行数

我正在编写一个函数，在R中向我的客户发送电子邮件，我正在使用mailR包这样做，但是我的服务提供商只允许我每小时发送100封电子邮件。我想要做的是，如果我的电子邮件列表中包含270个电子邮件地址，我想将其泄漏到chunk1=100 , chunk2 = 100 & chunk3 = 70，那么它应该发送电子邮件到第一个区块，然后等待一个小时，然后是chunk2等等。这是我的功能看起来。 email <- function(dataframe,city,date){ dataframe$registrant_email <- tolower(dataframe$regi

浏览 1提问于2016-11-08得票数 1

回答已采纳

1回答

R中的For循环无法检索数据帧中的行数

、、、

我试图使用R中的for循环来获取数据格式中的行数。 year1<-c("2001","2002","2003") countries1<-c("Canada","USA","Mexico") color1<-c("black","red","blue") year2<-c("2010","2011","2012") countries2<-c("France"

浏览 1提问于2019-04-13得票数 1

回答已采纳

1回答

如果Dataframe和Excel文件具有相同的名称，则用于将Dataframe写入Excel文件的Python循环

、、

我有一个数据帧字典，我想将其导出到存储在特定目录中的单个excel文件中。我想设置一个python循环，它将把dataframe (作为新的工作表)导出到与dataframe同名的excel文件中，并遍历每个dataframe。这就是我到目前为止所知道的： multi_sheet_file = pd.ExcelFile(r'filename.xlsx') # Gets the sheet names in the file excel_sheet_names = multi_sheet_file.sheet_names dict_of_

浏览 21提问于2019-05-04得票数 0

1回答

仅在Pandas中将数字的字符串表示形式转换为数字

、、

我有一个熊猫Dataframe，当我的Dataframe列只有数字的字符串表示时，转换就会发生，否则就不会发生了。下面的代码用于将所有字符串形式的数字转换为数字。 import pandas as pd from functools import partial df = pd.DataFrame({0: ['3', 'r'], 1: ['1', 's']}) df = df.apply(partial(pd.to_numeric, errors='ignore')) 上面的代码将无法工作，因为'r

浏览 0提问于2018-09-09得票数 1

回答已采纳

1回答

从导入的dataframe行遍历向量。

、

我试着从R转换到c++编码。如果你选择否决这个问题，至少请给我一个答案，这样我就能学到一些东西。我的问题是，在c++中，当我传递了c++数据后，应该如何处理逐行计算？概念上，我理解一旦我传递给c++一个数据，c++将把每一列作为它自己的向量，我必须显式地命名它。在我遇到困难的地方是设置一个for循环来一次迭代所有向量的相同位置，从而在功能上模拟R中的逐行函数，我还想将这个问题扩展到以下应用程序：如何设置遍历行并返回向量的循环。就像R中的行数？在使用矩阵的高级R中有这样的一个例子，但是术语并不能从数据中转换成一堆向量。如何设置一个循环，循环遍历一行并更改每一行中的值，并返回修改过的向

浏览 0提问于2019-01-07得票数 1

回答已采纳

1回答

从R生成复杂的yaml

、、

我正在尝试使yaml格式的文件从R。我知道有一个包为这样的工作，但它的例子是如此简单，我的对象是有点棘手!！所以我想做一些像下面这样的东西，但是我不知道我应该如何将它塑造成R对象(dataframe?!)： tree: format: newick translate: ./My_example-1.translation file: ./Xtol_example-1.tree tracks: - class: colorstrip source: ./My_example-1.catdomain rel_height: 0.6 title: Cat

浏览 0提问于2011-06-16得票数 3

回答已采纳

1回答

转换模式DataFrame R

、

关于如何将data.frame的所有值从一种模式转换为另一种模式，已经提出了足够多的问题。这引发了以下问题:如何在R中转换data.frame的特定列？我有以下几点： # @param dataFrame the data.frame to be transformed # @param start the column which first needs to be rewritten to numeric data # @param end the column which needs to be rewritten to numeric data as last # @param exl

浏览 1提问于2015-03-11得票数 0

回答已采纳

1回答

DataFrame to LabeledPoint: df.collect()错误

、、、、

当我将我的DataFrame转换成LabeledPoint RDD时，我遇到了一个问题，他的错误困扰了我好几天。希望你们中的一些人能帮我解决这个问题。非常感谢! 我希望将DataFrame转换为RDDlabeledPoint，因为我需要训练随机森林模型。首先，我删除了所有具有空值的行： def na_drop(data: org.apache.spark.sql.DataFrame): org.apache.spark.sql.DataFrame = { return data.na.drop() } 这就是我将DataFrame转换为RDD的方法。 def to_labeledPo

浏览 0提问于2017-07-19得票数 0

回答已采纳

1回答

从名称向量创建向量并分配长度

、、

我有一个名字向量，像这样： sites <- paste("website", 1:10, sep = ".") 使用上面定义的向量中的名称，我想创建10个向量/变量，全部长度为nrow(dataframe)。为每个向量分配一个NA值。我理解如何使用assign为变量提供特定的值，但我似乎无法找到如何创建变量本身的简单答案。似乎是一个简单的问题，但我找不到一个直截了当的答案。所需的结果是十个名为dataframe$website.1....dataframe$website.10的变量，其长度为nrow(dataframe)。谢谢。

浏览 2提问于2018-01-14得票数 0

回答已采纳

2回答

Word2Vec向量大小与扫描单词总数的关系？

、、

如果唯一字的总数大于10亿，word2vec算法中设置的向量大小的最佳数量是多少？我使用的是用于word2vec的Apache Spark Mllib 1.6.0。示例代码:- public class Main { public static void main(String[] args) throws IOException { SparkConf conf = new SparkConf().setAppName("JavaWord2VecExample"); conf.setMaster("loc

浏览 1提问于2017-10-04得票数 5