无法删除dataframe中的列，%R_从R中的dataframe列中删除特定单词_从dataframe中删除列中的字符串"\r“ - 腾讯云开发者社区

python、pandas、csv、glob

我正在尝试将所有原始数据(csv文件)导入到一个DataFrame中，由于原始数据文件有一些无用的行，我喜欢通过"drop“删除它们，但是第一列的行是一个空白单元格。我无法删除它，而且dataframe无法识别该列。下面是我的代码： import pandas as pd import numpy as np import glob import os #Determine file path for index weighting files pathwgt=r'//10.27.36.181/etf/Bill/Quant/AxJ_Weight' filena

浏览 3提问于2017-09-29得票数 0

4回答

在Dataframe的整个列中应用Regex

python、python-3.x、pandas

我有一个有3列的Dataframe： id,name,team 101,kevin, marketing 102,scott,admin\n 103,peter,finance\n 我试图应用regex函数，以便删除不必要的空格。我已经得到了移除这些空格的代码，无论我如何都无法循环整个Dataframe。这就是我迄今尝试过的： df['team'] = re.sub(r'[\n\r]*','',df['team']) 但这会引发错误AttributeError: 'Series' object has no a

浏览 0提问于2018-12-28得票数 7

回答已采纳

1回答

熊猫-如何在另一个子集的基础上从一个子集中删除重复的

python、pandas、duplicates

我有两个子集，它们有相似的列，但它们共有的一个列是列A。我有左df L和右df R。我希望确保在L中看到的、也在df R中的列R的任何副本都从L (整个列)中删除。一个人会怎么做？ import pandas as pd L_df = pd.DataFrame({'A': ['bob/is/cool', 'alice/is/cool', 'jim/is/cool'], 'view': ['A', 'B', 'B']}) R

浏览 10提问于2021-12-21得票数 0

回答已采纳

1回答

在Dataframe列中创建列表，该列是来自其他两个数据帧列的一系列值。

python、pandas、dataframe

我需要在dataframe列中创建一个列表，这是一个数字范围。范围限制应该是其他两个数据帧列中的值。 df = pd.DataFrame({'A': [3, 7, 2, 8], 'B': [1, 3, 9, 3]},index=[1,2,3,4]) 现在需要一个dataframe列，它将是一系列的列表，如下所示 [1,2,3] [3,4,5,6,7] [2,3,4,5,6,7,8,9] [3,4,5,6,7,8] 我可以以这种方式在dataframe列中创建一个列表。 df['C'] = (df[['A','B']

浏览 0提问于2022-06-18得票数 0

2回答

这是把一列放在R中的正确方法吗？

这是从R中的数据中删除列的正确方法吗？还是有更好的办法？ dataframe$column <- NULL

浏览 0提问于2019-01-13得票数 2

回答已采纳

2回答

Rcpp::DataFrame -查找列类型

r、rcpp

在我可以找到的所有Rcpp示例中，必须知道DataFrame列的类型，然后才能将列提取到向量中，例如： // construct the data.frame object Rcpp::DataFrame DF = Rcpp::DataFrame(Dsexp); // and access each column by name Rcpp::IntegerVector a = DF["a"]; Rcpp::CharacterVector b = DF["b"]; Rcpp::DateVector c = DF["c"]; 在R中，可以使用sapp

浏览 3提问于2015-11-09得票数 2

回答已采纳

2回答

无法识别导入到dataframe对象的csv

python、csv、pandas

我已经从一个文件夹导入了多个csv文件。首先，我创建了文件夹中所有csv文件的列表，然后将列表的长度提供给我的函数。 csv文件具有不同列长度的行，因此我认为必须使用readline。问题是，当我尝试过滤DataFrame时，无法识别这些值。我将其保存到sqlite表中，并将其放入R和一个类似于"H“的值中。在r- "\"H\"“中显示如下我如何防止这些额外的字符被添加到我的对象"H“ 还是我还有其他问题？ x = [] count = 0 while (count < len(filelist) ): for file in f

浏览 3提问于2014-11-15得票数 0

1回答

在数据帧中使用文件名作为列标题

python、excel、pandas、dataframe

我有多个excel文件，我需要将所有这些文件中的一列整理成一个dataframe。我使用了以下代码： my_excel_files = glob.glob(r"C:\Users\......\Documents\*.xlsx") total_dataframe = pd.DataFrame() for file in my_excel_files: df = pd.read_excel(file, header = 1) new_df = df['Comments'] total_dataframe = pd.concat([to

浏览 1提问于2020-08-14得票数 1

回答已采纳

1回答

R:从dataframe中移除单元

如何从R中的dataframe中的某些列中删除这些单元？我有一个dataframe (三行，三列)，如下所示： 1 mm apple 4 cm 11 mm car 8 cm 22 mm 3 3 cm 结果应该是： 1 apple 4 11 car 8 22 3 3

浏览 0提问于2016-10-08得票数 1

回答已采纳

1回答

熊猫按一栏进行汇总，并对其他栏随机取行。

python、pandas、aggregate

我有一个要求，我想按熊猫数据栏中的一列进行分组，并对其他列采取任何随机行。例如，dataframe可以是： df=pd.DataFrame({'a':['p','q','r','r'],'b':[1,2,3,4],'c':['l','m','n','o']}) Out[82]: a b c 0 p 1 l 1 q 2 m 2 r 3 n 3 r 4 o 以及我所需要的产出(一种可能性)：

浏览 3提问于2020-12-16得票数 0

回答已采纳

1回答

比较左文件夹中的列值

scala、apache-spark、apache-spark-sql

我正在尝试将DataFrame中的列汇总到一个新列中，该列将被添加到dataframe本身。这是DataFrame val input = sc.parallelize(Seq( ("r1", 1, 1), ("r2", 6, 4), ("r3", 4, 1), ("r4", 1, 2) )).toDF("ID", "a", "b") 我只想在"a“和"b”中添加一列“one”，其中包含1的计数。这是我想出来的Scala代码，不幸的是，它对任何一行

浏览 10提问于2018-01-10得票数 1

回答已采纳

2回答

Python:通过独特的组合连接两个DataFrames的最简单方法？

python、pandas、dataframe、join、spyder

我有两个DataFrames： fuels = pd.DataFrame({'Fuel_Type':['Gasoline', 'Diesel', 'E85']}) years = pd.DataFrame() years['Year_Model'] = range(2012, 2041) 我想要的输出是一个新的DataFrame，它将这两个数据格式合并为两列，但是对于“年份”中的每个值，对于“燃料”中的每一种独特的燃料类型都重复使用。换句话说，每一年应该重复三次，每种燃料一次。我可以非常简单地在R中这样做：

浏览 4提问于2020-09-24得票数 0

回答已采纳

3回答

如何在熊猫数据中添加基于行条件的新列？

python、pandas、dataframe

我想要添加基于行条件的新列，它基于同一数据same的两个不同列。我在Dataframe下面- df1_data = {'e_id': {0:'101',1:'',2:'103',3:'',4:'105',5:'',6:''}, 'r_id': {0:'',1:'502',2:'',3:'504',4:'',5:'506',6:'&#

浏览 4提问于2017-05-03得票数 1

回答已采纳

1回答

根据列值删除R中的行

在R中有一个dataframe，我想删除该dataframe中列X的值大于100%的所有行。做这件事最好的方法是什么？感谢你的帮助。

浏览 5提问于2013-03-08得票数 2

2回答

熊猫数据自动填充

python、pandas、dataframe

我是Python的新手，我试着做以下工作：我有一个带有tweet的单列数据格式(每行包含一个tweet字符串) 我可以用df[row].split()来分割任何推特的文字但是，我无法找到如何在其中创建pd.DataFrame：它的行将是单词它的列将是tweet 我试着填充我的数据，就像我在早期的R脚本中所做的那样，但是它不起作用。 for x in range(0, len(tweets)): words[,x] = pd.DataFrame(data=tweets[x].split()) 我发现[,]在数据格式中的操作与R不同，但我甚至无法找

浏览 1提问于2018-05-11得票数 0

6回答

从dataframe中删除最后5列，而不知道具体数字

r、dataframe

我有一个dataframe，它由一个具有不断变化的列数的for-循环创建。在另一个函数中，我希望删除最后五列。带有dataframe长度的变量是“单位”，它的数字介于10到150之间。我试过使用列的名称来删除，但它不起作用。(一旦我试图打开“新帧”R演播室崩溃，查看我的框架是没有问题的)。 drops <- c("name1","name2","name3","name4","name5") newframe <- results[,!(names(myframe) %in% drops)] 有没

浏览 5提问于2014-10-21得票数 12

回答已采纳

1回答

仅在Pandas中将数字的字符串表示形式转换为数字

python、pandas、dataframe

我有一个熊猫Dataframe，当我的Dataframe列只有数字的字符串表示时，转换就会发生，否则就不会发生了。下面的代码用于将所有字符串形式的数字转换为数字。 import pandas as pd from functools import partial df = pd.DataFrame({0: ['3', 'r'], 1: ['1', 's']}) df = df.apply(partial(pd.to_numeric, errors='ignore')) 上面的代码将无法工作，因为'r

浏览 0提问于2018-09-09得票数 1

回答已采纳

1回答

如何在Python中根据列名、类型和统计数据(如std )删除2列或更多列？

python、pandas、sklearn-pandas

我尝试删除所有包含k1和p5的列，并创建一个不包含这些列的新DataFrame，但我得到了一个错误。 df_r1 = df.filter(regex=("k1\s")) #filter all k1 columns df_r2 = df.filter(regex=("p5\s")) #filter all p5 columns df_dropped_new = df.drop((df_r1,df_r2),axis = 1) 上面的代码行显示了下面的错误 DataFrame' objects are mutable, thus they cannot

浏览 20提问于2018-01-24得票数 1

回答已采纳

1回答

R:难以为数据文件中的动态变量赋值

r、dataframe、variable-assignment

我试图为用户定义的dataframe变量赋值。用户在dataframe中指定变量的名称，让我们调用这个x。为了简单起见，我希望为用户指定的列中的所有内容赋值3。简化的代码是： variableName <- paste("df$", x, sep="") eval(parse(text=variableName)) <- 3 但我发现了一个错误：文件中的错误(文件名，"r")：无法打开连接此外:警告信息：在文件(文件名，"r")中:无法打开文件'df$x'：没有这样的文件或目录我试过各种

浏览 0提问于2018-01-25得票数 1

2回答

python数据写入R数据格式

python、r、pandas、dataframe

我有一个问题要写一个数据格式给R。我有1000列X 77行数据。我想把这个数据写到R数据中。当我使用 r_dataframe = com.convert_to_r_dataframe(df) 它给了我一个错误，比如dataframe对象没有艺术品类型。当我看到com.convert_to_r_dataframe()的代码时。它只获取dataframe的列，并得到colunm.dtype.type。在这个时候，列是dataframe，我认为大列dataframe里面有数据吗？有人想办法解决这个问题吗？

浏览 9提问于2017-03-27得票数 8

回答已采纳

3回答

将python pandas DataFrame转换为R dataframe以便与rpy2一起使用时出现问题

python、r、dataframe、pandas、rpy2

我在使用rpy2将Python语言中的pandas DataFrame转换为R对象时遇到了问题。新的pandas版本0.8.0 (几周前发布)具有将pandas DataFrames转换为R DataFrames的功能。问题出在转换我的pandas DataFrame的第一列时，它由python datetime对象组成(按时间序列连续)。转换为R dataframe将返回日期和时间的向量，而不是我认为称为"POSIXct“对象的R StrVector类型对象的向量。我知道将返回类型的字符串转换为POSIXct的命令，使用命令"as.POSIXct('yyyy-mm

浏览 6提问于2012-07-17得票数 7

回答已采纳

2回答

pandas等同于R的cbind (垂直连接/堆叠向量)

python-3.x、pandas、concat、cbind

假设我有两个数据帧： import pandas .... .... test1 = pandas.DataFrame([1,2,3,4,5]) .... .... test2 = pandas.DataFrame([4,2,1,3,7]) .... 我尝试过test1.append(test2)，但它相当于R的rbind。如何将这两列合并为数据帧的两列，类似于R中的cbind函数？

浏览 4提问于2015-02-19得票数 45

回答已采纳

2回答

R中的Rbind和merge

r、list、dataframe、merge、rbind

所以我有一个很大的数据帧列表，其中一些有匹配的列，而另一些没有。我希望重新绑定具有匹配列的变量，并合并其他没有匹配列的变量(基于变量Year、Country)。但是，我不想手动遍历所有数据帧来查看哪些有匹配的列，哪些没有匹配的列。现在我在想，它应该看起来像这样： myfiles = list.files(pattern="*.dta") dflist <- lapply(myfiles, read.dta13) for (i in 1:length(dflist)){ if colnames match put them in list and rbin

浏览 11提问于2016-07-15得票数 1

2回答

Python熊猫dataframe :在数组列中，如果第一项包含特定字符串，则从数组中删除该项。

python、arrays、python-3.x、pandas、dataframe

我有一个dataframe，它有一些列，如下所示，其中包含不同大小的数组： column ["a_id","b","c","d"] ["d_ID","e","f"] ["h","i","j","k","l"] ["id_m","n","o","p"] ["ID_q","r","s"] 如果第一项

浏览 5提问于2017-11-08得票数 1

回答已采纳

1回答

如何在R中将一列拆分为两列

r、ggplot2、data-science

我在R中有一个dataframe，它包含一个带有位置坐标的列。问题是列条目的格式是long，lat格式(例如- 71.22,29.88)，我试图将这一列分成两列-一列只包含经度信息，另一列仅包含纬度信息。另外，一些列条目是0,0，所以我想去掉它们。有没有办法在R中完成所有这些工作？我尝试使用for循环，迭代列，并使用regex检查正确的格式，但这不是很有效，谢谢!

浏览 62提问于2020-01-25得票数 1

回答已采纳

2回答

将Dataframe转换为scala可变映射不会产生相同数量的记录

scala、dictionary、apache-spark、dataframe、collections

我对Scala很陌生。我正在开发Scala/Spark应用程序，该应用程序从一个单元表中选择几个列，然后将其转换为一个可变的映射，其中第一列为键，第二列为值。例如： +--------+--+ | c1 |c2| +--------+--+ |Newyork |1 | | LA |0 | |Chicago |1 | +--------+--+ 将转换为Scala.mutable.Map(Newyork -> 1, LA -> 0, Chicago -> 1) 下面是我进行上述转换的代码： val testDF = hiveContext.sql("

浏览 3提问于2017-10-28得票数 0

回答已采纳

2回答

无法从Pandas dataframe中的列中提取非数字值。

python、pandas

我正致力于清理和EDA的时间序列数据集的收入。对于某些条目，值以‘(R)’作为前缀，意思是该值已被修改，并显示为(R) 1000。示例： df = pd.DataFrame({ 'year': ['2005', '2006', '2007'], 'revenue': [500, (R) 1000, 2200]}) 奇怪的是，该列的数据类型仍然显示为float64，并在编译行图时工作。在原始Excel电子表格中，当要突出显示特定单元格时，(R)将消失，只显示数值。我制定了如下工作代码： df[&#

浏览 2提问于2022-08-16得票数 0

1回答

如何在Json文件中添加和删除列，然后将其保存到csv中

python、json、dataframe、csv、multiple-columns

我曾尝试使用dataframe将列和值添加到json文件中，但似乎在我尝试删除一些列之后，它会返回到原始数据文件。我还面临着无法将其保存到csv文件中的问题。所以想知道也许我不能使用dataframe来做这件事？它就像一个列表，分成不同的列(总共大约30行)，但是我想删除一些，比如路由和urls，同时添加三列长度，maxcal，mincal (这三列中的所有值都在路由列中) 到目前为止，我已经做到了这一点，并被卡住了： import pandas as pd import json data = pd.read_json('fitness.json') # fitness

浏览 10提问于2021-09-16得票数 0

回答已采纳

1回答

有一个pandas函数可以通过多值比较来过滤DataFrame吗？

python、pandas、function、dataframe

我有一个两个pd DataFrames，我想通过检查另一个dataFrame的同一行中是否存在多个列的值来过滤其中一个。示例DataFrame1： CHROM POS ALT Col4 r1 X 22 A 4 r2 1 43 T 6 r3 3 100 C 7 r4 15 22 A 13 DataFrame 2： ALT chrom Col3 Col4 start r1 A X 25 26 22 r2 A 1 18 19 2

浏览 0提问于2020-10-31得票数 1

1回答

用Matplotlib绘图具有空格的Julia DataFrame列

dataframe、matplotlib、julia、compatibility、removing-whitespace

我有DataFrames，它们的列名中有空格，因为它们从CSV文件中生成的名称中也有空格。DataFrames是用行生成的 csvnames::Array{String,1} = filter(x -> endswith(x, ".csv"), readdir(CSV_DIR)) dfs::Dict{String, DataFrame} = Dict( csvnames[i] => CSV.File(CSV_DIR * csvnames[i]) |> DataFrame for i in 1:length(csvnames)) DataFrames有列名，如“

浏览 0提问于2019-03-28得票数 0

回答已采纳

3回答

从整个数据框中移除字符

r、dataframe

我有一个包含多个列的dataframe，一些列中的一些数据包含双引号，我想删除这些，例如： ID name value1 value2 "1 x a,"b,"c x" "2 y d,"r" z" 我想让它看起来像这样： ID name value1 value2 1 x a,b,c x 2 y d,r z

浏览 0提问于2015-09-30得票数 12

回答已采纳

1回答

如何从循环中的第一列减去第一列之后的列？

python、pandas、dataframe、loops、calculated-columns

这看起来很简单，但我似乎无法找到一种有效的方法来解决Python 3中的这个问题:在我的dataframe中是否有一个循环可以将第一列之后的每一列从第一列中减去，这样我就可以将新的减法列添加到新的dataframe中了吗？然后，我想从第二列中减去第二列之后的每一列，并在18列中遵循相同的逻辑，将新的减法列添加到新的dataframe中。下面是我对dataframe (spotrates)使用的第1列和第2列的前4行代码，但我有18列，我知道创建循环会更容易，当我希望将减法列插入到新的列时，我将添加到现有dataframe的末尾。 spotrates['3m-on'] = s

浏览 9提问于2022-01-05得票数 0

4回答

基于单列值的DataFrame重构

r、csv、dataframe

我试图根据多个现有值将数据从一列移动到另一列。我研究并为单个列找到了一个简单的解决方案--如下面的当前代码所示。但是，我想找一种方法来处理所有的行。我一直在研究一种方法，但似乎无法找到将一个可能的循环应用于此函数的方法。任何帮助都会很好。我使用的是最新版本的R和RStudio。谢谢! 当前DATAFRAME： Row #People A 3 A 2 A 2 B 1 B 1 C 3 C 3 C 2 C 1 期望的DataFrame： Row: A B C 3 1 3 2 1 3 2 2 1 现行法典： fil

浏览 5提问于2017-10-17得票数 1

回答已采纳

1回答

从dataframe中删除所有值均为NA、NULL或空的列

r、dataframe

我有一个dataframe，其中一些值为空或空。我希望删除这些列，在这些列中，所有值都是空的或空的。列应从dataframe中删除，不要仅隐藏。我的头看起来像data= VAR1 VAR2 VAR3 VAR4 VAR5 VAR6 VAR7 1 2R+ 52 1.05 0 0 30 2 2R+ 169 1.02 0 0 40 3 2R+ 83 NA 0 0 40 4 2R+ 98 1.16 0 0

浏览 3提问于2017-01-27得票数 5

回答已采纳

2回答

是否将ColumnTransformer()结果附加到管道中的原始数据？

python、pandas、scikit-learn、pipeline

这是我的输入数据： ? 这是对列r、f和m应用变换的所需输出，并将结果追加到原始数据 ? 代码如下： import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.compose import ColumnTransformer from sklearn.preprocessing import PowerTransformer df = pd.DataFrame(np.random.randint(0,100,size

浏览 42提问于2019-02-08得票数 4

1回答

熊猫在阅读CSV时重命名专栏

python、pandas、io

我在一个文件夹中有多个文本文件，而不是输出到一个表中。我成功地将表导出到一个.csv文件。问题是，我想要向每个列添加一个标题，并且我希望标题的名称是文本文件的名称。每个文件都是表中的一列数据。例如，列1来自textfile.1。我想在列1中添加一个标头，上面写着"textfile.1" 这是我的工作代码： import os path = r'C:/path/to/file' folders = os.listdir(path) #raw string import pandas as pd df = pd.DataFrame() df_interim =

浏览 1提问于2020-07-09得票数 3

回答已采纳

1回答

如何在熊猫中丢弃数据？

python、pandas、dataframe

根据某些条件，提示可以删除列和行。但我想放弃熊猫创造的全部数据。类似于R: rm(dataframe)或SQL: drop 这将有助于释放内存利用率。

浏览 2提问于2015-06-04得票数 2

回答已采纳

3回答

熊猫:移除任何顺序存在的复制品

python、pandas

我的问题类似于，但我还有一个额外的要求。我需要维护行值对。例如：我有data，其中A列对应于列C，列B对应于列D。 import pandas as pd # Initial data frame data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50], 'B': [50, 22, 35, 5, 10, 11, 21, 0], 'C': ["a", "b", "

浏览 0提问于2018-07-30得票数 4

回答已采纳

1回答

写入单元格时发生openpyxl值错误

python、openpyxl、valueerror

我正在尝试通过openpyxl将我的dataframe列的和写到一个单元格中我的代码是： worksheet.cell(row=row, column=col+1).value = data 引起的值错误是：引发ValueError(“无法将{0!r}转换为Excel”.format(值)) ValueError:无法将数组( 1427.09609)转换为Excel

浏览 1提问于2017-07-18得票数 0

回答已采纳

1回答

read_csv()：列包含数据，但被读取为字符串

python、python-3.x、pandas、dataframe

我有一个熊猫数据表(df1)，由56行9列组成，每单元格中有一列“矩阵”(df2)。保存并加载此df1将df2转换为字符串。然而，我需要这是一个数据。我遇到了几种解决方案(见下文)，但似乎无法将这些解决方案应用到我的情况中，因为我有一个包含dataframe的dataframe。 df2由两列组成(“平均值”、“SD”)，每一行由95k行组成(下面的示例(它们不是全部为0 ;))。我的直觉是，从一开始，我的方法本身就不太理想。有人能把我推到正确的方向吗？ ‘平均SD\r\n0.00 0.000000\r\n1 0.00 0.000000\r\n2 0.00 0.000

浏览 3提问于2020-01-18得票数 1

回答已采纳

3回答

循环遍历R中的列

r、statistics、loops

我正在使用R's stats包，并希望在all the rows of a dataframe中遍历column[x]，使用函数对列中的each cell中的数据进行操作，并将结果传递给一个新列( new column中的calculated result与column[x]中的数据对齐)。我有两个问题： --我无法让它开始工作--在我读过的R articles中，循环似乎是不鼓励的。是否有其他方法可供选择，如果没有，是否有关于如何执行循环的示例？

浏览 4提问于2009-10-25得票数 8

2回答

使用字典列表值选择熊猫数据栏

python、python-3.x、pandas、dataframe

我在字典中有列名，并希望从dataframe中选择这些列。在下面的示例中，如何选择字典值'b‘、'c’并将其保存到df1中？ import pandas as pd ds = {'cols': ['b', 'c']} d = {'a': [2, 3], 'b': [3, 4], 'c': [4, 5]} df_in = pd.DataFrame(data=d) print(ds) print(df_in) df_out = df_in[[ds['cols']]] p

浏览 0提问于2018-04-08得票数 1

回答已采纳

2回答

星星之火:匹配两个数据格式中的列

apache-spark、dataframe、apache-spark-sql

我有如下格式的数据 +---+---+------+---+ | sp|sp2|colour|sp3| +---+---+------+---+ | 0| 1| 1| 0| | 1| 0| 0| 1| | 0| 0| 1| 0| +---+---+------+---+ 另一个dataframe包含第一个dataframe中每个列的系数。例如 +------+------+---------+------+ | CE_sp|CE_sp2|CE_colour|CE_sp3| +------+------+---------+------+ | 0.94

浏览 2提问于2016-04-14得票数 3

回答已采纳

1回答

在R中跨多个数据格式的类SQL查询

我已经在Access DB中安装并运行了这个程序，但是我很难将它转换为R。 Dataframe A： ID, B1, B2, B3, group 1, 0.2, 0.4, 1000, red ... 4447, 0.4, 0.32, 800, blue Dataframe B( Dataframe A中列的平均数，基于列“group”)： ID, group, meanB1, meanB2, meanB3 1, red, 0.45, 0.313, 990.32 ... 6, blue, 0.39, 0.289, 790.54 还有第三个Dataframe C，它是Dataframe A中列的标

浏览 3提问于2013-08-16得票数 0

回答已采纳

2回答

在r中创建一个基于其他列的自动增量的列。

我的数据框架有customerID，产品和日期。我需要创建一个列，在每次customerID或日期更改时生成一个事务id。我的dataframe当前看起来如下：客户date产品-日期 23？ 23 18？ 52？ 23？我需要使用r填充transactionID列 23？ 23？ 18 52？ 23？我把数据保存在csv文件中。我无法在excel中创建此列，因为文件太大，excel无法打开整个文件。谢谢你的帮助!

浏览 1提问于2014-12-18得票数 3

1回答

如何将过滤的子集保存在新列的R中？

r、filter、data-manipulation、dplyr

我有一个很大的dataframe，我想根据一些列(所有因素)进行过滤，并将过滤过的行保存为同一个dataframe中的一个新列。因此，我不想创建子集或删除行，我希望将它们保留在同一个dataframe中。示例： ## my dataframe: test <- data.frame(name=c("alice", "brandon", "cedric", "dwayne"), mark = c("V", "R", "R", "R"), test3 = c(&#

浏览 2提问于2019-08-11得票数 0

回答已采纳

1回答

从Python (to_sql)插入数据到Server的问题

python、sql-server、pandas、pandas-to-sql

我对符号#有一些问题。列中的某些数据包含符号#，例如 'JRE#150' 'July banner #150' 当我将数据从文件all.csv插入Server时，包含此字符的记录将无法正确插入表中。我什么意思？！如果我尝试插入这个值'JRE#150'，只存储这个部分'JRE‘，将NULL插入到其他列中。流程的外观和我正在做的事情：是第一个独立的引擎，它将all.csv文件从API发送给DataFrame。下面一行负责将此数据导入文件。 .csv是： Df.to_csv(r‘C：\\all.csv’，编码=‘utf-8’，i

浏览 4提问于2021-09-15得票数 1

2回答

R dataframe -折叠多个列为一个数字向量，逐行。

如果这是初级问题还是重复问题，我很抱歉。但我已经找了好几个小时了，没什么用。我想在一个dataframe (比方说100)中接受多个数字列，并将它们组合成一个数字向量，我可以将其存储在一个列中。我计划使用dplyr::transmute()函数来存储结果并删除原始的100列。然而，这不是问题所在。我的问题是让操作在dataframe中的每个行上迭代。简单地说，想象一下我正在使用mtcar dataframe： as.numeric(mtcars[x,2:8]) 会给我一个x行的数字向量，列2 (cyl)到8 (vs)，然后我可以将它存储在一个新列中。但是，如何在不键入32行数据帧的情

浏览 1提问于2016-09-02得票数 1

回答已采纳

3回答

如何根据R中的另一个数据框重命名数据框的所有列？

我对R非常陌生，我正在尝试根据另一个数据帧来重命名一个数据框的列。基本上，我的数据看起来像这样 DataFrame1 A B C D 1 2 3 4 我还有另一张表，看起来像这样‘DataFrame2 Col1 Col2 A E B Q C R D Z 我想根据这个表重命名我的第一个数据框的列，这样它就会显示出来： E Q R Z 1 2 3 4 我正在尝试使用plyr库进行循环。这是我尝试过的命令： library(plyr) for (i in names(DataF

浏览 23提问于2016-07-28得票数 8

回答已采纳

1回答