将n路列联表转换为R中的数据帧_如何将R中的数据帧转换为列联表？_如何为R中的GLM将列联表(计数)转换为个体 - 腾讯云开发者社区

python、pandas、dataframe、crosstab、contingency

浏览 24提问于2021-01-03得票数 0

回答已采纳

1回答

在Python中添加两个偶联表

python、pandas、data-structures

我正在构建一个推荐系统，我正在为该系统构建一个联想表，以了解产品之间的关联。我的权变表如下所示，比方说Tble-1： a b c d a 2 1 1 1 b 1 2 2 0 c 1 2 2 0 d 1 0 0 1 这是一个熊猫数据帧。由于我正在处理流数据，因此每当我获得新数据时，我都需要更新此列联表。假设我得到了新的列联表，比方说表2： a b c e a 2 1 1 4 b 1 1 2 0 c 1 2 4 2 e 1 3 0 4 我需要添加两个联想表，即Table-1 + Table-2，其结

浏览 13提问于2019-03-13得票数 1

回答已采纳

1回答

Spark:合并两个数据帧

apache-spark、dataframe、pyspark

用一个例子来解释我的问题。 table_name col1 col2 col3 1 aaa xxx 1 bba yyy 2 ccc yyy 我希望我的最终输出是这样的： table_name col1 col2 col3 1 aab xxx 1 bbc yyy 2 cc yyy 我有一个有3列(没有主键)的表，我必须更改这3列中的第2列中的数据，现在我想用这个新的第2列替换旧的列。 df1 = hc.sql("select col1 from table_name") df2 = hc.sql("sele

浏览 0提问于2017-10-09得票数 0

1回答

如何基于2列合并R上的2个数据帧？

r、dataframe、merge、sas、merging-data

我希望基于R中的2列合并2个数据帧，这两个数据帧称为popr和data列，它们共享相同的2个变量: USUBJID和TRTAG2N，这两个变量是我想要组合这两个数据帧的变量。当我只尝试根据一列进行合并时，合并函数就能工作： merged <- merge(popr,droppedcol,by="USUBJID") 当我试图通过使用2列合并并查看数据框架“工期”时，表是空的，没有值，只有列标题。它说“表中没有可用的数据”。我的任务是在R中复制SAS代码： data duration; set pop combined1 ; by usubjid trtag2n;

浏览 1提问于2019-07-09得票数 2

回答已采纳

2回答

表格列表的xtable输出

r、sweave、xtable

我有一个表的列表，并希望将其用于LaTex输出。代码如下： Data <- esoph[ , 1:3] library(plyr) combos <- combn(ncol(Data),2) TabelFn <- function(x) { Table <- addmargins(table(Data[, x[1]], Data[, x[2]])) return(Table) } Table <- alply(.data=combos, .margins=2, .fun=TabelFn, .expand=TRUE) library(xtable)

浏览 3提问于2011-09-15得票数 2

回答已采纳

1回答

R:混合数据类型的数据帧的类型转换

r、dataframe、type-conversion

我一般都喜欢R，但是类型转换的问题让我发疯了。下列问题：我从数据库连接中读取数据帧。结果是一个带有字符列的数据帧。我知道第一列是日期格式，其他的都是数字格式。然而，无论我如何尝试将数据帧的字符列转换为正确的类型，它都没有成功。当将数据帧转换为矩阵，然后返回到数据框架时，所有列都变成了类型因子--而将因素转换为数字生成了错误的结果，这导致了因子级别的指标被转换而不是实际值。此外，如果表的大小很大-我不想手动转换每一列。难道没有办法自动完成这件事吗？

浏览 1提问于2016-08-12得票数 1

回答已采纳

2回答

合并成一行后，合并重复行并删除所有重复行

python、pandas、dataframe、data-cleaning

我有一个具有多个重复I的pandas数据帧，如下所示： id col1 col2 col3 ENE80R N N Y ENE80R N N N ENE80R Y N N 我想要实现的是： id col1 col2 col3 ENE80R Y

浏览 20提问于2018-01-08得票数 0

回答已采纳

2回答

如何查找频率表键列是否包含列表中的所有值

python、pandas、missing-data

我有一个数据帧，并且我正在对一列进行频率表计数。我想要搜索表中的key列是否包含此列表ls = ['Agree', 'Disagree', 'Neutral', 'N/A']中的所有值，如果列key缺少列表中的某些值，我想将缺少的值添加到该列中，并将其count设为0。这是在计算频率表时可以执行的东西吗？例如，我已经在这里使用value_counts计算了我的频率表，并将其转换为数据帧。 # df key count Agree 22 Disagree 30 Neutral 12 预期输出

浏览 12提问于2019-11-16得票数 2

回答已采纳

3回答

在LaTeX格式的联想表的行和列标题中包括维度名称

r、xtable

如果列联表中的属性类别仅仅是数字，那么仅使用这些数字作为列/行标题是不够的--这是对数字含义的描述。下图显示了家庭规模与家庭样本中外国人数量的交叉分类：有没有人有使用R+LaTeX制作这样的表格的经验？

浏览 3提问于2012-05-22得票数 11

回答已采纳

1回答

Qt中具有单一模型的表视图和列表视图

qt、model、view

我有一个2D模型，其中每行表示视频中的一帧，每列表示一个对象。对象可以在每个帧上具有不同的状态，这存储在模型中。然后我有一个QTableView来显示这些数据。该模型具有标头数据，因此每行都有一个类似"frame k“的标头，每列都有一个类似"object n”的标头。此表是可编辑的。但我希望用户以另一种方式编辑它。另一种方式是显示单个帧的图形视图。图形视图下方是表示每个帧的列表(水平方向)。这样，用户可以单击列表中的框架，图形视图现在将显示该框架。问题是该列表显示模型中每行的第一列。我想要它做的是显示每一行的标题(所以列表显示“帧1，帧2，等等”)。有没有办法做到这一点？

浏览 3提问于2008-09-19得票数 1

回答已采纳

1回答

如何将MySQL转储文件转换为数据帧

我目前正在处理MySQL转储到Python dataframe。转储位于一个存储帐户上，可以通过Databricks中的挂载点进行访问。没有可用于MySQL实例的数据库连接。互联网上的所有示例都集中在与MySQL数据库的连接上。我的环境是Azure Databricks with Python。因此，像here这样的在线脚本不起作用，因为该脚本专注于本地环境，而不是存储在数据帧(笔记本电脑、PC)中。我被困在为SQL插入创建数据帧的过程中。并专门为具有相同名称的所有表创建数据帧，例如XX (见下文)。我可以使用以下命令打开该文件： fd = open(source, 'r

浏览 7提问于2021-11-12得票数 0

1回答

R数据类型到MonetDB数据类型

r、monetdb、monetdblite

我试图使用MonetDB驱动程序使用DBI::dbWriteTable()将数据帧插入到MonetDBLite中，并且必须调整MonetDB表和R数据帧中的列类型。我想知道是否存在从R到MonetDB的数据类型映射。例如，我知道(或者假设)R中的character向量应该映射到CHAR(n), CHARACTER(n), VARCHAR(n), CHARACTER VARYING(n), TEXT, CLOB, CHARACTER LARGE OBJECT的MonetDB列，或者STRING和back。这方面有任何官方文件吗？谷歌没有打开任何东西。

浏览 3提问于2018-01-06得票数 1

回答已采纳

2回答

从R脚本插入Server列

sql、sql-server、r、tsql、binary-data

我有一个plots表，其列包括plot，它存储图像文件的二进制数据。我正在运行一个the查询，它调用一个R脚本，并获得要插入的数据框架。数据框架如下所示： plot name date_from date_to 1 ABCDEF plot1 2016-08-25 2016-08-31 2 AAAAAA plot2 2016-08-25 2016-08-31 如您所见，“绘图”列已经包含原始数据。为了澄清，我要做的是用数据帧中的数据将两行插入到数据库中(数据帧列名与数据库列相匹配)。我遇到的问题 INSERT INTO dbo.plots EXEC

浏览 6提问于2016-09-01得票数 0

回答已采纳

1回答

比较两个数据帧的列联表

以下是原始数据帧： set.seed(100) toydata <- data.frame(A = sample(1:50,50,replace = T), B = sample(1:50,50,replace = T), C = sample(1:50,50,replace = T) ) 下面是可以交换数值的函数： derangement <- function(x){ if(max(table(x)) > length(x)/2) return(NA) while(TRUE)

浏览 1提问于2018-08-11得票数 1

回答已采纳

2回答

从R中较大的列联表推导出列联表

r、contingency

我有一个由python语言制作的csv格式应急表，如下所示： case control disease_A 20 30 disease_B 35 45 disease_C 42 52 disease_D 52 62 现在，我想从这个列联表中推导出2x2列联表，以便使用R来计算卡方值。如何从上面的应急表导出2x2表，如下所示： case control disease_A 20 30 disease_D 52 62 这可能是个新手的问题，但我对R并不熟悉，我在其他地方

浏览 0提问于2014-08-07得票数 0

回答已采纳

1回答

pandas数据帧行使用sklearn进行缩放

python、python-3.x、dataframe、scikit-learn

如何将sklearn缩放器应用于pandas数据帧的所有行。这个问题与相关。如何将sklearn缩放器应用于一行的所有值？注意:我知道对于特性缩放来说，在列中包含特性和按列缩放特性是很正常的，就像refenced问题中那样。然而，我想使用sklearn标度器来预处理可视化数据，在我的例子中，按行扩展是合理的。

浏览 11提问于2019-11-13得票数 1

回答已采纳

1回答

Rcpp:在Rcpp中使用数据帧时推荐的代码结构(内联)

c++、r、data-structures、dataframe、rcpp

我把这写成其他地方的评论，但我决定提出一个合适的问题. 在Rcpp中使用数据帧时，在代码结构方面，目前认为什么是“最佳实践”？从R到C++代码的输入数据框架可以很容易地“传输”，但是如果数据帧有n列，则是当前的思想，即在使用该数据之前，应该将该数据分成n个独立的(C++)向量。对我之前提出的关于使用数据框架中的字符串(字符向量)列的回答向我表明，是的，这是正确的做法。特别是，似乎不支持像df.namei这样的符号直接引用数据帧信息(就像在C结构中可能有的那样)，除非我弄错了。然而，这导致我们陷入这样一种情况:将数据细分得更麻烦--而不是能够在一行中子集一个数据帧，必须分别处理每个变量。因此

浏览 2提问于2012-06-06得票数 3

回答已采纳

3回答

如何将R中的数据帧转换为列联表？

r、dataframe、contingency

我有一个简单的问题。如何将数据帧转换为Fisher精确测试的列联表？我有大约19000行的data： head(data) R_T1 R_T2 NR_T1 NR_T2 GMNN 14 60 70 157 GORASP2 7 67 39 188 TTC34 5 69 41 186 ZXDC 8 66 37 190 ASAH2 9 65 46 181 我想将每一行转换为一个联想表，以执行

浏览 7提问于2017-06-27得票数 2

回答已采纳

0回答

计算调整后的Rand指数

python、debugging、k-means

我正在尝试使用以下代码计算两组集群之间的： #computes ARI for this type of clustering def ARI(table,n): index = 0 sum_a = 0 sum_b = 0 for i in range(len(table)-1): for j in range(len(table)-1): sum_a += choose(table[i][len(table)-1],2) sum_b += choose(table[len(table)-1][j],2) index += choose

浏览 1提问于2017-12-10得票数 0

回答已采纳

3回答

R:使用循环生成的计数或偶然表

r、loops、contingency

我是R编程的新手，所以我寻求帮助来开始我的编程。我有一个包含4列的"long“数据集(我之前在R中对其进行了整形)： d=matrix(c(1,2,3,4,5,6,7,"A","A","A","B","B","B","B",0,0,99,0,0,99,0,99,0,99,99,0,0,99), ncol=4) colnames(d) = c("ID","S.ID","ValA","ValB"); dt=as.ta

浏览 1提问于2017-02-14得票数 1

1回答

将大列表转换为行式数据帧

r、performance、list、dataframe、data.table

我使用structure命令将一个大列表转换为数据帧(我在SO中阅读了相关文章)： l <- list() l[[1]]<-c("2048","0","25","0","453826","65101","1503497087","1503497031","4_1R") l[[2]]<-c("406","0","26","0","453826",

浏览 0提问于2017-08-23得票数 0

1回答

将列表插入到单个sqlite数据库列中

python、python-2.7、sqlite

我有一个数据列表，需要插入到一个数据库列中。当我试图做这个错误时，我会得到这样的错误： sqlite3.InterfaceError: Error binding parameter 4 - probably unsupported type. 该参数如下所示： ['\r\n', ' \n', 'Please let me know if you still need Curve Shift.\n', '\n', 'Thanks,\n', 'Heather\n', ' -----Ori

浏览 2提问于2014-11-12得票数 4

回答已采纳

1回答

在R中生成多项式随机数据

r、random、simulation、multinomial

我试图使用函数rmultinom从R中的多项分布生成数据，但我遇到了一些问题。事实是，我想要一个50行20列的数据帧，结果的总和等于3乘以n*p。我使用以下代码： p <- 20 n <- 50 N <- 3*(n*p) prob_true <- rep(1/p, p) a <- rmultinom(50, N, prob_true) 但我得到了一些非常奇怪的结果和一个20行50列的数据框。如何解决这个问题？提前感谢！

浏览 43提问于2021-02-12得票数 0

回答已采纳

2回答

如何使用dbplyr (R)将向量添加到后端的表中

sql、r、dbplyr

我使用tbl()从数据源创建了一个表。我需要在dataset中添加一个包含1:nrow()的列，并尝试不同的方法，但没有成功。我的代码如下： nrow_df1 <- df1 %>% summarise(n = n()) %>% pull(n) df1 <- df1 %>% mutate(ID = 1:nrow_df1, step = 1) 它不向dataset添加列ID，只添加列步骤。使用as.data.frame()，它可以工作，但速度太慢了。你有什么想法吗？提前感谢

浏览 1提问于2022-05-16得票数 0

回答已采纳

1回答

在R中使用json文件读取数据帧

sql、r

我有一个SQL数据库，我想在其中选择JSONfiles的一列并将其转换为可读的R数据帧。我成功地从我的数据库创建了JSONfiles的数据帧，但是当我尝试使用fromJSON函数读取它们时，它并没有读取所有的JSONfiles。 JSON列是每一行都有一个data$products_json文件的列。 rs = dbSendQuery(mydb, "SELECT products_json FROM orders") data = fetch(rs, n=-1) library(rjson) jfile <- fromJSON(data$products_json)

浏览 7提问于2019-07-05得票数 0

回答已采纳

2回答

如何将Python Dataframe转换为列表列表？

python、pandas、casting

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

1回答

空值未插入到sql表中

mysql、sql、database、csv

我有一个CSV文件，包含三列"movieId“、"imdbId”和"tmdbId“。"tmdbId“列包含多个空行。(movieId是引用另一个表中的主键的前键) 当我将这个数据帧读入R时，空行被视为NA值。如果我使用以下命令将此CSV文件导入到mysql DB中，则不会在表中插入具有NA值的行，即使我允许空值也是如此。我还应该提一下，我没有得到任何错误。除了以下命令之外，我还尝试使用MySQL工作台导入数据集，但不起作用。有什么建议吗？ LOAD DATA LOCAL INFILE 'links.csv' INTO TABLE links

浏览 19提问于2020-05-27得票数 2

回答已采纳

2回答

有没有一个函数可以找出每列中每个字符串的计数？

我有一项看似简单的任务，但在工作了几个小时后，我发现自己被难住了。我有一个数据框架： mydata <- read.table(header=TRUE, text=" rime point sound Y Y Y N N Y Y Y Y NA NA NA ") 我希望我的数据帧看起来像这样： mydata <- read.table(header=TRUE, text=" standard Y N NA rime

浏览 34提问于2020-09-18得票数 1

回答已采纳

1回答

将Pandas数据帧的全部内容写入HTML表

python、html、pandas

我将链接嵌入到Pandas数据帧(下表)的一列中，并将数据帧写入hmtl。数据框表中的链接格式如下所示(索引表中的第一个链接)： In: table.loc[0,'Links'] Out: u'<a href="http://xxx.xx.xxx.xxx/browser/I6.html">I6</a>' 如果我查看(而不是索引特定行)数据帧(在notebook中)，链接文本将被截断： <a href="http://xxx.xx.xxx.xxx/browser/I6.html... 我将数据帧写入htm

浏览 1提问于2014-08-01得票数 6

回答已采纳

3回答

从dataframe中行的每个元素中派生行的最小值，

我有一个数据框架 A B C D r1 10 7 19 11 r2 5 5 7 8 r3 12 9 13 11 r4 8 10 11 9 我想要创建两个数据帧，其值为：从该行的每个元素减去行中的min值，从该列的每个元素减去列中的减去min值。我得到了列的函数 d1=transform(d,A=A-(min(A)),B=B-(min(B)),C=C-(min(C)),D=D-(min(D))) 我得到的结果如下， > d1 A B C D r1 5 2 12 3 r2 0 0 0 0 r3 7 4 6 3 r4 3 5 4 1 我应该使

浏览 5提问于2020-10-12得票数 1

回答已采纳

1回答

将数据框列从字符转换为数字

我构建了一个数据框架，如下所示： > yyz <- data.frame(a = c("1","2","n/a"), b = c(1,2,"n/a")) > apply(yyz, 2, class) a b "character" "character" 我试图将最后一列转换为数字，同时仍然将第一列保留为字符。我试过这个： > yyz$b <- as.numeric(as.character(yyz$b)) > yyz a

浏览 0提问于2016-06-08得票数 33

回答已采纳

1回答

Pandas中多个特征的卡方检验

python、pandas

我有一个示例数据帧，如下所示 m_list = ['male','male','female','female'] whiskey_list = ['alcohol','no_alcohol','alcohol','no_alcohol'] f1 = [273,62,60,7] f2 = [276,61,57,8] l = [m_list,whiskey_list,f1,f2] test_df = pd.DataFrame(l).T test_df.columns

浏览 42提问于2019-12-04得票数 1

回答已采纳

2回答

将列中的元素计数插入R中的表中

我在R中工作，我得到了一个包含A、B和NA值的矩阵，我想计算每一列中A、B或NA值的数量，并将结果插入到表中。我使用下面的代码来说明A、B和NA。 mydata <- matrix(c(rep("A", 8), rep("B", 2), rep(NA, 2), rep("A", 4), rep(c("B", "A", "A", "A"), 2), rep("A", 4)), ncol = 4, byrow = TRUE) myFun <- functio

浏览 0提问于2013-04-17得票数 0

1回答

如何在R中使用一些优雅而高效的代码来填充来自不同数据帧的列中缺失的观测值(N/As)？

r、dataframe、populate

问题和目标有三个R数据帧具有相同的结构，但设置在三个不同的时间频率(季度"_q"，半年度"_sa“和年份"_y")。目标是仅以季度频率("data_q")为数据帧中的每个变量(列)填充缺失的观测值(N/As)，使用在半年度("data_sa")和年度("data_y")数据帧中可用的观测值。原始数据帧是 data_q <-data.frame(date=as.Date(c('2010-03-31','2010-06-30','2010-09-30',

浏览 1提问于2016-10-31得票数 0

2回答

datetime.datetime是不可序列化的

python、datetime

我在Python中有一个类，用于检索表中的所有列并返回包含此数据的JSON。问题是，这些列中至少有一个是datetime，而我似乎无法理解如何序列化这些列，以便能够生成有效的JSON。我的类如下所示： class GetTodos(Resource): def get(self): con = cx_Oracle.connect('brunojs/bdpf5@127.0.0.1/orcl') cur = con.cursor() cur.execute("select * from organite_repos

浏览 0提问于2016-03-08得票数 18

回答已采纳

1回答

如何将2x2列联表粘贴到rstudio中？

r、datatable

有没有办法将MS Excel中的2x2列联表直接导入R？我试过read.table，它不起作用。在R中创建2x2表需要矩阵()，colname ()等步骤。我希望将已经存在的2x2表引入R中，并做进一步的统计。任何建议都会受到高度赞赏。示例2x2表：

浏览 0提问于2021-07-23得票数 0

2回答

从CSV中解析货币值，转换百万和十亿的数字后缀。

r、currency、read.csv、suffix

我很好奇在R中是否有什么开箱即用的函数可以处理这个问题。我有一个CSV文件，我正在使用read.csv读取一个数据帧。CSV中的一个列包含货币值，格式为 Currency -------- $1.2M $3.1B N/A 我想把这些转换成可以用来计算的更有用的数字，所以看起来如下： Currency ---------- 1200000 3100000000 NA 我最初的想法是在包含*M、*B或N/A的行的基础上，将数据分解为3部分，然后使用gsub替换$和M/B，然后将剩余的数字乘以1000000或1000000000，最后将3个子集重新加入到一个数据帧中。然而，我很好奇在R中是否有更

浏览 4提问于2015-11-18得票数 4

回答已采纳

1回答

VBA将按年初至今复制范围

excel、vba

我有一个包含三列的工作表。列C:C包含所有日历日期，N:N包含数据1，R:R数据2。我正在尝试编写的宏应检查列C中的日期，以查找(编辑)小于今天的日期，并将列R:R的数据复制到列N:N。这有意义吗？我有一种感觉，这是一件非常基本的事情，但是，我花了一个小时在谷歌上搜索，但没有成功。谢谢!

浏览 8提问于2019-11-25得票数 0

1回答

构建222列联表时遇到问题

文件"Aspirin“包含一个2×2×2的列联表，其列定义如下。第1列: V1=Observation编号。观察1至8。第2列: V2=Count。表中每个单元格的非负整数计数。第3列:V3=案例/控制因素。因子水平1(对照)和水平2(病例)。第4列: V4=Ulcer类型因素。因子水平1(胃)和水平2(十二指肠)。第5列: V5=Aspirin使用系数。因子级别1(非用户)和级别2(用户)。 > aspirin V1 V2 V3 V4 V5 1 1 62 1 1 1 2 2 39 2 1 1 3 3 53 1 2 1 4 4 49 2

浏览 25提问于2021-10-18得票数 1

回答已采纳

2回答

R数据帧的首选数据格式

python、r、dataframe

我正在用Python编写一段数据收集代码。我想生成一个数据帧文件，尽可能容易地导入到R中。我可以完全控制我的Python代码将生成的内容，并且我希望避免在R端进行不必要的数据处理，比如将列转换为因子/数值向量等。此外，如果可能的话，我希望尽可能容易地在R端导入数据，最好是调用一个带有单个文件名参数的函数。我应该如何将数据存储到文件中才能实现这一点？

浏览 0提问于2013-02-17得票数 2

1回答

根据数据表中的多列创建累加值的新列

r、data.table

这是我在寻找答案几天后的第一篇帖子。我正艰难地从R数据帧转换到R数据表。我想要实现的是基于来自多个列/变量的指示符创建某种类型的累积值。使用data frame我可以很容易地做到这一点： DF = data.frame( a1 = c(1, 2, 3, 4, 5), a2 = c(1, 2, 3, 4, 5), a3 = c(1, 2, 3, 4, NA) ) DF$b1<-as.numeric(0) for(i in 1:3) { DF$b1<-as.numeric(DF[i]>0)+DF$b1 } 然而，对我来说，它在数据表中并不是那么直接。我所做的工作如

浏览 26提问于2019-09-12得票数 0

回答已采纳

1回答

如何在SparkR中对数据帧的每一行执行第三方计算

r、apache-spark、sparkr

我有一个R数据帧，通过调用createDataFrame函数将其转换为RDD。RDD有多个列，用于计算新列。我需要通过AmericanOption调用RQuantLib R包的SparkR函数，并将返回的值更新为同一数据帧的新列。通常，我们可以在其他编程语言中使用foreach来实现这一点，但是我们不知道如何在SparkR中这样做，因为map函数也缺少文档化的。

浏览 4提问于2016-01-04得票数 1

回答已采纳

2回答

用于替换列中任何类型的换行符的猪脚本

apache-pig

我已经使用pig脚本从CSV中删除了一些列： Cleaned = FOREACH data generate $0 .. $8,$11 .. $27, $31 .. $41, $45 .. $97, $99 .. $111; 在我保留的列中，我需要去掉任何可能损坏配置单元中数据的换行符。可以是\n、\r、\r\n或<br>。由于它是用户输入的数据，我相信使用Enter键输入数据时创建的换行符将是上面提到的字符之一，如果您也可以指定它被转换为什么，将不胜感激，但在大多数情况下，我需要确保从数据中删除任何类型的换行符，以确保我的数据通过配置单元CSV解析器正确映射。我如何在我用来过滤

浏览 1提问于2016-10-09得票数 0

1回答

如何在pandas中按组计算一组行的模式

python、python-3.x、pandas

我有一个数据帧，看起来像这样： import pandas as pd foo = pd.DataFrame({'var_name': ['r1','r2','r3','var', 'r1','r2','r3','var'], 'group': ['a','a','a','a','b','b',

浏览 6提问于2020-04-09得票数 1

回答已采纳

3回答

读取R中的CSV，第一列作为数据帧头

r、csv、dataframe

我有一个简单的文本文件，其中第一列是名称(字符串)，第二列是值(浮点数)。例如，姓名和年龄： Name, Age John, 32 Heather, 46, Jake, 23 Sally, 19 我希望将其作为数据帧(称为df)读入，但将其转置，这样我就可以按名称访问年龄，这样df$John将返回32。我该怎么做呢？在前面，我尝试创建一个新的数据帧tdf，循环遍历for循环中的数据，分配每个name和age，然后作为tdf[name] = age插入到空的数据帧中，但这并不能像我预期的那样工作。

浏览 1提问于2016-12-06得票数 1

2回答

向DataFrame Python添加新列。SettingWithCopyWarning

python、pandas

我试图在数据帧中添加一个新列。我有一列日期，我将其转换为秒-自纪元，并将其添加到数据帧的新列中。 def addEpochTime(df): df[7] = np.NaN # Adding empty column. for n in range(0, len(df)): # Writing to empty column. df[7][n] = df[0][n] - 5 # Conduct some mathematical mutations... addEpo

浏览 5提问于2015-08-17得票数 0

回答已采纳

1回答

使用pandas将包含多个表的CSV文件转换为一个数据帧

python、pandas、dataframe、csv、import

我想解释从一台机器输出的数据，它捆绑在一个CSV文件中。我想输出一个更容易分析的大表。输入数据可能如下所示： marker, info 1, info 2 \r\n col1,col2,col3,col4,col5,colA,colB,colC \r\n NULL,2e15,-222,info,string,0.17,b,c \r\n ... \r\n marker, info 3, info 4 \r\n col1,col5,colA,colB,colD \r\n text,foo,0.17,-1e-12,string \r\n 换句话说，有逗号分隔的数据表，可以通过描述下面内容的标记字

浏览 44提问于2021-11-22得票数 1

1回答

在循环中引用两个数据帧

我希望编写一个循环来编辑一个数据帧，同时访问R中的另一个数据帧。假设我有一个名为'master‘的数据帧，设置如下： ID type1 type2 type3 A 1 0 1 B 0 0 1 C 0 1 1 和第二个数据帧，称为“参考”，设置如下： Types multiplier type1 0.33 type2 0.44 type3 0.67 我想在'master‘中创建一个新列，即行的数学总和乘以数据帧'reference’中的'multi

浏览 1提问于2017-01-26得票数 0

回答已采纳

1回答

如何将列表转换为具有重新排列和单独命名列的复杂表？

我有一个列表(称为列表)，有30个数据帧，它们都有单独的名称(以公司的名字命名)，由回归的输出组成。数据帧都如下所示： term estimate std.error statistic p.value (Intercept) 0.0012 0.000 2.84 0.00 x$Return 0.8119 0.055 14.49 1.08 x$ReturnDum 0.2989 0.083 0.10 0.05 对于我的输出，我需要一个(pdf或png)文件与一个回归表，其中包括上面的所有输出。这张桌子应该是

浏览 0提问于2019-05-29得票数 1

回答已采纳

1回答

从R glmnet对象中获取预测类

r、regression、glmnet

我正在尝试使用R中的glmnet构建简单的多类logistic回归模型。然而，当我试图预测测试数据并获得列联表时，我得到了一个错误。下面是一个示例会话。 > mat = matrix(1:100,nrow=10) > test = matrix(1:50,nrow=5) > classes <- as.factor(11:20) > model <- glmnet(mat, classes, family="multinomial", alpha=1) > pred <- predict(model, test) > t

浏览 0提问于2012-02-19得票数 3

回答已采纳