我正在编写一个程序,它将从csv文件中读取一个数据帧,然后计算其中一个属性(列)的哈希值,并将其作为一个新属性存储在数据帧中。所有这些都很好。但是,我想要的是将散列属性存储为我的键,将原始属性作为它的值存储在redis中。对于数据帧中指定列中的每个元素,我想这样做。例如:
这是我最初的数据框架:
customer value
a 1
b 2
c 3
然后,我要为value属性计算散列:
customer value hash
a 1
我有一个数据框架。我想检查特定的列是否有数值,或者没有使用正则表达式匹配。当我使用str.contains时,它显示如下所示的错误。检查一列中的所有值是否都有数值的正确方法是什么? df=
Roll.No Words
20 two
30 three
40 four
50 five
60 Nan
70 Nan
df = df[df['Roll.No'].str.contains(r'[^0-9]', na=True)]
Error: AttributeErro
我对R非常陌生,我有一个更大的数据,有58个观察,我想在29个数据中分解,包括列1和2,3和4,等等。
我尝试了以下方法
for (i in 1:29){
x <- LCMS[,((i*2)-1):(i*2)]
assign("dfi",x,envir=globalenv())
}
,并且不接收错误消息,但是除了"dfi“之外,什么都没有保存,这就是最后一次迭代中的数据。
我猜"dfi“是作为名称输入的问题,所以它不用于迭代过程?但我该如何避开这一切呢?
我正在用R编写一段代码来添加一个新列,其中的值需要根据两个条件进行填充。问题是有两列“排名”和“功能级别”。对于每个等级,有多个功能级别。例如,如果存在等级'A‘,则等级A具有功能级别f1、f2、f3。现在,我需要用以下方式填充一个名为"combination_of_rank_and_functionallevel“的列: if rank = A and functional_level = f1,
then combination_of_rank_and_functionallevel = A1
else if rank = A and functional_l
Problem:我有一个数据集(请参阅下面的示例数据集和代码),列都被赋值为0。我希望将1的值赋给特定的列序列,其中我计算并存储在列zFlagStart和zFlagEnd中的起始列和结束列编号。当我试图通过一个for 1:nrow(df)循环执行此操作时,我会得到以下错误:numerical expression has 2 elements: only the first used
创建数据集的示例代码
#create sample dataset
r1<-c(0,0,0,0,0,1,3)
r2<-c(0,0,0,0,0,3,5)
df<-as.data.frame(rbi
我的数据格式化方式如下
-------------------------
| A | a | 1 |
-------------------------
| A | a | 2 |
-------------------------
| A | a | 3 |
-------------------------
| B | b | 1 |
-------------------------
| B | b | 3 |
-----------------------
#python我的数据框架有一个列:
User name
XYZ (R1)
ABCD (R2)
LKMNP (R2)
我想找到R1、R2和R2在数据帧中的位置,然后删除它们。产出应是:
User name extract Position New name
XYZ (R1) R1 5 XYZ
ABCD (R2) R2 6 ABCD
LK (R2) R2 4 LK
我正在处理IMDB数据集,我的电影表的记录如下所示
import sqlite3
import pandas as pd
conn=sqlite3.connect('Db-IMDB.db')
result1=pd.read_sql_query('select year from Movie order by year',conn)
print(type(result1))
print(result1)
我得到的输出如下所示
<class 'pandas.core.frame.DataFrame'>
year
0
我想知道,如何使用逗号分隔符在R中组合dataframe/list中的列。下面是示例数据集。
Name Red Blue Green
Jack 4 5 3
John 5 6 4
Gen 3 7 1
Pra 4 6 2
预期为:
Name Colors
Jack 4,5,3
John 5,6,4
Gen 3,7,1
Pra 4,6,2
如果能立即得到帮助,我们将不胜感激。
提前感谢
我需要在熊猫数据栏中创建新的专栏。
df
Id Value
1 >45%
2 >29%
3 <30 to >69
4 >40% to <56%
5 --
df_output:
Id Value Value2
1 >45% 45%
2 >29% 29%
3 <30 to >69 69
4 >40% to <56% 56%
我想循环遍历数据帧中的一个列,并检查一个条件,然后替换0或1。代码是:
for (i in v$R){
if( is.na(v$R) ==TRUE ){v$V5 = 0}else{v$V5=1}
}
但我犯了个错误。名为“v”的数据框架如下所示。V5有NA值,如果R列中的值是NA,我想用0替换,否则替换为1。我怎么做呢?
A B R V5
1 2 3 NA
4 5 NA NA
假设我有一个数据框架(df),像这样,有大量的行和列.
v w x y ... z
0 a p 1 1 ... 1
1 a q 0 1 ... 0
2 b p 1 1 ... 1
3 b q 0 1 ... 0
4 c p 1 1 ... 1
5 c q 1 0 ... 1
我想除以v是相同的每一行的值,w等于p,除以v列相同的列中的每个值之和,然后在新行或新列中返回这个新值。例如:
v w x y ... z
0 a
df
X1 X2 X3 X4 X5
1 1 11 21 a k
j 2 12 22 b l
3 3 13 23 c m
t 4 14 24 d n
5 5 15 25 e o
k 6 16 26 f p
7 7 17 27 g q
z 8 18 28 h r
9 9 19 29 i s
10 10 20 30 j
我有一个包含5列和10行的数据帧。我只想让第一列( X1 )只保留数字形式,并删除X1列第二行中的任何字符,例如字符"j“。有人知道如何使用R中的脚本来做到这一点吗?
理想情况下,最终结果将如下所示
X1 X2 X3 X4 X5
1 1 11 21 a k
3