#交集与补集:
dplyr中提供了两个函数可以执行交集与补集操作:
duplicated(mydata$B) #返回重复对象的布尔值
mydata[!...na.omit(mydata) #忽略缺失值所在行
complete.cases(mydata) #完整值(返回布尔结果)
mydata[!...complete.cases(mydata$A),]#使用该函数的布尔索引确定缺失值或者排除缺失值
?...关于更为复杂的缺失值插补技术,因为涉及到一些比较深入的方法,这里暂且不呈现,仅对缺失值的描述和筛选做以上简单归总。...---------
Python:
---------
#列表去重:
set(将列表元组化过滤重复数据)
M=[1,4,3,6,5,4,3,2,7,8]
list(set(M))
#数据框的去重:
import