腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大数据
多年海量数据处理经验,化数据为力量
专栏成员
举报
174
文章
284203
阅读量
108
订阅数
订阅专栏
申请加入专栏
全部文章(174)
大数据(94)
spark(19)
hadoop(19)
爬虫(15)
python(13)
数据库(12)
人工智能(12)
数据处理(12)
其他(9)
apache(8)
机器学习(7)
sql(7)
数据挖掘(5)
scrapy(5)
安全(5)
深度学习(4)
编程算法(4)
存储(4)
区块链(3)
神经网络(3)
数据分析(3)
数据可视化(3)
系统架构(3)
hbase(3)
NLP 服务(2)
ios(2)
java(2)
r 语言(2)
云数据库 SQL Server(2)
oracle(2)
github(2)
api(2)
linux(2)
spring(2)
mapreduce(2)
分布式(2)
安全漏洞(2)
数据结构(2)
虚拟化(2)
比特币(1)
数字货币(1)
tensorflow(1)
javascript(1)
go(1)
.net(1)
scala(1)
vue.js(1)
node.js(1)
xml(1)
html(1)
android(1)
nosql(1)
搜索引擎(1)
中文分词(1)
ubuntu(1)
腾讯云测试服务(1)
企业(1)
渲染(1)
svg(1)
yarn(1)
云+未来(1)
开源(1)
自动化(1)
运维(1)
黑客(1)
网络安全(1)
hive(1)
dns(1)
pytorch(1)
cdn(1)
kernel(1)
uml(1)
anaconda(1)
微信(1)
物联网(1)
https(1)
fpga(1)
企业组织(1)
云计算(1)
kafka(1)
max(1)
mean(1)
min(1)
pm2(1)
搜索文章
搜索
搜索
关闭
用R处理不平衡的数据
r 语言
大数据
数据处理
在分类问题当中,数据不平衡是指样本中某一类的样本数远大于其他的类别样本数。相比于多分类问题,样本不平衡的问题在二分类问题中的出现频率更高。举例来说,在银行或者金融的数据中,绝大多数信用卡的状态是正常的,只有少数的信用卡存在盗刷等异常现象。
大数据弄潮儿
2018-06-04
1.7K
0
协同过滤的R语言实现及改进
r 语言
协同过滤算法(CF)是构建推荐系统时最常用的技术之一。它可以基于收集到的其他用户的偏好信息(协同)来自动地预测当前用户的兴趣点。协同过滤算法主要分为两种:基于记忆(memory-based)的协同过滤算法和基于模型(model-based)的协同过滤算法。一般来说,将两者融合可以获得预测准确度上的提升。
大数据弄潮儿
2018-05-23
1.9K
1
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档