腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Hadoop数据仓库
专栏作者
举报
507
文章
696304
阅读量
108
订阅数
订阅专栏
申请加入专栏
全部文章
sql
数据库
云数据库 SQL Server
编程算法
大数据
数据处理
hive
hadoop
http
正则表达式
oracle
mysql
云数据库 Redis
网络安全
bash
regexp
bash 指令
java
linux
存储
spark
数据分析
数据挖掘
unix
tcp/ip
https
字符串
node.js
mongodb
set
数据
apache
云数据库 MongoDB
云推荐引擎
hbase
es
函数
html
mapreduce
网站
缓存
数据迁移
date
机器学习
xml
postgresql
分布式
面向对象编程
数据库管理
专用宿主机
TDSQL MySQL 版
腾讯云测试服务
数据可视化
product
其他
api
神经网络
深度学习
人工智能
shell
线性回归
schema
测试
脚本
内容分发网络 CDN
负载均衡
打包
文件存储
ssh
数据结构
实时数仓
kettle
null
select
table
部署
配置
索引
javascript
jquery
nosql
spring
yarn
Elasticsearch Service
insert
redis
row
编码
产品
集合
集群
事务
语法
ios
jar
容器镜像服务
容器
开源
zookeeper
迁移
data
extract
grid
innodb
rows
session
text
镜像
连接
数据仓库
搜索
c++
php
go
ecmascript
ruby on rails
lucene/solr
windows server
负载均衡缓存
日志服务
命令行工具
数据安全
express
sql server
jdbc
决策树
安全
windows
kafka
unicode
alpha
count
csv
db
disk
fetch
h2
ip
key
model
predict
project
substr
xls
对象
解决方案
内存
数据同步
统计
弹性伸缩
官方文档
python
ruby
lua
json
arm
嵌入式
memcached
git
github
搜索引擎
analyzer
centos
apt-get
SSL 证书
数据备份
日志数据
云数据库 MySQL
serverless
parcel
运维
爬虫
yum
推荐系统
rabbitmq
gcc
socket编程
机器人
nest
任务调度
sdn
聚类算法
分类算法
utf8
ascii
学习方法
数据集成
add
amp
apollo
authentication
awk
byte
cat
code
connect
counter
crontab
d3
deadlock
delimiter
digits
etl
factory
greenplum
host
hostname
im
join
matrix
min
monitor
ode
panel
partition
performance
position
proc
production
progress
replace
sentinel
sequence
server
sh
split
state
status
storage
string
swap
system
tar
tree
txt
version
zip
备份
变量
程序设计
磁盘
存储过程
代理
规范化
后台
进程
客户端
命令行
权限
入门
设计
实践
树形结构
同步
系统
效率
协议
性能
优化
原理
指针
标签
搜索文章
搜索
搜索
关闭
Greenplum 实时数据仓库实践(10)——集成机器学习库MADlib
神经网络
机器学习
人工智能
深度学习
spring
MADlib是一个基于SQL的数据库内置的开源机器学习库,具有良好的并行度和可扩展性,有高度的预测精准度。MADlib最初由Pivotal公司与伯克利大学合作开发,提供了多种数据转换、数据探索、概率统计、数据挖掘和机器学习方法,使用它能够简易地对结构化数据进行分析和学习,以满足各行各业的应用需求。用户可以非常方便地将MADlib加载到数据库中,从而扩展数据库的分析功能。2015年7月MADlib成为Apache软件基金会的孵化器项目,经过两年的发展,于2017年8月毕业成为Apache顶级项目。最新的MADlib 1.18.0可以与PostgreSQL、Greenplum和HAWQ等数据库系统无缝集成。Greenplum MADlib扩展提供了在Greenplum数据库中进行机器学习和深度学习工作的能力。
用户1148526
2022-04-13
705
0
MADlib——基于SQL的数据挖掘解决方案(26)——聚类之k-means方法
机器学习
聚类算法
编程算法
数据挖掘
大数据
聚类算法大都是几种最基本的方法,如k-means、层次聚类、SOM等,以及它们的许多改进变种。MADlib提供了一种k-means算法的实现。本篇主要介绍MADlib的k-means算法相关函数和应用案例。
用户1148526
2019-05-25
746
0
MADlib——基于SQL的数据挖掘解决方案(25)——分类之随机森林
决策树
机器学习
神经网络
深度学习
人工智能
装袋(bagging)又称自助聚集(bootstrap aggregating),是一种根据均匀概率分布从数据集中重复抽样(有放回的)的技术。每个自助样本集都和原始数据集一样大。由于抽过程是有回放的,因此一些样本可能在同一训练数据集总出现多次,而其它一些却可能被忽略。一般来说,自助样本
用户1148526
2019-05-25
848
0
MADlib——基于SQL的数据挖掘解决方案(24)——分类之决策树
决策树
机器学习
神经网络
深度学习
人工智能
决策树(Decision Tree)又称为分类树(Classification Tree),是最为广泛的归纳推理算法之一,处理类别型或连续型变量的分类预测问题,可以用图形和if-then的规则表示模型,可读性较高。决策树模型通过不断地划分数据,使因变量的差别最大,最终目的是将数据分类到不同的组织或不同的分枝,在因变量的值上建立最强的归类。
用户1148526
2019-05-25
936
0
MADlib——基于SQL的数据挖掘解决方案(23)——分类之SVM
机器学习
神经网络
深度学习
人工智能
SVM法即支持向量机(Support Vector Machine,SVM)法,由Vapnik等人于1995年提出,具有相对优良的性能指标。该方法是建立在统计学理论基础上的机器学习方法。通过学习算法,SVM可以自动寻找那些对分类有较好区分能力的支持向量,由此构造出的分类器可以最大化类与类的间隔,因而有较好的适应能力和较高的分准率。该方法只需要由各类域的边界样本的类别来决定最后的分类结果。
用户1148526
2019-05-25
753
0
MADlib——基于SQL的数据挖掘解决方案(22)——分类之朴素贝叶斯
机器学习
神经网络
深度学习
人工智能
分类算法
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。贝叶斯分类是一种利用概率统计知识进行分类的算法,其分类原理是贝叶斯定理。贝叶斯定理是由18世纪概率论和决策论的早期研究者Thomas Bayes发明的,故用其名字命名为贝叶斯定理。
用户1148526
2019-05-25
898
0
OushuDB入门(八)——AI篇
postgresql
神经网络
机器学习
人工智能
深度学习
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/80433158
用户1148526
2019-05-25
429
0
HAWQ + MADlib 玩转数据挖掘之(二)——矩阵
数据挖掘
分布式
sql
机器学习
用户1148526
2018-01-03
1.3K
0
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
点击查看
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
立即参加
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档