腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Golang开发
专栏成员
举报
289
文章
274079
阅读量
38
订阅数
订阅专栏
申请加入专栏
全部文章(289)
编程算法(117)
go(39)
java(29)
node.js(17)
python(16)
sql(16)
数据库(15)
http(15)
javascript(12)
打包(12)
ide(11)
git(10)
容器(10)
github(9)
网络安全(9)
xml(8)
网站(8)
大数据(8)
数据结构(8)
https(8)
json(7)
linux(7)
spark(7)
css(6)
jquery(6)
ecmascript(6)
容器镜像服务(6)
mapreduce(6)
c++(5)
bash(5)
html(5)
云数据库 Redis(5)
hadoop(5)
image(5)
png(5)
ios(4)
vue.js(4)
云数据库 SQL Server(4)
api(4)
nginx(4)
spring(4)
文件存储(4)
yarn(4)
存储(4)
面向对象编程(4)
zookeeper(4)
php(3)
scala(3)
jar(3)
unix(3)
开源(3)
分布式(3)
爬虫(3)
jdk(3)
正则表达式(3)
二叉树(3)
函数(3)
mac os(2)
c 语言(2)
servlet(2)
jsp(2)
android(2)
单片机(2)
django(2)
bash 指令(2)
访问管理(2)
缓存(2)
jvm(2)
ssh(2)
jdbc(2)
npm(2)
Elasticsearch Service(2)
byte(2)
case(2)
file(2)
func(2)
gif(2)
io(2)
list(2)
map(2)
queue(2)
set(2)
struct(2)
tail(2)
变量(2)
对象(2)
继承(2)
排序(2)
权限(2)
字符串(2)
其他(1)
机器学习(1)
cocoa(1)
xcode(1)
arm(1)
oracle(1)
access(1)
mvc(1)
struts(1)
maven(1)
搜索引擎(1)
中文分词(1)
analyzer(1)
ubuntu(1)
centos(1)
云函数(1)
日志服务(1)
命令行工具(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
SSL 证书(1)
腾讯云测试服务(1)
云推荐引擎(1)
mongodb(1)
渲染(1)
sass(1)
webpack(1)
kubernetes(1)
压力测试(1)
shell(1)
hive(1)
mybatis(1)
yum(1)
dns(1)
spring boot(1)
hashmap(1)
监督学习(1)
grep(1)
aop(1)
selenium(1)
tcp/ip(1)
单元测试(1)
scrapy(1)
jenkins(1)
socket编程(1)
安全(1)
windows(1)
hbase(1)
kafka(1)
腾讯云图数据可视化(1)
流计算 Oceanus(1)
acl(1)
admin(1)
app(1)
assertion(1)
audio(1)
base64(1)
between(1)
boolean(1)
break(1)
buffer(1)
builder(1)
default(1)
distinct(1)
double(1)
exception(1)
exists(1)
field(1)
fifo(1)
filter(1)
for循环(1)
having(1)
join(1)
limit(1)
mac(1)
matplotlib(1)
matrix(1)
model(1)
neo4j(1)
packet(1)
path(1)
permissions(1)
position(1)
push(1)
rdd(1)
return(1)
sample(1)
socket(1)
string(1)
synchronized(1)
text(1)
time(1)
timer(1)
title(1)
url(1)
web(1)
zero(1)
zk(1)
测试(1)
程序(1)
磁盘(1)
定时器(1)
读书笔记(1)
队列(1)
反射(1)
服务器(1)
后端(1)
基础(1)
客户端(1)
链表(1)
连接(1)
浏览器(1)
内存(1)
前端(1)
数据类型(1)
数组(1)
算法(1)
异常(1)
语法(1)
指针(1)
搜索文章
搜索
搜索
关闭
Spark MLlib
api
编程算法
spark
监督学习
机器学习
机器学习是用数据或以往的经验,并以此来优化程序的性能指标。 机器学习本质思想:使用现有的数据,训练出一个模型,然后在用这个模型去拟合其他的数据,给未知的数据做出一个预测结果。机器学习是一个求解最优化问题的过程。老师教学生,学生举一反三,考试成绩是学习效果的预测。 分类:人脸识别判断性别 聚类 :发掘相同类型的爱好和兴趣。物以类聚人以群分 回归: 预测分析价格
羊羽shine
2019-08-25
624
0
RDD和DataFrame转换
spark
sql
在利用反射机制推断RDD模式时,需要首先定义一个case class,因为,只有case class才能被Spark隐式地转换为DataFrame。
羊羽shine
2019-08-23
1.2K
0
Spark SQL
python
分布式
spark
sql
官方地址 http://spark.apache.org/sql/ Spark SQL是Spark用来处理结构化数据的一个模块,它提供了2个编程抽象:DataFrame和DataSet,并且作为分布式SQL查询引擎的作用。
羊羽shine
2019-08-22
733
0
RDD操作—— 键值对RDD(Pair RDD)
hadoop
c 语言
spark
“键值对”是一种比较常见的RDD元素类型,分组和聚合操作中经常会用到。 Spark操作中经常会用到“键值对RDD”(Pair RDD),用于完成聚合计算。普通RDD里面存储的数据类型是Int、String等,而“键值对RDD”里面存储的数据类型是“键值对”。
羊羽shine
2019-08-21
2.9K
0
RDD操作—— 行动(Action)操作
spark
mapreduce
缓存
编程算法
行动操作是真正触发计算的地方。Spark程序执行到行动操作时,才会执行真正的计算,从文件中加载数据,完成一次又一次转换操作,最终,完成行动操作得到结果。
羊羽shine
2019-08-20
1.4K
0
Spark——RDD
分布式
spark
大数据
数据结构
全称为Resilient Distributed Datasets,弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可并行计算的集合。RDD在逻辑上是一个数据集,在物理上则可以分块分布在不同的机器上并发运行。RDD允许用户在执行多个查询时显示的将工作缓存在内存中,后续的查询能够重用工作集,这极大的提升了查询速度。 在Spark 中,对数据的所有操作不外乎创建RDD,转换已有RDD以及调用RDD操作进行求值,每个RDD都被分为多个分区,这些分区运行在集群的不同节点上,RDD可以包含Python,Java,Scala中任意类型的对象,甚至可以是用户自定义对象。 RDD是Spark的核心,也是整个Spark的架构基础。它的特性可以总结如下:
羊羽shine
2019-08-08
613
0
Spark基础概述
spark
jar
maven
命令解释: spark-submint :提交命令,提交应用程序,该命令在spark安装目录下的bin底下 –class org.apache.spark.examples.SparkPi:应用程序的主类 –master spark://aliyun:7077 :运行的master /root/app/spark/examples/jars/spark-examples_2.11-2.3.3.jar:jar包所在路径
羊羽shine
2019-08-06
407
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档