腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
TechFlow
专栏作者
举报
764
文章
593330
阅读量
36
订阅数
订阅专栏
申请加入专栏
全部文章(764)
编程算法(458)
python(128)
c++(112)
神经网络(64)
机器学习(59)
深度学习(55)
java(45)
ide(45)
人工智能(42)
数据结构(40)
存储(25)
git(21)
腾讯云测试服务(21)
游戏(21)
sql(20)
go(19)
html(19)
面向对象编程(17)
数据库(15)
numpy(15)
推荐系统(15)
分布式(14)
网络安全(14)
二叉树(14)
node.js(12)
打包(12)
容器(11)
大数据(11)
c 语言(10)
javascript(10)
api(10)
serverless(10)
https(10)
电商(9)
开源(9)
数据分析(9)
github(8)
spark(8)
线性回归(8)
腾讯云开发者社区(8)
matlab(7)
搜索引擎(6)
unix(6)
缓存(6)
ssh(6)
正则表达式(6)
决策树(6)
数据处理(6)
其他(5)
文件存储(5)
网站(5)
tcp/ip(5)
bat(5)
linux(4)
mapreduce(4)
访问管理(4)
shell(4)
hashmap(4)
费用中心(3)
NLP 服务(3)
c#(3)
hadoop(3)
微信(3)
安全(3)
机器人(3)
聚类算法(3)
bug(3)
ode(3)
比特币(2)
区块链(2)
数字货币(2)
自动驾驶(2)
tensorflow(2)
bash(2)
scala(2)
css(2)
jquery(2)
android(2)
硬件开发(2)
云数据库 SQL Server(2)
nosql(2)
maven(2)
apache(2)
bash 指令(2)
spring(2)
批量计算(2)
海外加速(2)
无人驾驶(2)
图像识别(2)
强化学习(2)
hive(2)
markdown(2)
特征工程(2)
学习方法(2)
case(2)
debug(2)
free(2)
init(2)
text(2)
产品经理(2)
面试(2)
设计模式(2)
状态机(2)
ICP备案(1)
对象存储(1)
负载均衡(1)
语音识别(1)
官方文档(1)
ios(1)
mac os(1)
xcode(1)
php(1)
r 语言(1)
汇编语言(1)
makefile(1)
sqlite(1)
mvc(1)
tomcat(1)
中文分词(1)
负载均衡缓存(1)
日志服务(1)
命令行工具(1)
TDSQL MySQL 版(1)
NAT 网关(1)
图片标签(1)
机器翻译(1)
图像处理(1)
express(1)
http(1)
自动化(1)
运维(1)
黑客(1)
爬虫(1)
html5(1)
jvm(1)
卷积神经网络(1)
dns(1)
spring boot(1)
监督学习(1)
seo(1)
grep(1)
pytorch(1)
单元测试(1)
小程序(1)
windows(1)
数据可视化(1)
物联网(1)
系统架构(1)
nat(1)
kafka(1)
jupyter notebook(1)
ascii(1)
Elasticsearch Service(1)
汽车(1)
项目管理(1)
acm(1)
adapter(1)
assert(1)
back(1)
bi(1)
button(1)
cat(1)
coding(1)
date(1)
ddd(1)
dfs(1)
form(1)
google(1)
graph(1)
input(1)
it(1)
label(1)
logic(1)
mac(1)
max(1)
medium(1)
methods(1)
overflow(1)
pandas(1)
pdf(1)
private(1)
protected(1)
provider(1)
ps(1)
public(1)
push(1)
range(1)
return(1)
series(1)
shift(1)
stack(1)
state(1)
svm(1)
swap(1)
target(1)
time(1)
view(1)
vr(1)
程序员(1)
二进制(1)
翻译(1)
集群(1)
模型(1)
排序(1)
求职(1)
软件工程(1)
数学(1)
调试(1)
中间件(1)
搜索文章
搜索
搜索
关闭
Hadoop、spark、hive到底是什么,做算法要不要学?
node.js
hadoop
hive
spark
数据库
最近我发现,很多萌新说着想要做算法工程师,但是却对这个岗位的要求以及工作内容一无所知。以为学一个Python,再学一些机器学习、深度学习的模型就可以胜任了。工作就是用Python不停地写模型。
TechFlow-承志
2022-08-26
681
0
想学spark但是没有集群也没有数据?没关系,我来教你白嫖一个!
spark
python
sql
今天要介绍的平台叫做databricks,它是spark的创建者开发的统一分析平台。单凭spark创建者这几个字大家应该就能体会到其中的分量,其中集成了Scala、Python和R语言的环境,可以让我们在线开发调用云端的spark集群进行计算。
TechFlow-承志
2020-05-26
1.2K
0
总要到最后关头才肯重构代码,强如spark也不例外
hive
spark
python
mapreduce
用过Python做过机器学习的同学对Python当中pandas当中的DataFrame应该不陌生,如果没做过也没有关系,我们简单来介绍一下。DataFrame翻译过来的意思是数据帧,但其实它指的是一种特殊的数据结构,使得数据以类似关系型数据库当中的表一样存储。使用DataFrame我们可以非常方便地对整张表进行一些类似SQL的一些复杂的处理。Apache Spark在升级到了1.3版本之后,也提供了类似功能的DataFrame,也就是大名鼎鼎的SparkSQL。
TechFlow-承志
2020-05-14
1.2K
0
spark——Pair rdd的用法,基本上都在这了
spark
java
sql
在之前的文章当中,我们已经熟悉了RDD的相关概念,也了解了RDD基本的转化操作和行动操作。今天我们来看一下RDD当中非常常见的PairRDD,也叫做键值对RDD,可以理解成KVRDD。
TechFlow-承志
2020-04-26
1.5K
0
spark——RDD常见的转化和行动操作
spark
mapreduce
缓存
我们前文说道在spark当中RDD的操作可以分为两种,一种是转化操作(transformation),另一种是行动操作(action)。在转化操作当中,spark不会为我们计算结果,而是会生成一个新的RDD节点,记录下这个操作。只有在行动操作执行的时候,spark才会从头开始计算整个计算。
TechFlow-承志
2020-04-21
1.1K
0
手把手教你在本机安装spark
spark
开源
python
hadoop
最近由于一直work from home节省了很多上下班路上的时间,加上今天的LeetCode的文章篇幅较小,所以抽出了点时间加更了一篇,和大家分享一下最近在学习的spark相关的内容。看在我这么拼的份上,求各位老爷赏个转发。。。
TechFlow-承志
2020-04-14
4.1K
0
spark——spark中常说RDD,究竟RDD是什么?
spark
分布式
存储
在上一讲当中我们在本地安装好了spark,虽然我们只有local一个集群,但是仍然不妨碍我们进行实验。spark最大的特点就是无论集群的资源如何,进行计算的代码都是一样的,spark会自动为我们做分布式调度工作。
TechFlow-承志
2020-04-14
654
0
大数据基石——Hadoop与MapReduce
hadoop
mapreduce
大数据
spark
数据库
近两年AI成了最火热领域的代名词,各大高校纷纷推出了人工智能专业。但其实,人工智能也好,还是前两年的深度学习或者是机器学习也罢,都离不开底层的数据支持。对于动辄数以TB记级别的数据,显然常规的数据库是满足不了要求的。今天,我们就来看看大数据时代的幕后英雄——Hadoop。
TechFlow-承志
2020-03-05
406
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档