腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
A2Data
专栏作者
举报
373
文章
384163
阅读量
30
订阅数
订阅专栏
申请加入专栏
全部文章(373)
编程算法(97)
python(70)
sql(49)
数据库(41)
linux(29)
hive(28)
ide(26)
java(25)
apache(19)
云数据库 SQL Server(17)
网络安全(16)
存储(15)
数据分析(14)
大数据(13)
http(12)
https(12)
git(11)
github(11)
开源(11)
打包(10)
网站(9)
ssh(9)
面向对象编程(9)
windows(9)
mysql(9)
node.js(8)
html(8)
oracle(8)
numpy(8)
javascript(7)
unix(7)
神经网络(7)
腾讯云测试服务(7)
tcp/ip(7)
机器学习(6)
jquery(6)
深度学习(6)
文件存储(6)
人工智能(6)
bash(5)
vue.js(5)
matlab(5)
spring(5)
mapreduce(5)
专用宿主机(5)
容器(5)
jdk(5)
yum(5)
hexo(5)
数据结构(5)
虚拟化(5)
c++(4)
bash 指令(4)
云推荐引擎(4)
hadoop(4)
线性回归(4)
ftp(4)
npm(4)
微服务(4)
jupyter notebook(4)
编程(4)
数据挖掘(3)
xml(3)
api(3)
jar(3)
maven(3)
日志服务(3)
访问管理(3)
命令行工具(3)
NAT 网关(3)
serverless(3)
爬虫(3)
正则表达式(3)
dns(3)
spring boot(3)
anaconda(3)
nat(3)
特征工程(3)
break(3)
data(3)
hdfs(3)
import(3)
null(3)
pandas(3)
root(3)
工具(3)
php(2)
scala(2)
json(2)
nosql(2)
云数据库 Redis(2)
全文检索(2)
TDSQL MySQL 版(2)
webpack(2)
xslt & xpath(2)
缓存(2)
shell(2)
jvm(2)
gui(2)
hbase(2)
任务调度(2)
rust(2)
axis(2)
default(2)
hadoop2(2)
int(2)
it(2)
join(2)
key(2)
max(2)
methods(2)
rank(2)
return(2)
static(2)
sum(2)
zip(2)
百度(2)
教程(2)
排序(2)
统计(2)
源码(2)
字符串(2)
NLP 服务(1)
mac os(1)
react(1)
css(1)
sqlite(1)
flask(1)
eclipse(1)
tomcat(1)
搜索引擎(1)
ubuntu(1)
windows server(1)
nginx(1)
容器镜像服务(1)
短信(1)
电商(1)
express(1)
rollup.js(1)
babel.js(1)
游戏(1)
分布式(1)
黑客(1)
spark(1)
卷积神经网络(1)
sql server(1)
grep(1)
powershell(1)
安全(1)
数据可视化(1)
kafka(1)
聚类算法(1)
数据库管理(1)
数据集成(1)
add(1)
backup(1)
bind(1)
boolean(1)
bug(1)
case(1)
comparison(1)
component(1)
contour(1)
copy(1)
count(1)
dashboard(1)
dataset(1)
date(1)
dump(1)
element(1)
error(1)
exe(1)
exists(1)
expression(1)
filewriter(1)
for循环(1)
frame(1)
func(1)
get(1)
getter(1)
gif(1)
google(1)
having(1)
host(1)
im(1)
image(1)
impala(1)
input(1)
insert(1)
io(1)
jsonp(1)
jupyter(1)
lag(1)
launch(1)
lda(1)
list(1)
localhost(1)
mac(1)
mask(1)
min(1)
newline(1)
object(1)
offset(1)
overflow(1)
package(1)
partition(1)
pascal(1)
pip(1)
post(1)
product(1)
protected(1)
ps(1)
public(1)
readline(1)
rename(1)
request(1)
restore(1)
reverse(1)
row(1)
rows(1)
scale(1)
select(1)
setter(1)
shift(1)
sort(1)
stack(1)
string(1)
tampermonkey(1)
time(1)
truncate(1)
ui(1)
union(1)
upload(1)
void(1)
watch(1)
wizard(1)
备份(1)
编程语言(1)
变量(1)
插件(1)
产品(1)
程序(1)
磁盘(1)
地图(1)
动画(1)
二进制(1)
二维码(1)
工作(1)
集合(1)
集群(1)
配置(1)
日志(1)
数据类型(1)
索引(1)
效率(1)
增长黑客(1)
指针(1)
作用域(1)
搜索文章
搜索
搜索
关闭
Ambari离线安装大数据集群
大数据
Centos 最小化安装:各个节点进行:网络配置(Nat 模式且可以共享主机网络)
DataScience
2021-01-18
2.2K
0
[原创]-数据仓库ETL开发
数据库
大数据
sql
ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统数据仓库一般分为四层模型。
DataScience
2020-11-24
2.5K
0
day9.数据集成和转换
数据库
sql
数据集成
大数据
数据挖掘
今天的内容是数据的集成和变换,在做数据分析和挖掘时,百分之八十的时间可能要花在数据预处理部分,准备好相应的数据。数据集成是将多个数据源的数据整合在一起,数据集成建立在对业务的理解之上;数据变换主要是对数据进行规范化处理,转换成适当的形式。
DataScience
2020-06-04
1.1K
0
趣搭-嗒集群
专用宿主机
大数据
ide
node.js
将jdk-7u25-linux-i586.tar.gz 分别传到每台机器的/TMP下
DataScience
2020-04-14
1.3K
0
Apache Hive Hue
hive
apache
hadoop
大数据
oracle
⊙Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。
DataScience
2020-01-02
2.1K
0
cloudera快速入门
大数据
一键部署大数据集群 cloudera quickstart 注:为了节省大家的学习时间 首先这是最低配的大数据集群, 其次融合了各个你需要的组件, 一键导入即可,并且有快速入门教程。 我们先去官网下载
DataScience
2020-01-02
514
0
GitHub如何关联域名
机器学习
大数据
神经网络
深度学习
人工智能
一、购买域名,实名认证,不需要备案 本人购买的是阿里云的域名。(ai大数据与机器学习.top) 二、域名解析(本地与服务器映射) 三、接下来会让你输入IP,完成解析 IP地址怎么来呢?打开终端,输入p
DataScience
2020-01-02
1.9K
0
Hive中苦笑不得的坑
sql
大数据
hive
apache
大家都知道,hive -f 后面指定的是一个文件,然后文件里面直接写sql,就可以运行hive的sql,hive -e 后面是直接用双引号拼接hivesql,然后就可以执行命令。
DataScience
2019-12-30
1.5K
0
Apache Hive MSCK
hive
apache
大数据
node.js
翻译成中文的大概意思就是:Hive将每个表的分区信息保存在metastore中,如果通过hadoop fs -put命令直接将分区信息添加到HDFS,metastore是不会感知到这些新增的分区,除非执行了ALTER TABLE table_name ADD PARTITION命令。但是用户可以运行metastore检查命令MSCK REPAIR TABLE table_name;该命令将关于分区的元信息添加到Hive metastore中,这是对于那些没有元信息的分区来说的。换句话说,就是将任何存在于HDFS上但不在metastore上的分区添加到metastore。
DataScience
2019-12-30
890
0
Apache Hive Load Data
大数据
apache
hive
数据导入方式: 1) 从本地文件系统中导入数据到hive 表 2)从HDFS上导入数据到hive表 3)从别的表中查询出相应的数据并导入到hive 表 4)在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。
DataScience
2019-12-30
811
0
Apache Hive TM
hive
存储
大数据
hadoop
mapreduce
Apache Hive™数据仓库软件有助于使用SQL读取,编写和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。提供了命令行工具和JDBC驱动程序以将用户连接到Hive。
DataScience
2019-12-30
1K
0
cloudera入门总结
大数据
第一天 impala & join 第二天 Bulk upload data 第三天 spark 第四天 Flume
DataScience
2019-12-30
369
0
HDFS ACL权限管理 初解
大数据
hbase
hadoop
TDSQL MySQL 版
Hadoop中的ACL与Linux中的ACL机制基本相同,都是用于为文件系统提供更精细化的权限控制。
DataScience
2019-12-30
833
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档