腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
用户画像
专栏作者
举报
981
文章
987566
阅读量
53
订阅数
订阅专栏
申请加入专栏
全部文章(981)
编程算法(304)
其他(229)
存储(70)
二叉树(54)
java(46)
python(45)
sql(31)
人工智能(24)
数据库(23)
https(22)
机器学习(20)
linux(20)
神经网络(18)
深度学习(18)
数据结构(15)
缓存(14)
推荐系统(12)
tcp/ip(12)
html(11)
云数据库 SQL Server(11)
大数据(11)
python3(11)
spring(10)
node.js(9)
windows(9)
编程(9)
程序(9)
函数(9)
xml(8)
github(8)
maven(8)
apache(8)
hadoop(8)
hive(8)
bash(7)
api(7)
struts(7)
网络安全(7)
安全(7)
c++(6)
javascript(6)
spark(6)
jdk(6)
决策树(6)
leetcode(6)
云数据库 Redis(5)
jar(5)
tomcat(5)
http(5)
分布式(5)
正则表达式(5)
机器人(5)
数据分析(5)
int(5)
数据(5)
数学(5)
jsp(4)
access(4)
mvc(4)
mapreduce(4)
网站(4)
shell(4)
ssh(4)
erp(4)
数据处理(4)
特征工程(4)
date(4)
程序员(4)
NLP 服务(3)
ios(3)
servlet(3)
jquery(3)
json(3)
ajax(3)
android(3)
汇编语言(3)
git(3)
svn(3)
unix(3)
bash 指令(3)
文件存储(3)
腾讯云测试服务(3)
容器(3)
grep(3)
微信(3)
信息流(3)
bit(3)
matrix(3)
操作系统(3)
链表(3)
搜索(3)
字符串(3)
对象存储(2)
数据挖掘(2)
tensorflow(2)
scala(2)
bootstrap(2)
css(2)
短视频(2)
访问管理(2)
命令行工具(2)
内容理解(2)
mongodb(2)
企业(2)
jdbc(2)
hashmap(2)
监督学习(2)
ftp(2)
zookeeper(2)
aop(2)
gradle(2)
腾讯云开发者社区(2)
kafka(2)
聚类算法(2)
cat(2)
dfs(2)
fibonacci(2)
gradient(2)
ip(2)
local(2)
max(2)
null(2)
precision(2)
push(2)
server(2)
table(2)
txt(2)
编码(2)
表格(2)
二进制(2)
基础(2)
集合(2)
交换机(2)
局域网(2)
通信(2)
异步(2)
负载均衡(1)
mac os(1)
iphone(1)
ruby(1)
asp.net(1)
regex(1)
angularjs(1)
oracle(1)
ruby on rails(1)
打包(1)
eclipse(1)
搜索引擎(1)
全文检索(1)
lucene/solr(1)
centos(1)
负载均衡缓存(1)
TDSQL MySQL 版(1)
NAT 网关(1)
消息队列 CMQ 版(1)
es 2(1)
电商(1)
金融(1)
开源(1)
自动化(1)
压力测试(1)
html5(1)
gui(1)
mybatis(1)
numpy(1)
面向对象编程(1)
dns(1)
线性回归(1)
unity(1)
asp(1)
seo(1)
dubbo(1)
rpc(1)
udp(1)
scikit-learn(1)
模式识别(1)
anaconda(1)
hbase(1)
nat(1)
云计算(1)
unicode(1)
es(1)
学习方法(1)
Elasticsearch Service(1)
app(1)
arraylist(1)
awk(1)
biginteger(1)
case(1)
character(1)
class(1)
classification(1)
commit(1)
conda(1)
copy(1)
data(1)
db(1)
decimal(1)
display(1)
double(1)
dt(1)
explode(1)
expression(1)
file(1)
frame(1)
function(1)
google(1)
hdfs(1)
include(1)
ipv4(1)
lag(1)
line(1)
ls(1)
macbook(1)
math(1)
merge(1)
min(1)
mysql(1)
orders(1)
packet(1)
partition(1)
pip(1)
private(1)
protected(1)
public(1)
random(1)
record(1)
regression(1)
replace(1)
root(1)
row(1)
select(1)
set(1)
sort(1)
sum(1)
svm(1)
synchronous(1)
tail(1)
target(1)
tcp(1)
timedelta(1)
tree(1)
truncate(1)
vector(1)
view(1)
xgboost(1)
编程语言(1)
遍历(1)
磁盘(1)
动态规划(1)
队列(1)
分页(1)
计算机(1)
加密(1)
解决方案(1)
接口设计(1)
进程(1)
连接(1)
内存(1)
内核(1)
排序(1)
权限(1)
事件(1)
树形结构(1)
数组(1)
算法(1)
索引(1)
同步(1)
统计(1)
系统(1)
效率(1)
小游戏(1)
语法(1)
原理(1)
指针(1)
主机(1)
搜索文章
搜索
搜索
关闭
为什么要用Hive?
hive
hadoop
sql
数据库
大数据
Hive是Hadoop生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据或其他和Hadoop集成的文件系统,如MapR-FS、Amazon的S3和像HBase(Hadoop数据仓库)和Cassandra这样的数据库中的数据。
week
2022-11-26
642
0
58同城 Elasticsearch 应用及平台建设实践
Elasticsearch Service
云数据库 SQL Server
kafka
数据库
大数据
导读:Elasticsearch是一个分布式的搜索和分析引擎,可以用于全文检索、结构化检索和分析,并能将这三者结合起来。Elasticsearch基于Lucene开发,现在是使用最广的开源搜索引擎之一。Elasticsearch可以应用于在/离线日志流水、用户标签画像、数据库二级缓存、安全风控行为数据、图数据库索引、监控数据、Wiki文档检索等应用场景。58同城有自己的主搜,而一些内部创新搜索业务和大规模的数据实时OLAP ( On-Line Analytical Processing,联机分析处理 ) 则是使用Elasticsearch。
week
2020-07-20
862
0
移动腾讯网 | 推荐系统 embedding 技术实践总结
特征工程
聚类算法
编程算法
腾讯云开发者社区
大数据
当前主流的推荐系统中,embedding 无处不在,从一定意义上可以说,把 embedding 做好了,整个推荐系统的一个关键难题就攻克了。因此,本文总结了移动腾讯网推荐系统中的 embedding 技术实践,力图达到娱人娱己的目的。
week
2020-05-28
1.6K
1
数据科学研究的现状与趋势全解
大数据
数据库
数据处理
sql
编程算法
大数据时代的到来催生了一门新的学科——数据科学。首先,本文探讨了数据科学的内涵、发展简史、学科地位及知识体系等基本问题,并提出了专业数据科学与专业中的数据科学之间的区别与联系;其次,分析现阶段数据科学的研究特点,并分别提出了专业数据科学、专业中的数据科学及大数据生态系统中的相对热门话题;接着,探讨了数据科学研究中的10个争议及挑战:思维模式的转变(知识范式还是数据范式)、对数据的认识(主动属性还是被动属性)、对智能的认识(更好的算法还是更多的数据)、主要瓶颈(数据密集型还是计算密集型)、数据准备(数据预处理还是数据加工)、服务质量(精准度还是用户体验)、数据分析(解释性分析还是预测性分析)、算法评价(复杂度还是扩展性)、研究范式(第三范式还是第四范式)、人才培养(数据工程师还是数据科学家)。再次,提出了数据科学研究的10个发展趋势:预测模型及相关分析的重视、模型集成及元分析的兴起、数据在先,模式在后或无模式的出现、数据一致性及现实主义的回归、多副本技术及靠近数据原则的广泛应用、多样化技术及一体化应用并存、简单计算及实用主义占据主导地位、数据产品开发及数据科学的嵌入式应用、专家余及公众数据科学的兴起、数据科学家与人才培养的探讨。最后,结合本文工作,为数据科学研究者给出了几点建议和注意事项。
week
2019-12-03
1.8K
0
浅谈推荐系统
大数据
推荐系统
特征工程
编程算法
信息流
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
week
2019-11-20
723
0
Mac搭建Hadoop环境
ssh
hadoop
http
大数据
xml
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
week
2019-09-27
690
0
Hive
hive
hadoop
sql
数据库
大数据
Hive是Hadoop生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据或其他和Hadoop集成的文件系统,如MapR-FS、Amazon的S3和像HBase(Hadoop数据仓库)和Cassandra这样的数据库中的数据。
week
2019-08-29
598
0
HDFS
大数据
node.js
hadoop
spark
apache
HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的,是Apache Hadoop Core项目的一部分。HDFS被设计为可以运行在通用硬件(commodity hardware)上、提供流式数据操作、能够处理超大文件的分布式文件系统。HDFS具有高度容错、高吞吐量、容易扩展、高可靠性等特征,为大型数据集的处理提供了强有力的工具。
week
2019-06-26
1K
0
大数据的特征(4V+1O)
大数据
数据量大(Volume)。第一个特征是数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
week
2019-03-15
4.3K
0
剑指offer 数据流中的中位数
大数据
链接:https://www.nowcoder.com/questionTerminal/9be0172896bd43948f8a32fb954e1be1 来源:牛客网 如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
week
2018-12-27
410
0
windows搭建hadoop分布式系统架构
hadoop
xml
java
http
大数据
1、下载hadoop的安装包:http://hadoop.apache.org/->Releases->mirror site
week
2018-08-24
593
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档