腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器学习与统计学
专栏作者
举报
793
文章
1091344
阅读量
96
订阅数
订阅专栏
申请加入专栏
全部文章(793)
编程算法(282)
机器学习(202)
神经网络(156)
python(153)
深度学习(133)
https(111)
人工智能(104)
网络安全(97)
数据分析(59)
r 语言(50)
github(45)
git(37)
决策树(29)
开源(28)
numpy(28)
模型(27)
线性回归(26)
matlab(25)
tensorflow(22)
数据(22)
数据库(19)
http(19)
sql(17)
大数据(14)
云计算(13)
pytorch(10)
数据结构(10)
scikit-learn(9)
云数据库 SQL Server(8)
监督学习(8)
keras(8)
windows(8)
数据可视化(8)
工作(8)
函数(8)
NLP 服务(7)
c++(7)
javascript(7)
html(7)
api(7)
linux(7)
网站(7)
数据处理(7)
数据挖掘(6)
java(6)
批量计算(6)
腾讯云测试服务(6)
markdown(6)
gpt(6)
工具(6)
论文(6)
数学(6)
性能(6)
css(5)
ide(5)
文件存储(5)
图像处理(5)
缓存(5)
爬虫(5)
hadoop(5)
卷积神经网络(5)
kernel(5)
anaconda(5)
统计(5)
c 语言(4)
php(4)
bash(4)
node.js(4)
unix(4)
mapreduce(4)
容器(4)
游戏(4)
强化学习(4)
正则表达式(4)
机器人(4)
学习方法(4)
chatgpt(4)
自动驾驶(3)
go(3)
bootstrap(3)
命令行工具(3)
yarn(3)
shell(3)
图像识别(3)
scrapy(3)
腾讯云开发者社区(3)
plot(3)
shift(3)
测试(3)
基础(3)
技巧(3)
数据科学(3)
算法(3)
优化(3)
官方文档(2)
actionscript(2)
xml(2)
json(2)
云数据库 Redis(2)
postgresql(2)
打包(2)
vba(2)
搜索引擎(2)
中文分词(2)
apache(2)
访问管理(2)
视频处理(2)
企业(2)
serverless(2)
存储(2)
自动化(2)
无人驾驶(2)
hive(2)
opencv(2)
微信(2)
fpga(2)
特征工程(2)
excel(2)
jupyter(2)
openai(2)
precision(2)
spss(2)
变量(2)
博客(2)
部署(2)
翻译(2)
集合(2)
教程(2)
开发(2)
设计(2)
事件(2)
视频(2)
原理(2)
字符串(2)
云点播(1)
对象存储(1)
人脸识别(1)
mac os(1)
react(1)
jquery(1)
android(1)
qt(1)
单片机(1)
oracle(1)
nosql(1)
flask(1)
ubuntu(1)
bash 指令(1)
日志服务(1)
TDSQL MySQL 版(1)
数据库一体机 TData(1)
音视频点播加速(1)
SSL 证书(1)
图片标签(1)
机器翻译(1)
大数据处理套件 TBDS(1)
云推荐引擎(1)
医疗(1)
渲染(1)
electron(1)
分布式(1)
运维(1)
gui(1)
面向对象编程(1)
推荐系统(1)
grep(1)
tcp/ip(1)
udp(1)
无监督学习(1)
安全(1)
物联网(1)
haskell(1)
nest(1)
sdn(1)
聚类算法(1)
jupyter notebook(1)
ipv6(1)
迁移(1)
flink(1)
程序人生(1)
数据库管理(1)
数据湖(1)
汽车(1)
alpha(1)
altair(1)
amp(1)
app(1)
axis(1)
com(1)
component(1)
copy(1)
correlation(1)
csv(1)
curve(1)
data(1)
difference(1)
el(1)
explorer(1)
heatmap(1)
int(1)
kaggle(1)
label(1)
math(1)
matrix(1)
mean(1)
meta(1)
model(1)
object(1)
partial(1)
pdf(1)
pip(1)
pivot(1)
random(1)
sample(1)
scipy(1)
self(1)
solver(1)
space(1)
stack(1)
subplot(1)
subset(1)
sum(1)
table(1)
title(1)
txt(1)
var(1)
view(1)
word(1)
z3(1)
编辑器(1)
遍历(1)
编码(1)
编译(1)
产品经理(1)
程序员(1)
对象(1)
行业(1)
互联网(1)
计算机(1)
脚本(1)
开发者(1)
可视化(1)
框架(1)
连接(1)
命令行(1)
入门(1)
实践(1)
手机(1)
数组(1)
搜索(1)
索引(1)
调试(1)
图表(1)
移动端(1)
源码(1)
语音助手(1)
机器学习算法(1)
玩转腾讯混元大模型(1)
搜索文章
搜索
搜索
关闭
Python新工具:用三行代码提取PDF表格数据
apache
PDF 文件是一种非常常用的文件格式,通常用于正式的电子版文件。它能够很好的将不同的排版格式固定下来,形成版面清晰且美观的展示效果。然而,对于想要从 PDF 中提取信息的人们来说,PDF 是个噩梦,尤其是表格。
统计学家
2019-10-22
930
0
将Hadoop作为基于云的托管服务的优劣势分析
hadoop
大数据
mapreduce
yarn
apache
Apache Hadoop是一种开源软件框架,能够对分布式集群上的大数据集进行高吞吐量处理。Apache模块包括Hadoop Common,这是一组常见的实用工具,可以通过模块来运行。这些模块还包括:Hadoop分布式文件系统(HDFS)、用于任务调度和集群资源管理的 Hadoop YARN以及Hadoop MapReduce,后者是一种基于YARN的系统,能够并行处理庞大的数据集。 Apache还提供了另外的开源软件,可以在Hadoop上运行,比如分析引擎Spark(它也能独立运行)和编程语言Pig。 Hadoop 之所以广受欢迎,就是因为它为使用大众化硬件处理大数据提供了一种几乎没有限制的环境。添加节点是个简单的过程,对这个框架没有任何负面影响。 Hadoop具有高扩展性,能够从单单一台服务器灵活扩展到成千上万台服务器,每个集群运行自己的计算和存储资源。Hadoop在应用程序层面提供了高可用性,所以集群硬件可以是现成的。 实际的使用场合包括:在线旅游(Hadoop声称它是80%的网上旅游预订业务的可靠的大数据平台)、批量分析、社交媒体应用程序提供和分析、供应链优化、移动数据管理、医疗保健及更多场合。 它有什么缺点吗? Hadoop很复杂,需要大量的员工时间和扎实的专业知识,这就阻碍了它在缺少专业IT人员的公司企业的采用速度。由于需要专家级管理员,加上广泛分布的集群方面需要庞大的成本支出,从中获得商业价值也可能是个挑战。I 集群管理也可能颇为棘手。虽然Hadoop统一了分布式计算,但是配备和管理另外的数据中心、更不用说与远程员工打交道,增添了复杂性和成本。结果就是,Hadoop集群可能显得过于孤立。
统计学家
2019-04-10
2K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档