ApacheSpark - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

荐读|掌握10到30种技术，只为创建一个大数据解决方案

根据最近的Databricks对ApacheSpark用户的调查，Spark到公共云的部署在过去一年中增长了10%，达到了总体部署的61%。

5837 0

2017年五大关键云趋势：容器、AI等

该平台使用机器学习和ApacheSpark自动化在IBMCloud上智能部署数据产品。此外，Google也在去年发布了一系列云计算服务。

6195 0

您找到你想要的搜索结果了吗？

是的

没有找到

在LinkedIn上搭建机器学习模型

· PhotonML: PhotonML是一个基于ApacheSPark的机器学习库。...虽然TensorFlow工作流在ApacheSPark这样的基础设施上得到了广泛的支持，但SEAR仍然被机器学习社区所忽略。

7820 0

R并行编程实战

《R并行编程实战》是一本构建大规模高效算法的综合性实用书籍，介绍各种并行技术，从R语言的并行版本lapply（）的简单应用到基于Hadoop和ApacheSpark框架的不错AWS云。

6002 0

大数据处理必备的十大工具！

10.ApacheSpark ApacheSpark是Hadoop开源生态系统的新成员。它提供了一个比Hive更快的查询引擎，因为它依赖于自己的数据处理框架而不是依靠Hadoop的HDFS服务。

3.1K7 0

实时股票预测的开源参考结构

Apache, Apache Hadoop, Hadoop, Apache Geode,Apache MADlib, Apache HAWQ, and ApacheSpark are either registered...Apache, Apache Hadoop, Hadoop, Apache Geode,Apache MADlib, Apache HAWQ, and ApacheSpark are either registered

1.1K8 0

5种云计算所需的机器学习技能

Python是一种流行的编程语言，可以与批处理和流处理平台(如apachebeam)和分布式计算平台(如apachespark)一起使用。

1.1K1 0

【最新】IBM 深度学习框架PowerAI，将训练时间从几周变成几小时

集成了 ApacheSpark 的 IBM Spectrum Conductor 集群虚拟化软件集成，轻松转换非结构化和结构化数据集，为其用于深度学习训练做准备。

1K7 0

专访英特尔STO马子雅：开源BigDL，AI 民主化的一步妙棋

今年2月波士顿举行了 Spark 峰会，在大会开幕主题演讲上，斯坦福大学教授、ApacheSpark 创建者、Databricks CTO Matei Zaharia 高度评价了 BigDL；到目前为止...它提供了在 ApacheSpark 上丰富的深度学习功能（和现有框架如 Caffe 和 Torch 等功能一致），以帮助 Hadoop/Spark 成为一个统一的数据分析平台，为整个数据分析和机器学习过程

1K11 0

《BigData赴美考察记》一：走进加州伯克利，带你了解真实的RISE实验室

曾主导研发了当今大数据计算领域最前沿的开源系统：ApacheSpark、ApacheMesos、以及Alluxio (又名“Tachyon”)。

1.1K6 0

【存储】2022 年的 4 个开源对象存储平台

使用ApacheSpark、Thread和Hive等框架的应用程序在本地运行，无需任何修改。Ozone建立在一个名为Hadoop分布式数据存储（HDD）的高可用复制块存储层上。

12.3K1 0

Facebook、亚马逊是如何构建超集群数据库的

以下是上述文章中数据架构的简化视图，其中显示：开源系统ApacheKafka，搜索服务器ElasticSearch，亚马逊云存储服务AWSS3，进行大数据处理的ApacheSpark，运行框架ApacheHadoop

1.4K5 0

「图型计算架构」GraphTech生态系统2019-第2部分：图形分析

GraphX于2014年推出，是在apachespark之上构建的用于并行计算的嵌入式图形处理框架。后来又引入了一些其他系统，例如信号/采集。

8152 0

【盘点】十大最受欢迎的开源大数据技术

方便你做出可数据驱动的、可交互且可协作的精美文档，并且支持多种语言，包括Scala(使用ApacheSpark)、Python(ApacheSpark)、SparkSQL、Hive、Markdown、Shell

1.8K9 0

Spark生态系统的顶级项目

这是Github的描述：spark-jobserver提供了一个RESTful接口，用于提交和管理ApacheSpark作业，jar和作业内容。

1.4K2 0

年前干货 | 数据工程师必备的学习资源（附链接）

除此之外，你还需要了解ApacheSpark、Hive、Pig、Kafka等平台和框架，我在本节列出了所有这些主题的资源。 Hadoop和MapReduce ?...Spark的基础知识： https://cognitiveclass.ai/courses/what-is-spark/ ApacheSpark和AWS简介：这是一门以实践为中心的课程。...ApacheSpark和AWS简介： https://www.coursera.org/learn/bigdata-cluster-apache-spark-and-aws 涵盖Hadoop、Spark

1.1K2 0

Java 开发者最值得学习的 14 项技能

ApacheSpark 和 Kafka Apache Spark 和 Kafka 是 2021 年 Java 开发人员一定要掌握的两项技术；它们在 2018 年底已发布稳定版本。

1.3K3 0

全球最强开源模型一夜易主，1320亿参数推理飙升2倍！

这个新的数据集，使用全套数据库工具开发，包括用于数据处理的ApacheSpark™和Databricks笔记本，用于数据管理和治理的Unity Catalog，以及用于实验追踪的MLFlow。...用户可以通过Unity Catalog中集中管理训练数据，使用ApacheSpark和Lilac AI提供的工具和服务进行处理和清理。

2571 0

如何与多个云供应商更好的合作

微软公司、谷歌和亚马逊网络服务（AWS）还提供了专业集群设计，例如大数据和分析工作负载的支持，其产品包括Hadoop和ApacheSpark。

1.8K9 0

【神兵利器】内网快速打点辅助工具

Druid √ 仅验证未授权访问 18 activemq √ 仅验证默认账户 20 couchdb √ 仅验证未授权访问 21 Hadoop-Administration √ 仅验证未授权访问 22 ApacheSpark

4511 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭