腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

AILearning

专栏作者

89

文章

184511

阅读量

48

订阅数

scikit-learn（sklearn） 0.19 中文文档的翻译计划，邀请你的加入 | ApacheCN

本文主要介绍了如何用Python和Scikit-learn库进行机器学习，包括数据预处理、模型训练和评估等。同时，文章还分享了如何组织线下聚会活动，以及参与社区讨论的方法和技巧。

2018-01-05

8610

Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN

本文介绍了基于R语言的SparkR和基于Python的Spark-Python两个大数据平台的交互方式。主要内容包括：1.基于R语言的SparkR，支持R语言的所有统计函数和绘图功能；2.基于Python的Spark-Python，支持Python的多种数据处理和机器学习库；3.通过SparkR和Spark-Python交互，实现大数据的交互式分析。

2018-01-05

2.2K0

Apache Spark 2.2.0 中文文档 - 集群模式概述 | ApacheCN

本文介绍了 Apache Spark 的集群模式概述，包括集群管理、提交应用程序、监控等方面的内容。

2018-01-05

8630

Apache Spark 2.2.0 中文文档 - Structured Streaming 编程指南 | ApacheCN

本文介绍了 Structured Streaming 是如何逐步从 Apache Spark 生态系统中发展起来的，以及其设计理念和实现方式。本文还介绍了 Structured Streaming 在实际应用中的优势，包括与批处理计算的关系、与 Apache Kafka 的集成、以及在高吞吐和低延迟场景下的性能表现。此外，本文还提供了若干实例，以展示 Structured Streaming 在各种应用场景中的实际效果。

2018-01-05

5.2K0

Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN

spark 数据处理 hadoop apache

2018-01-05

2K0

Apache Zeppelin 中 HDFS文件系统解释器

spark hadoop apache

概述 Hadoop文件系统是hadoop项目的分布式，容错文件系统的一部分，通常用作Hadoop MapReduce和Apache Spark或Alluxio等底层文件系统等分布式处理引擎的存储

2018-01-05

9500

Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN

spark 数据处理 apache

本文介绍了基于Spark的SQL编程的常用概念和技术。首先介绍了Spark的基本概念和架构，然后详细讲解了Spark的数据类型和SQL函数，最后列举了一些Spark在实际应用中的例子。

2018-01-05

25.9K0

Apache Spark 2.2.0 中文文档 - GraphX Programming Guide | ApacheCN

spark 数据处理 apache

本文介绍了基于Spark GraphX框架的图计算和机器学习应用，包括PageRank、社区检测、相似性度量、分类和聚类等。同时，本文还介绍了如何通过Spark GraphX实现图算法和机器学习算法的代码示例。

2018-01-05

2.8K0

Apache Spark 2.2.0 中文文档

2018-01-05

2K0

Apache Zeppelin 中 R 解释器

本文介绍了如何在Apache Zeppelin中集成R语言解释器，并使用R语言进行数据分析。首先介绍了如何在Zeppelin中添加R解释器，然后讲解了R语言的基础知识和基本函数，最后介绍了如何在Zeppelin中使用R语言进行数据分析。

2018-01-05

1.5K0

什么是Apache Zeppelin?

多用途笔记本笔记本是满足您所有需求的地方

2018-01-05

4.9K0

Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

本文介绍了如何使用 Spark 进行大数据处理，首先介绍了 Spark 的基本概念和架构，然后通过一个简单的例子展示了如何使用 Spark 进行数据处理。最后，本文还介绍了 Spark 的部署方式，包括本地部署和集群部署。

2018-01-05

1.3K0

Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN

spark linux apache

本文介绍了Apache Spark的概述、技术原理、特性、使用场景以及和传统大数据处理框架的对比。Spark支持多种编程语言，具有高性能、易用性强、生态系统丰富等特点。作者还介绍了如何在集群环境中部署Spark，以及与其他大数据处理框架的对比。

2018-01-05

1.9K0

Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN

2018-01-05

8330

Apache Zeppelin 中 Python 2＆3解释器

python spark apache

配置属性默认描述 zeppelin.python python 已经安装的Python二进制文件的路径（可以是python2或python3）。如果python不在您的$ PATH中，您可以设

2018-01-05

2.6K0

Apache Zeppelin 中 Spark 解释器

概述 Apache Spark是一种快速和通用的集群计算系统。它提供Java，Scala，Python和R中的高级API，以及支持一般执行图的优化引擎。Zeppelin支持Apache Spark

2018-01-05

3.8K0

Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN

spark 数据处理 apache

本文介绍了 Apache Spark 的 RDD 程序设计指南，从 RDD 的基本概念、创建与操作、缓存与存储、性能优化等方面进行了详细阐述，并提供了丰富的实例和代码以帮助读者更好地理解和掌握 RDD 的使用方法。

2018-01-05

1.6K0

Apache Spark 2.2.0 中文文档 - Spark RDD（Resilient Distributed Datasets）论文 | ApacheCN

spark hadoop apache

本文介绍了基于Apache Spark的分布式大数据处理框架，从RDD、DataFrame、Dataset、Streaming等组件的角度讲解了Spark的基本特性、架构和实现原理。同时，本文还通过多个实际应用案例，详细介绍了Spark在大数据处理、实时计算、机器学习和深度学习等领域的应用实践。此外，本文还讨论了Spark与其他大数据处理框架（如Hadoop、Storm等）的对比和选择。

2017-12-29

9610

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态