首页
学习
活动
专区
工具
TVP
发布

AILearning

专栏作者
89
文章
184511
阅读量
48
订阅数
scikit-learn(sklearn) 0.19 中文文档的翻译计划,邀请你的加入 | ApacheCN
本文主要介绍了如何用Python和Scikit-learn库进行机器学习,包括数据预处理、模型训练和评估等。同时,文章还分享了如何组织线下聚会活动,以及参与社区讨论的方法和技巧。
片刻
2018-01-05
8610
Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
本文介绍了基于R语言的SparkR和基于Python的Spark-Python两个大数据平台的交互方式。主要内容包括:1.基于R语言的SparkR,支持R语言的所有统计函数和绘图功能;2.基于Python的Spark-Python,支持Python的多种数据处理和机器学习库;3.通过SparkR和Spark-Python交互,实现大数据的交互式分析。
片刻
2018-01-05
2.2K0
Apache Spark 2.2.0 中文文档 - 集群模式概述 | ApacheCN
本文介绍了 Apache Spark 的集群模式概述,包括集群管理、提交应用程序、监控等方面的内容。
片刻
2018-01-05
8630
Apache Spark 2.2.0 中文文档 - Structured Streaming 编程指南 | ApacheCN
本文介绍了 Structured Streaming 是如何逐步从 Apache Spark 生态系统中发展起来的,以及其设计理念和实现方式。本文还介绍了 Structured Streaming 在实际应用中的优势,包括与批处理计算的关系、与 Apache Kafka 的集成、以及在高吞吐和低延迟场景下的性能表现。此外,本文还提供了若干实例,以展示 Structured Streaming 在各种应用场景中的实际效果。
片刻
2018-01-05
5.2K0
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
片刻
2018-01-05
2K0
Apache Zeppelin 中 HDFS文件系统 解释器
概述 Hadoop文件系统是hadoop项目的分布式,容错文件系统的一部分,通常用作Hadoop MapReduce和Apache Spark或Alluxio等底层文件系统等分布式处理引擎的存储
片刻
2018-01-05
9500
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
本文介绍了基于Spark的SQL编程的常用概念和技术。首先介绍了Spark的基本概念和架构,然后详细讲解了Spark的数据类型和SQL函数,最后列举了一些Spark在实际应用中的例子。
片刻
2018-01-05
25.9K0
Apache Spark 2.2.0 中文文档 - GraphX Programming Guide | ApacheCN
本文介绍了基于Spark GraphX框架的图计算和机器学习应用,包括PageRank、社区检测、相似性度量、分类和聚类等。同时,本文还介绍了如何通过Spark GraphX实现图算法和机器学习算法的代码示例。
片刻
2018-01-05
2.8K0
Apache Spark 2.2.0 中文文档
片刻
2018-01-05
2K0
Apache Zeppelin 中 R 解释器
本文介绍了如何在Apache Zeppelin中集成R语言解释器,并使用R语言进行数据分析。首先介绍了如何在Zeppelin中添加R解释器,然后讲解了R语言的基础知识和基本函数,最后介绍了如何在Zeppelin中使用R语言进行数据分析。
片刻
2018-01-05
1.5K0
什么是Apache Zeppelin?
多用途笔记本 笔记本是满足您所有需求的地方
片刻
2018-01-05
4.9K0
Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN
本文介绍了如何使用 Spark 进行大数据处理,首先介绍了 Spark 的基本概念和架构,然后通过一个简单的例子展示了如何使用 Spark 进行数据处理。最后,本文还介绍了 Spark 的部署方式,包括本地部署和集群部署。
片刻
2018-01-05
1.3K0
Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
本文介绍了Apache Spark的概述、技术原理、特性、使用场景以及和传统大数据处理框架的对比。Spark支持多种编程语言,具有高性能、易用性强、生态系统丰富等特点。作者还介绍了如何在集群环境中部署Spark,以及与其他大数据处理框架的对比。
片刻
2018-01-05
1.9K0
Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN
片刻
2018-01-05
8330
Apache Zeppelin 中 Python 2&3解释器
配置 属性 默认 描述 zeppelin.python python 已经安装的Python二进制文件的路径(可以是python2或python3)。如果python不在您的$ PATH中,您可以设
片刻
2018-01-05
2.6K0
Apache Zeppelin 中 Spark 解释器
概述 Apache Spark是一种快速和通用的集群计算系统。它提供Java,Scala,Python和R中的高级API,以及支持一般执行图的优化引擎。Zeppelin支持Apache Spark
片刻
2018-01-05
3.8K0
Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN
本文介绍了 Apache Spark 的 RDD 程序设计指南,从 RDD 的基本概念、创建与操作、缓存与存储、性能优化等方面进行了详细阐述,并提供了丰富的实例和代码以帮助读者更好地理解和掌握 RDD 的使用方法。
片刻
2018-01-05
1.6K0
Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN
本文介绍了基于Apache Spark的分布式大数据处理框架,从RDD、DataFrame、Dataset、Streaming等组件的角度讲解了Spark的基本特性、架构和实现原理。同时,本文还通过多个实际应用案例,详细介绍了Spark在大数据处理、实时计算、机器学习和深度学习等领域的应用实践。此外,本文还讨论了Spark与其他大数据处理框架(如Hadoop、Storm等)的对比和选择。
片刻
2017-12-29
9610
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档