开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

向RDD添加字段/从RDD选择字段

向RDD添加字段/从RDD选择字段是指在分布式数据集（RDD）中添加新的字段或选择已有字段的操作。

在云计算领域中，RDD是一种基本的数据结构，用于在大规模数据集上进行并行计算。RDD是不可变的，即不能直接修改其内容，但可以通过转换操作来创建新的RDD。

要向RDD添加字段，可以使用map转换操作。通过定义一个函数，该函数接受RDD中的每个元素作为输入，并返回一个包含新字段的元组或对象。然后，将该函数应用于RDD，生成一个新的RDD，其中包含添加了新字段的元素。

例如，假设有一个包含学生信息的RDD，包括学生姓名和年龄。要向RDD添加一个新字段“性别”，可以使用以下代码：

def add_gender(student):
    # 假设根据姓名判断性别
    if student[0] == "张三":
        gender = "男"
    else:
        gender = "女"
    return (student[0], student[1], gender)

students = [("张三", 20), ("李四", 22), ("王五", 21)]
students_with_gender = students.map(add_gender)

在上述示例中，add_gender函数根据学生姓名判断性别，并返回一个包含姓名、年龄和性别的元组。然后，将该函数应用于students RDD，生成一个新的RDD students_with_gender，其中包含添加了性别字段的学生信息。

从RDD选择字段可以使用map转换操作或者使用select方法。通过定义一个函数或选择需要的字段，可以创建一个新的RDD，其中只包含所选字段。

例如，假设有一个包含学生信息的RDD，包括学生姓名、年龄和性别。要选择只包含姓名和性别字段的新RDD，可以使用以下代码：

def select_fields(student):
    return (student[0], student[2])

students = [("张三", 20, "男"), ("李四", 22, "女"), ("王五", 21, "男")]
selected_fields = students.map(select_fields)

在上述示例中，select_fields函数选择了学生姓名和性别字段，并返回一个只包含这两个字段的元组。然后，将该函数应用于students RDD，生成一个新的RDD selected_fields，其中只包含选择的字段。

在腾讯云中，可以使用TencentDB for Redis来存储和处理RDD数据。TencentDB for Redis是一种高性能、可扩展的内存数据库，适用于缓存、会话存储和实时分析等场景。您可以通过以下链接了解更多关于TencentDB for Redis的信息：TencentDB for Redis产品介绍。

请注意，以上答案仅供参考，具体的实现方式和推荐产品可能因实际需求和环境而异。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

自学Apache Spark博客(节选)

作者：Kumar Chinnakali 译者：java达人来源：http://dataottam.com/2016/01/10/self-learn-yourself-apache-spark-in-21-blogs-3/（点击文末阅读原文前往）一、 Spark项目最初由加州大学伯克利分校AMP实验室的Matei在2009年发起，并在2010年根据BSD协议开源。2013年，该项目捐献给Apache软件基金会，转为Apache2.0 协议。2014年二月，Spark成为Apache重点项目。201

09

2021年大数据Spark（二十六）：SparkSQL数据处理分析

在SparkSQL模块中，将结构化数据封装到DataFrame或Dataset集合中后，提供两种方式分析处理数据，正如前面案例【词频统计WordCount】两种方式：

02

强者联盟——Python语言结合Spark框架

框架由Scala语言开发，原生提供4种API，Scala、Java、Python以及最近版本开始支持的R。Python不是Spark的“亲儿子”，在支持上要略差一些，但基本上常用的接口都支持。得益于在数据科学中强大的表现，Python语言的粉丝遍布天下，如今又遇上强大的分布式内存计算框架Spark，两个领域的强者走到一起，自然能碰出更加强大的火花（Spark可以翻译为火花），因此PySpark是本节的主角。

03

pyspark读取pickle文件内容并存储到hive

在平常工作中，难免要和大数据打交道，而有时需要读取本地文件然后存储到Hive中，本文接下来将具体讲解。

01

简单回答：SparkSQL数据抽象和SparkSQL底层执行过程

就易用性而言，对比传统的MapReduce API，Spark的RDD API有了数量级的飞跃并不为过。然而，对于没有MapReduce和函数式编程经验的新手来说，RDD API仍然存在着一定的门槛。

03

Spark 原理与实践 | 青训营笔记

Spark 于 2009 年诞生于加州大学伯克利分校 AMPLab，2013 年被捐赠给 Apache 软件基金会，2014 年 2 月成为 Apache 的顶级项目。相对于 MapReduce 的批处理计算，Spark 可以带来上百倍的性能提升，因此它成为继 MapReduce 之后，最为广泛使用的分布式计算框架。

01

Spark系列 - (3) Spark SQL

Hive：Hadoop刚开始出来的时候，使用的是hadoop自带的分布式计算系统 MapReduce，但是MapReduce的使用难度较大，所以就开发了Hive。Hive的出现解决了MapReduce的使用难度较大的问题，Hive的运行原理是将HQL语句经过语法解析、逻辑计划、物理计划转化成MapReduce程序执行。

01

PySpark︱DataFrame操作指南：增/删/改/查/合并/统计与数据处理

笔者最近需要使用pyspark进行数据整理，于是乎给自己整理一份使用指南。pyspark.dataframe跟pandas的差别还是挺大的。

01

第三天：SparkSQL

Spark SQL是Spark用来处理结构化数据的一个模块，它提供了2个编程抽象：DataFrame和DataSet，并且作为分布式SQL查询引擎的作用。我们已经学习了Hive，它是将Hive SQL转换成MapReduce然后提交到集群上执行，大大简化了编写MapReduc的程序的复杂性，由于MapReduce这种计算模型执行效率比较慢。所有Spark SQL的应运而生，它是将Spark SQL转换成RDD，然后提交到集群执行，执行效率非常快！

01

2021年大数据Spark（二十五）：SparkSQL的RDD、DF、DS相关操作

Spark 2.0开始，SparkSQL应用程序入口为SparkSession，加载不同数据源的数据，封装到DataFrame/Dataset集合数据结构中，使得编程更加简单，程序运行更加快速高效。

03

2021年大数据Spark（二十四）：SparkSQL数据抽象

就易用性而言，对比传统的MapReduce API，Spark的RDD API有了数量级的飞跃并不为过。然而，对于没有MapReduce和函数式编程经验的新手来说，RDD API仍然存在着一定的门槛。

01

2021年大数据Spark（二十七）：SparkSQL案例一花式查询和案例二WordCount

前面使用RDD封装数据，实现词频统计WordCount功能，从Spark 1.0开始，一直到Spark 2.0，建立在RDD之上的一种新的数据结构DataFrame/Dataset发展而来，更好的实现数据处理分析。DataFrame 数据结构相当于给RDD加上约束Schema，知道数据内部结构（字段名称、字段类型），提供两种方式分析处理数据：DataFrame API（DSL编程）和SQL（类似HiveQL编程），下面以WordCount程序为例编程实现，体验DataFrame使用。

03

基于Spark对消费者行为数据进行数据分析开发案例

在日常工作当中，经常遇到基于Spark去读取存储在HDFS中的批量文件数据进行统计分析的案例，这些文件一般以csv或者txt文件格式存在。例如，存在这样一份消费者行为数据，字段包括消费者姓名,年龄,性别,月薪,消费偏好,消费领域,购物平台,支付方式,单次购买商品数量,优惠券获取情况,购物动机。

00

数据处理日常之Spark-Stage与Shuffle

Spark Stage, DAG(Directed Acyclic Graph) Spark 划分 Stage 的依据是其根据提交的 Job 生成的 DAG，在离散数学中我们学到了一个有向无环图(Directed Acyclic Graph) 的概念，再生产环境中，我写的任务仅仅是有向树(Directed tree) 级别，有向无环图还未遇到过。但是可以想象到，如果在代码中使用了 RDD 的 join 算子是有可能出现有向无环图的 DAG。对于我们组所使用的日志数据处理，主要还是集中在有向树复杂

03

初识 Spark SQL | 20张图详解 Spark SQL 运行原理及数据抽象

不管是做平台的，还是做应用的，都免不了跟 SQL 打交道。一句“SQL Boy”，虽然是大家的自嘲，但也能说明大数据工程师们跟 SQL 的关系之紧密。

08

Spark SQL 整体介绍

sparksession rdd sparkcontext sparksql sqlcontent dstream streammingcontext hivesql hivecontext

01

Spark SQL 数据统计 Scala 开发小结

本文介绍了如何在 Spark 中使用 DataFrame 和 Dataset 进行数据操作，包括数据读取、数据转换、数据聚合、数据排序和数据分组等操作。同时，还介绍了如何使用 Spark Streaming 进行实时数据处理，以及如何使用 Spark SQL 进行 SQL 查询。

Spark RDD编程指南

在高层次上，每个 Spark 应用程序都包含一个驱动程序，该驱动程序运行用户的主要功能并在集群上执行各种并行操作。 Spark 提供的主要抽象是弹性分布式数据集 (RDD)，它是跨集群节点分区的元素集合，可以并行操作。 RDD 是通过从 Hadoop 文件系统（或任何其他 Hadoop 支持的文件系统）中的文件或驱动程序中现有的 Scala 集合开始并对其进行转换来创建的。用户还可以要求 Spark 将 RDD 持久化到内存中，以便在并行操作中有效地重用它。最后，RDD 会自动从节点故障中恢复。

01

2021年大数据Spark（二十三）：SparkSQL 概述

Spark SQL允许开发人员直接处理RDD，同时可以查询在Hive上存储的外部数据。Spark SQL的一个重要特点就是能够统一处理关系表和RDD，使得开发人员可以轻松的使用SQL命令进行外部查询，同时进行更加复杂的数据分析。

02

Spark学习之键值对（pair RDD）操作（3）

本文介绍了Spark中Pair RDD操作，包括如何从一个RDD中提取字段作为键，如何创建和转换Pair RDD，以及针对两个Pair RDD的转换操作等。此外，还介绍了Pair RDD的数据分区方式，包括自定义分区方式和HashPartitioner分区方式等。

Spark Day06：Spark Core之Spark 内核调度和SparkSQL快速入门

ShuffleMapTask要进行Shuffle，ResultTask负责返回计算结果，一个Job中只有最后的Stage采用ResultTask，其他的均为ShuffleMapTask。

02

Spark之【SparkSQL编程】系列(No3)——《RDD、DataFrame、DataSet三者的共性和区别》

本篇作为【SparkSQL编程】系列的第三篇博客,为大家介绍的是RDD、DataFrame、DataSet三者的共性和区别。

03

SparkSQL 整体介绍

是什么 SparkSql 是Spark提供的高级模块，用于处理结构化数据，开发人员可以使用HiveQL 和SQL语言实现基于RDD的大数据分析，底层基于RDD进行操作，是一种特殊的RDD，DataFrameRDD类型 1. 将SQL查询与Spark无缝混合，可以使用SQL或者DataFrame API在Spark中进行结构化数据查询 2. 提供了统一的数据访问接口，包括Hive，Avro，Parquet，ORC，Json及JDBC 3. 可以在现有的Hive上运行SQL或HiveQL进行查询，完全兼容HiveQL，原来对Hive的SQL操作可以迁移到Spark上 4. 可以为商业智能工具提供JDBC或ODBC连接 SparkSql 与RDD 的区别 RDD就是SparkCore，对于一般开发人员来说，基于RDD的Spark数据分析并不友好，SparkCore提供了大量的RDD接口进行操作，开发人员需要记忆大量的API接口，而且操作效率不一定最优化。 SparkSQl体层也是调用RDD进行操作，只不过对底层调用的RDD进行了封装，为DataFrameRDD。SparkSQL 执行语句类似SQL语法，对于数据SQL语句的开发人员来说，容易上手，开发效率高。并且基于DataFrameRDD的RDD对底层RDD进行了优化，执行效率更高。 SparkSql 与Hive的区别 SparkSQL底层是基于Spark，调用RDD进行数据处理，Hive底层是基于Hdfs的Yarn进行任务调度，调用MapReduce 进行数据处理。SparkSQl扮演的角色和Hive是一样的，只不过一个是基于Spark，一个基于Hdfs，一个底层调用RDD，一个底层调用MapReduce进行数据处理。所以说SparkSQL就是修改了Hive的底层调用逻辑，把原来的MapReduce引擎修改为RDD引擎，完全兼容HiveSQl语法。 SparkSql 优势 1. 基于RDD，对基础RDD进行了封装，提供了更加高效的DataFrameRDD，运行效率更加高效 2. 基于HiveSQL，提供了类似SQL的语法操作，方便数据SQL语法的开发人员进行Spark数据开发。 3. 提供了同意的数据访问接口，包括JDBC，Hive，Json等 4. 对BI提供了JDBC和ODBC的连接。 SparkSql 重要概念 1. SQL：SQL语句，提供了SQL语法，可以像操作本地数据库一样对基于Spark的大数据进行数据分析 2. DataFrame：数据集，对RDD的底层进了封装，可过DataFrame可以直接进行数据分析 3. Schema：模式，对于存在于Hdfs的文本数据，需要定义模式，简单来说就是需要指定表头定义，包括字段名称，类型等信息，类似于数据库中的表定义，只有定义了Schema模式，才能对DataFrame数据进行SQL分析。 4. SparkSQL版本：目前SparkSQL版本有1.x 和 2.x , 2.x版本开发中对数据操作与1.x 有差别，不过2.x 对 1.x 是兼容的。 5. SparkContext：SparkContext 是1.x 中 SparkSQL的创建形式，需要指定SparkConf 配置文件等信息 6. SparkSession：SparkSession是2.x 中的 SparkSQL的创建形式，支持直接进行数据设置。 SparkSql 代码编写基于1.x 的SparkSQL 创建执行 1. 创建SparkConf及SparkContext 2. 创建RDD 3. 转换RDD字段 4. 创建SparkSchema 5. 结合RDD字段和Schema，生成DataFrameRDD 6. 执行SparkSQL语句 7. 提交SparkSession 会话（因为前面接口都为Transformation 类型）基于2.x 的SparkSQL创建执行 1. 创建SparkSession 2. 创建RDD 3. 转换RDD字段 4. 定义SparkSchema 5. 指定Schema。此时RDD已经为DataFrameRDD 6. 执行SparkSQL语法 7. 提交会话，查看结构以上是对SparkSQL的一个整体介绍，后面会对Spar

01

Spark（RDD,CSV）创建DataFrame方式

spark将csv转换为DataFrame,可以先文件读取为RDD，然后再进行map操作，对每一行进行分割。再将schema和rdd分割后的Rows回填，sparkSession创建的dataFrame

01

Spark SQL 快速入门系列(4) | RDD、DataFrame、DataSet三者的共性和区别

在 SparkSQL 中 Spark 为我们提供了两个新的抽象，分别是DataFrame和DataSet。他们和RDD有什么区别呢？首先从版本的产生上来看：

03

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（二）

【导读】笔者（许鹏）看Spark源码的时间不长，记笔记的初衷只是为了不至于日后遗忘。在源码阅读的过程中秉持着一种非常简单的思维模式，就是努力去寻找一条贯穿全局的主线索。在笔者看来，Spark中的线索就是如何让数据的处理在分布式计算环境下是高效，并且可靠的。在对Spark内部实现有了一定了解之后，当然希望将其应用到实际的工程实践中，这时候会面临许多新的挑战，比如选取哪个作为数据仓库，是HBase、MongoDB还是Cassandra。即便一旦选定之后，在实践过程还会遇到许多意想不到的问题。要想快速的解决开

Spark入门指南：从基础概念到实践应用全解析

在这个数据驱动的时代，信息的处理和分析变得越来越重要。而在众多的大数据处理框架中，「Apache Spark」以其独特的优势脱颖而出。

04

Spark2.3.0 RDD操作

例如，map 是一个转换操作，传递给每个数据集元素一个函数并返回一个新 RDD 表示返回结果。另一方面，reduce 是一个动作操作，使用一些函数聚合 RDD 的所有元素并将最终结果返回给驱动程序（尽管还有一个并行的 reduceByKey 返回一个分布式数据集）。

02

Spark入门指南：从基础概念到实践应用全解析

在这个数据驱动的时代，信息的处理和分析变得越来越重要。而在众多的大数据处理框架中，「Apache Spark」以其独特的优势脱颖而出。

04

Spark SQL实战(06)-RDD与DataFrame的互操作

这种基于反射的方法可使代码更简洁，在编写 Spark 应用程序时已知schema时效果很好

03

大数据技术Spark学习

Spark SQL 是 Spark 用来处理结构化数据的一个模块，它提供了一个编程抽象叫做 DataFrame，并且作为分布式 SQL 查询引擎的作用。我们已经学习了 Hive，它是将 Hive SQL 转换成 MapReduce 然后提交到集群上执行，大大简化了编写 MapReduce 的程序的复杂性，由于 MapReduce 这种计算模型执行效率比较慢。所以 Spark SQL 的应运而生，它是将 Spark SQL 转换成 RDD，然后提交到集群执行，执行效率非常快！

06

读书 | Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令

今天恰逢世界读书日，正好分享一篇CDA美女作者的读书笔记。C君提醒：好读书，都好书，每天都是读书日~ 《Learning Spark》这本书算是Spark入门的必读书了，中文版是《Spark快速大数据分析》，不过豆瓣书评很有意思的是，英文原版评分7.4，评论都说入门而已深入不足，中文译版评分8.4，评论一片好评，有点意思。我倒觉得这本书可以作为官方文档的一个补充，刷完后基本上对Spark的一些基本概念、码简单的程序是没有问题的了。这本书有一个好处是它是用三门语言写的，Python/Java/Scala，所以

09

Mapreduce

在map的输出value中为不同表的数据打上tag标记，在reduce阶段根据tag判断数据来源。MapReduce的过程如下:

07

Spark笔记

基础版：https://tech.meituan.com/2016/04/29/spark-tuning-basic.html

01

【原】Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令

《Learning Spark》这本书算是Spark入门的必读书了，中文版是《Spark快速大数据分析》，不过豆瓣书评很有意思的是，英文原版评分7.4，评论都说入门而已深入不足，中文译版评分8.4，评论一片好评，有点意思。我倒觉得这本书可以作为官方文档的一个补充，刷完后基本上对Spark的一些基本概念、码简单的程序是没有问题的了。这本书有一个好处是它是用三门语言写的，Python/Java/Scala，所以适用性很广，我的观点是，先精通一门语言，再去学其他语言。由于我工作中比较常用的是Python，所以就

08

Note_Spark_Day07：Spark SQL(DataFrame是什么和数据分析（案例讲解）)

使得Spark SQL得以洞察更多的结构信息，从而对藏于DataFrame背后的数据源以及作用于DataFrame之上的变换进行针对性的优化，最终达到大幅提升运行时效率

04

Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN

本文介绍了 Apache Spark 的 RDD 程序设计指南，从 RDD 的基本概念、创建与操作、缓存与存储、性能优化等方面进行了详细阐述，并提供了丰富的实例和代码以帮助读者更好地理解和掌握 RDD 的使用方法。

06

如何应对大数据分析工程师面试Spark考察，看这一篇就够了

可以说Spark几乎是企业搭建大数据平台必备组件，作为数据分析工程师在工作中执行程序、调试程序、查询数据都会和Spark打交道，所以对Spark知识的考察也就顺理成章了。

02

Spark和MapReduce相比，都有哪些优势？

在实际应用中，由于MapReduce在大量数据处理时存在高延迟的问题，导致Hadoop无力处理很多对时间有要求的场景，越来越多的公司开始采用Spark作为与计算大数据的核心技术。 Spark和MapReduce相比，都有哪些优势？一个最明显的优点就是性能的大规模提升。通俗一点说，我们可以将MapReduce理解为手工作坊式生产，每一个任务都是由作坊独立完成。涉及到大规模的生产时，由于每一个作坊都要独立处理原料采购、制作、存储、运输等等环节，需要花费大量的人力（计算资源）、物力（能源消耗）和运输（IO操

05

【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

周末的任务是更新Learning Spark系列第三篇，以为自己写不完了，但为了改正拖延症，还是得完成给自己定的任务啊 = =。这三章主要讲Spark的运行过程（本地+集群），性能调优以及Spark SQL相关的知识，如果对Spark不熟的同学可以先看看之前总结的两篇文章：【原】Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令【原】Learning Spark (Python版) 学习笔记(二)----键值对、数据读取与保存、共享特性 #####我是

Spark_Day07：Spark SQL(DataFrame是什么和数据分析（案例讲解）)

在Spark中，DataFrame是一种以RDD为基础的分布式数据集，类似于传统数据库中的二维表格。 DataFrame与RDD的主要区别在于，前者带有schema元信息，即DataFrame所表示的二维表数据集的每一列都带有名称和类型。

05

Spark SQL DataFrame与RDD交互

Spark SQL 支持自动将 JavaBeans 的 RDD 转换为 DataFrame。使用反射获取的 BeanInfo 定义了表的 schema。目前为止，Spark SQL 还不支持包含 Map 字段的 JavaBean。但是支持嵌套的 JavaBeans，List 以及 Array 字段。你可以通过创建一个实现 Serializable 的类并为其所有字段设置 getter 和 setter 方法来创建一个 JavaBean。

02

Pyspark学习笔记（四）弹性分布式数据集 RDD 综述（上）

RDD（弹性分布式数据集）是 PySpark 的基本构建块，是spark编程中最基本的数据对象；它是spark应用中的数据集，包括最初加载的数据集，中间计算的数据集，最终结果的数据集，都是RDD。从本质上来讲，RDD是对象分布在各个节点上的集合，用来表示spark程序中的数据。以Pyspark为例，其中的RDD就是由分布在各个节点上的python对象组成，类似于python本身的列表的对象的集合。区别在于，python集合仅在一个进程中存在和处理，而RDD分布在各个节点，指的是【分散在多个物理服务器上的多个进程上计算的】这里多提一句，尽管可以将RDD保存到硬盘上，但RDD主要还是存储在内存中，至少是预期存储在内存中的，因为spark就是为了支持机器学习应运而生。一旦你创建了一个 RDD，就不能改变它。

03

Spark1.0新特性-->Spark SQL

Spark1.0出来了，变化还是挺大的，文档比以前齐全了，RDD支持的操作比以前多了一些，Spark on yarn功能我居然跑通了。但是最最重要的就是多了一个Spark SQL的功能，它能对RDD进行Sql操作，目前它只是一个alpha版本，喜欢尝鲜的同志们进来看看吧，下面是它的官网的翻译。 Spark SQL是支持在Spark中使用Sql、HiveSql、Scaca中的关系型查询表达式。它的核心组件是一个新增的RDD类型SchemaRDD，它把行对象用一个Schema来描述行里面的所有列的数据类型，它就

04

从 Spark 的数据结构演进说开

搞大数据的都知道 Spark，照例，我不会讲怎么用，也不打算讲怎么优化，而是想从 Spark 的核心数据结构的演进，来看看其中的一些设计和考虑，有什么是值得我们借鉴的。我想这些思想和理念才是更持久和通用的东西。

01

进击大数据系列（八）Hadoop 通用计算引擎 Spark

Spark 是一种通用的大数据计算框架,是基于RDD(弹性分布式数据集)的一种计算模型。那到底是什么呢？可能很多人还不是太理解，通俗讲就是可以分布式处理大量集数据的，将大量集数据先拆分，分别进行计算，然后再将计算后的结果进行合并。

02

Pyspark学习笔记（五）RDD操作(四)_RDD连接/集合操作

对应于SQL中常见的JOIN操作菜鸟教程网关于SQL连接总结性资料 Pyspark中的连接函数要求定义键，因为连接的过程是基于共同的字段(键)来组合两个RDD中的记录，因此需要操作键值对RDD

02

对于一般大数据物流项目的面试题(问题+答案)

1、数据采集如何完成 OGG 不要涉及，Oracle DBA完成 Canal数据采集，一定知道高可用HA集群模式 2、数据量大小 Kafka topic 数据存储生命周期（多久） 7天

03

Spark Day05：Spark Core之Sougou日志分析、外部数据源和共享变量

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sRu202yb-1644834575572)(/img/image-20210423150750606.png)]

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭