首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【Python】PySpark 数据处理 ② ( 安装 PySpark | PySpark 数据处理步骤 | 构建 PySpark 执行环境入口对象 )

一、安装 PySpark 1、使用 pip 安装 PySpark 执行 Windows + R , 运行 cmd 命令行提示符 , 在命令行提示符终端中 , 执行 pip install pyspark...命令 , 安装 PySpark , 安装过程中 , 需要下载 310 M 的安装包 , 耐心等待 ; 安装完毕 : 命令行输出 : C:\Users\octop>pip install pyspark...Collecting pyspark Downloading pyspark-3.4.1.tar.gz (310.8 MB) |█████████████████████████████...中 , 安装 PySpark ; 尝试导入 pyspack 模块中的类 , 如果报错 , 使用报错修复选项 , PyCharm 会自动安装 PySpark ; 二、PySpark 数据处理步骤 PySpark...执行环境入口对象 如果想要使用 PySpark 进行数据处理 , 必须构建一个 PySpark 执行环境入口对象 ; PySpark 执行环境 入口对象 是 SparkContext 类实例对象 ;

28020
领券