首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >###RuntimeError:在发送端口号之前退出的Java网关进程

###RuntimeError:在发送端口号之前退出的Java网关进程
EN

Stack Overflow用户
提问于 2022-04-17 09:55:22
回答 2查看 3K关注 0票数 2

我试图用python来分析这些数据:

代码语言:javascript
运行
复制
from pyspark.sql import SparkSession
from pyspark.sql.types import *
from pyspark.sql.functions import*
spark = SparkSession.builder.getOrCreate()

ds1 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202101-divvy-tripdata.csv", 
header=True)
ds2 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202102-divvy-tripdata.csv", 
header=True)
ds3 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202103-divvy-tripdata.csv", 
header=True)
ds4 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202104-divvy-tripdata.csv", 
header=True)
ds5 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202105-divvy-tripdata.csv", 
header=True)
ds6 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202106-divvy-tripdata.csv", 
header=True)
ds7 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202107-divvy-tripdata.csv", 
header=True)
ds8 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202108-divvy-tripdata.csv", 
header=True)
ds9 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202109-divvy-tripdata.csv", 
header=True)
ds10 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202110-divvy-tripdata.csv", 
header=True)
ds11 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202111-divvy-tripdata.csv", 
header=True)
ds12 = spark.read.csv("C:\\Users\\User\\Desktop\\Trip_data\\202112-divvy-tripdata.csv", 
header=True)
ds_all=ds1.union(ds2).union(ds3).union(ds4).union(ds5).union(ds6).union(ds7).union(ds8).union(ds9).union(ds10).union(ds11).union(ds12)

print((ds_all.count(), len(ds_all.columns)))

以下是我的错误:

代码语言:javascript
运行
复制
Java not found and JAVA_HOME environment variable is not set.
Install Java and set JAVA_HOME to point to the Java installation 
directory.
Traceback (most recent call last):
File "C:\Users\User\PycharmProjects\pythonProject\Case Study 1.py", l 
ine 4, in <module>
spark = SparkSession.builder.getOrCreate()
File "C:\Users\User\PycharmProjects\pythonProject\venv\lib\site- 
packages\pyspark\sql\session.py", line 228, in getOrCreate
sc = SparkContext.getOrCreate(sparkConf)
File "C:\Users\User\PycharmProjects\pythonProject\venv\lib\site- 
packages\pyspark\context.py", line 392, in getOrCreate
SparkContext(conf=conf or SparkConf())
File "C:\Users\User\PycharmProjects\pythonProject\venv\lib\site- 
packages\pyspark\context.py", line 144, in __init__
SparkContext._ensure_initialized(self, gateway=gateway, conf=conf)
File "C:\Users\User\PycharmProjects\pythonProject\venv\lib\site- 
packages\pyspark\context.py", line 339, in _ensure_initialized
SparkContext._gateway = gateway or launch_gateway(conf)
File "C:\Users\User\PycharmProjects\pythonProject\venv\lib\site- 
packages\pyspark\java_gateway.py", line 108, in launch_gateway
raise RuntimeError("Java gateway process exited before sending its 
port number")
RuntimeError: Java gateway process exited before sending its port 
number

我有谷歌,但很多解决方案对我来说都很混乱,我无法理解和遵循它。有谁能对这个问题有想法吗?还是有更多方便的软件包在吡咯烷酮社区中编码?请给我一些建议,我会很感激的!

EN

回答 2

Stack Overflow用户

发布于 2022-04-17 11:01:54

此问题是由于缺少$JAVA_HOME变量引起的。只需在~/.bashrc (或Mac上的~/.zshrc )文件中设置它,添加行:

代码语言:javascript
运行
复制
export JAVA_HOME="/path/to/java_home/"

在Windows中,您需要在系统设置中添加环境变量JAVA_HOME

请注意,对于火花/火花,您需要一个>=8。

代码语言:javascript
运行
复制
% $JAVA_HOME/bin/java -version
java version "1.8.0_301"
Java(TM) SE Runtime Environment (build 1.8.0_301-b09)
Java HotSpot(TM) 64-Bit Server VM (build 25.301-b09, mixed mode)
票数 1
EN

Stack Overflow用户

发布于 2022-07-31 20:53:35

我通过输入安装Java的环境变量来解决错误。

注意:我正在使用Windows。

代码语言:javascript
运行
复制
import os

os.environ['SPARK_HOME'] = 'C:\spark\spark-3.3.0-bin-hadoop3'
os.environ["JAVA_HOME"] = 'C:\Java\jdk1.8.0_321'
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71900906

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档