我正在研究分析航空数据的PySpark应用程序。数据库是MS SQLServer DB。同时连接到服务器上的数据库。我得到一个错误“没有合适的驱动程序”。但是,当我使用CLI在本地机器上运行,并将JDBC驱动程序jar文件添加到driver-class-path中时,它会运行并连接到DB。$$anonfun$7.apply(JDBCOptions.scala:84)
at org.apache.spark.sql.execution.datas
我正在尝试使用来插入大量来自pyspark的数据。:3.2.0,org.apache.spark:spark-avro_2.12:3.1.2,com.microsoft.sqlserver:mssql-jdbc:8.4.1.jre8,com.microsoft.azure:spark-mssql-connector_2.12:1.2.0')ERROR executor.Executor: Exception in task
我正在尝试使用中的pyspark从MS服务器加载数据。火花测试和工作良好。.set("spark.driver.extraClassPath","mssql-jdbc-7.4.1.jre8.jar")sqlContext = SQLContext(sc)
# Loading data from a JDBC</
在Windows10上运行,并使用python3.7安装的命令来运行pyspark:pyspark --jars "C:\spark\spark-2.4.5-bin-hadoop2.7\jars\ojdbc6,我正在使用的window登录可以访问数据库,因为它与cx_Oracle一起工作得很好,并且我可以使用PL/SQL client访问数据库。错误: File "<stdin>", line 1, in <module>