首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >空间与SparkSQL/Python在Synapse火花池使用apache?

空间与SparkSQL/Python在Synapse火花池使用apache?
EN

Stack Overflow用户
提问于 2022-05-04 03:35:20
回答 1查看 254关注 0票数 1

我想在大型数据集上运行空间查询;例如,地质公园太慢了。我在这里发现的灵感:https://anant-sharma.medium.com/apache-sedona-geospark-using-pyspark-e60485318fbe

在我准备的火花池Synapse分析(通过Azure门户):

Apache火花池/设置/包/需求文件:

requirement.txt:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
azure-storage-file-share
geopandas
apache-sedona

/ Settings / Packages / Workspace包:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
geotools-wrapper-geotools-24.1.jar
sedona-sql-3.0_2.12-1.2.0-incubating.jar

Apache火花池/设置/包/火花配置

config.txt:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
spark.serializer org.apache.spark.serializer.KryoSerializer
spark.kryo.registrator org.apache.sedona.core.serde.SedonaKryoRegistrator

在电火花笔记本里

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
print(spark.version)
print(spark.conf.get("spark.kryo.registrator"))
print(spark.conf.get("spark.serializer"))

产出如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
3.1.2.5.0-58001107
org.apache.sedona.core.serde.SedonaKryoRegistrator
org.apache.spark.serializer.KryoSerializer

然后我试着:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from pyspark.sql import SparkSession
from sedona.register import SedonaRegistrator  
from sedona.utils import SedonaKryoRegistrator, KryoSerializer
spark = SparkSession.builder.master("local[*]").appName("Sedona App").config("spark.serializer", KryoSerializer.getName).config("spark.kryo.registrator", SedonaKryoRegistrator.getName).getOrCreate()
SedonaRegistrator.registerAll(spark)

但是它失败了: Py4JJavaError:调用o636.count时发生了错误。:org.apache.spark.SparkException:由于阶段失败而中止作业:任务序列化失败: org.apache.spark.SparkException:未能向Kryo注册类

只要简单地检查一下是否正确安装了这些东西,就可能允许这样做:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
%%sql
SELECT ST_Point(0,0);

请帮助将空间函数注册到Synapse笔记本!中运行

EN

回答 1

Stack Overflow用户

发布于 2022-05-11 02:12:23

根据我的报告,我能够成功地运行上面的命令,没有任何问题。

我刚刚安装了包含requirement.txtapache-sedona文件,并下载了以下两个jar文件:

注意:不需要config.txt文件。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72112285

复制
相关文章
我从编程教室毕业
这篇文章在我的草稿箱里躺了有一年多,今天总算是发出来了。本文的作者是之前编程教室的实训生之一,原本在汽车制造车间里工作,后来成功转行为一名程序员,从事车载语音识别相关软件的开发。这是他个人转行过程中的一些经验分享。
Crossin先生
2018/12/17
6270
答编程教室同学问
在公众号后台,经常会有学习Python的同学提来问题。今天我就来集中回答其中两个被提问较多的共性问题,分享给大家,希望对需要的同学有所帮助。
Crossin先生
2022/04/14
4300
P1850 换教室
题目描述 对于刚上大学的牛牛来说,他面临的第一个问题是如何根据实际情况申请合适的课程。 在可以选择的课程中,有  节课程安排在 nn 个时间段上。在第  个时间段上,两节内容相同的课程同时在不同的地点进行,其中,牛牛预先被安排在教室 上课,而另一节课程在教室  进行。 在不提交任何申请的情况下,学生们需要按时间段的顺序依次完成所有的   节安排好的课程。如果学生想更换第 节课程的教室,则需要提出申请。若申请通过,学生就可以在第 个时间段去教室 上课,否则仍然在教室  上课。 由于更换教
attack
2018/04/12
1.5K0
P1850 换教室
P1083 借教室
题目描述 在大学期间,经常需要租借教室。大到院系举办活动,小到学习小组自习讨论,都需要向学校申请借教室。教室的大小功能不同,借教室人的身份不同,借教室的手续也不一样。 面对海量租借教室的信息,我们自然希望编程解决这个问题。 我们需要处理接下来n天的借教室信息,其中第i天学校有ri个教室可供租借。共有m份订单,每份订单用三个正整数描述,分别为dj,sj,tj,表示某租借者需要从第sj天到第tj天租借教室(包括第sj天和第tj天),每天需要租借dj个教室。 我们假定,租借者对教室的大小、地点没有要求。即对于每份
attack
2018/04/13
1.4K0
AiiDA 开源数据管理软件
  对于机器学习来说,模型和数据是非常重要的。而模型与数据相比,模型即便是优化得再好,数据不够、不好的话,最终也不能得到一个好的预测结果。因此,我们在使用机器学习方法去建立某个领域模型的同时,也要注意相关原始数据的收集和整理。当我们需要通过庞大的计算量来获取数据的时候,通常可能需要使用大型服务器集群,甚至高性能集群、超算等等。这个时候,即使我们提交的计算在一段时间后得到了结果,恐怕也会是很多个结果文件,我们也很难从这些文件中抽取出我们关心的、想要的某些数据,更难将其整理成可直接用于机器学习的数据格式。
zhonger
2022/10/28
1.9K0
基于Web的学校教室租赁系统
基于Web的学校教室租赁系统是一款便捷、高效、实用的教育工具,旨在为学生和教师提供一个良好的教学环境。系统主要包括学生模块和管理员模块,分别实现教室租借、查看信息、信息介绍、审核功能等功能。通过采用Bootstrap框架、Google日历FullCalendar、SSH技术等多种技术手段,实现了稳定运行、信息完全、可自适应屏幕等多种特性。项目运行截图包括登录界面、会议室列表界面、会议室申请界面、会议室审核界面、会议室修改界面、会议室信息展示界面、我的会议室申请界面和系统主界面。
林老师带你学编程
2018/01/04
2.3K0
基于Web的学校教室租赁系统
【NOIP2012提高组】借教室[通俗易懂]
在大学期间,经常需要租借教室。大到院系举办活动,小到学习小组自习讨论,都需要向学校申请借教室。教室的大小功能不同,借教室人的身份不同,借教室的手续也不一样。面对海量租借教室的信息,我们自然希望编程解决这个问题。
全栈程序员站长
2022/09/23
4730
数据存储之文件存储
openFileOutput和openFileInput方法可以获得操作文件的OutputStream以及InputStream对象,而且可以通过流对象处理任何文件的数据,但是这两个方法同SharedPreferences一样,只能在手机内存卡的指定目录建立文件,因此在使用上仍然有一定的局限性。
小小工匠
2021/08/16
23.6K0
存储数据
通过《网络数据采集和解析》一文,我们已经知道了如何从指定的页面中抓取数据,以及如何保存抓取的结果,但是我们没有考虑过这么一种情况,就是我们可能需要从已经抓取过的页面中提取出更多的数据,重新去下载这些页面对于规模不大的网站倒是问题也不大,但是如果能够把这些页面缓存起来,对应用的性能会有明显的改善。
用户8442333
2021/05/21
4.7K0
android 数据存储<二>---- SharedPreferences实现数据的存储
2.本质就是就是以xml文件在应用程序所在包中存放数据。(/data/data/xxxx/sharePreferfence/xxx.xml)
用户4148957
2022/06/14
5K0
android 数据存储<二>---- SharedPreferences实现数据的存储
数据分类及存储特性——NoSQL数据存储
◆ NoSQL数据存储 传统的架构方法是在服务之间共享一个数据库,而微服务却与之相反,每个微服务都拥有独立、自主、专门的数据存储。微服务数据存储是基础设施构建的重点,因为它提供服务解耦、数据存储自主性、小型化开发、测试设置等特性,有助于应用程序更快地交付或更新。选择理想的数据存储的第一步是确定微服务数据的性质,可以根据数据的特点将数据大致做如下划分。 全局共享数据:缓存服务器是存储短暂数据很好的例子。它是一个临时数据存储,其目的是通过实时提供信息来改善用户体验。 事务数据:从交易(如付款处理和订单处理)收集
IT大咖说
2022/06/16
5.6K0
数据分类及存储特性——NoSQL数据存储
给新同学:编程教室资源索引
本编程教室建号四年多,已经发布了数百篇教程和文章,并且还分享了不少资源和习题。不过最近新加入的同学可能会找不到以前的内容,所以我们定期整理一下,方便大家使用。 Python零基础入门系列 http://crossincode.com/course/lesson_list/ 微信文章中无法跳转外部链接,可在公众号回复 python 获取地址后进入,这个列表中的文章做过更新。 从菜单栏“课程列表”也可查看历史文章的列表,但历史文章无法更新,所以建议从网址进入。 另有 web.py、pygame、git 系列教程
Crossin先生
2018/04/17
7700
MacX MediaTrans Mac(iOS数据管理软件)
MacX MediaTrans Mac,它是运行在Mac平台上的一款iOS数据管理软件。可以一键式在iPhone iPad和Mac之间传输内容,备份数据的速度极快,传送速度可让您在8秒钟内传送100张4k照片。MacX Mediatrans还可以动态加密您的个人媒体文件,具有最高级别的安全性。
Mac知识分享
2022/09/22
5030
存储数据的基础存储数组
软件的基本功能是处理数据,而在处理数据时,必须先进行数据持有,将数据持有之后,再对数据进行处理。我们将程序中可以临时存储数据的部分叫做容器。
星哥玩云
2022/09/14
4.5K0
探索PostgreSQL数据存储存储之数据页
计算机内数据访问的时间 从CPU L1->CPU L2->DRAM->SSD->HDD->Network Storage->Tape Archives不同层次的访问,访问的时间差距很大。上图的左边是每个层次的硬件访问数据的时间周期,上图的右边是不同硬件访问时间的放大,越上层访问越短,越下层访问时间越长;但是从容量上看越上层的容量越小,越下层的容量越大。 PG磁盘数据到内存概览 任何传统传统数据库都会借助DRAM来加速数据库磁盘数据的访问。比如PG中的share_buffer,全局为PG数据库中表
用户4700054
2023/02/26
3.8K0
探索PostgreSQL数据存储存储之数据页
Mac 安装数据库管理软件 DBeaver
大家好,我是阿常。今天阿常和大家分享——Mac 安装数据库管理软件DBeaver。
程序媛淼淼
2022/09/01
3.1K0
Mac 安装数据库管理软件 DBeaver
Android数据存储
数据存储 Android数据存储的几种形式 Internal Storage Store private data on the device memory. 通过mContext.getFilesDir()来得到data/data/包名/File目录 External Storage Store public data on the shared external storage. TextView tv = (TextView) findViewById(R.id.tv_sdsize);
xiangzhihong
2018/01/26
2.4K0
05存储数据
Python3中,urllib.request.urlretrieve根据文件的URL下载文件。
用户1250179
2018/08/02
1.9K0
Python数据存储
一、对于数据存储的思考 为什么使用计算机? 为了存储、处理数据 数据存在哪里? 数据存储在内存中 内存是怎么存储数据的? 首先要弄清楚怎么存储数字 二、内存 概念 内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。内存(Memory)也被称为内存储器,其作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。只要计算机在运行中,CPU就会把需要运算的数据调到内存中进行运算,当运算
星哥玩云
2022/09/08
3.1K0
Python数据存储
SharedPreferences存储数据
本文介绍了Android应用开发中SharedPreferences存储数据的使用方法,通过实例代码详细讲解了如何在不同Activity中调用SharedPreferences保存和读取数据。
用户1148523
2018/01/09
2.1K0

相似问题

目前可用教室数据库

11

最佳存储库和项目管理软件

20

Agora云教室登录失败

11

项目管理软件

48

列出组织的教室

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文