开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >空间与SparkSQL/Python在Synapse火花池使用apache？

问空间与SparkSQL/Python在Synapse火花池使用apache？
EN

Stack Overflow用户

提问于 2022-05-04 03:35:20

回答 1查看 254关注 0票数 1

我想在大型数据集上运行空间查询；例如，地质公园太慢了。我在这里发现的灵感：https://anant-sharma.medium.com/apache-sedona-geospark-using-pyspark-e60485318fbe

在我准备的火花池Synapse分析(通过Azure门户)：

Apache火花池/设置/包/需求文件：

requirement.txt：

azure-storage-file-share
geopandas
apache-sedona

/ Settings / Packages / Workspace包：

geotools-wrapper-geotools-24.1.jar
sedona-sql-3.0_2.12-1.2.0-incubating.jar

Apache火花池/设置/包/火花配置

config.txt：

spark.serializer org.apache.spark.serializer.KryoSerializer
spark.kryo.registrator org.apache.sedona.core.serde.SedonaKryoRegistrator

在电火花笔记本里

print(spark.version)
print(spark.conf.get("spark.kryo.registrator"))
print(spark.conf.get("spark.serializer"))

产出如下：

3.1.2.5.0-58001107
org.apache.sedona.core.serde.SedonaKryoRegistrator
org.apache.spark.serializer.KryoSerializer

然后我试着：

from pyspark.sql import SparkSession
from sedona.register import SedonaRegistrator  
from sedona.utils import SedonaKryoRegistrator, KryoSerializer
spark = SparkSession.builder.master("local[*]").appName("Sedona App").config("spark.serializer", KryoSerializer.getName).config("spark.kryo.registrator", SedonaKryoRegistrator.getName).getOrCreate()
SedonaRegistrator.registerAll(spark)

但是它失败了: Py4JJavaError:调用o636.count时发生了错误。：org.apache.spark.SparkException:由于阶段失败而中止作业:任务序列化失败: org.apache.spark.SparkException：未能向Kryo注册类

只要简单地检查一下是否正确安装了这些东西，就可能允许这样做：

%%sql
SELECT ST_Point(0,0);

请帮助将空间函数注册到Synapse笔记本！中运行

媒体处理1元起

智能、强大、全面的多媒体数据处理服务，助您提升媒体质量、降低成本，媒体处理套餐低至1元

EN

回答 1

Stack Overflow用户

发布于 2022-05-11 02:12:23

根据我的报告，我能够成功地运行上面的命令，没有任何问题。

我刚刚安装了包含requirement.txt的apache-sedona文件，并下载了以下两个jar文件：

注意:不需要config.txt文件。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72112285

复制

相关文章

我从编程教室毕业

这篇文章在我的草稿箱里躺了有一年多，今天总算是发出来了。本文的作者是之前编程教室的实训生之一，原本在汽车制造车间里工作，后来成功转行为一名程序员，从事车载语音识别相关软件的开发。这是他个人转行过程中的一些经验分享。

Crossin先生

2018/12/17

6270

答编程教室同学问

python ide linux

在公众号后台，经常会有学习Python的同学提来问题。今天我就来集中回答其中两个被提问较多的共性问题，分享给大家，希望对需要的同学有所帮助。

Crossin先生

2022/04/14

4300

P1850 换教室

题目描述对于刚上大学的牛牛来说，他面临的第一个问题是如何根据实际情况申请合适的课程。在可以选择的课程中，有节课程安排在 nn 个时间段上。在第个时间段上，两节内容相同的课程同时在不同的地点进行，其中，牛牛预先被安排在教室上课，而另一节课程在教室进行。在不提交任何申请的情况下，学生们需要按时间段的顺序依次完成所有的节安排好的课程。如果学生想更换第节课程的教室，则需要提出申请。若申请通过，学生就可以在第个时间段去教室上课，否则仍然在教室上课。由于更换教

attack

2018/04/12

1.5K0

P1083 借教室

题目描述在大学期间，经常需要租借教室。大到院系举办活动，小到学习小组自习讨论，都需要向学校申请借教室。教室的大小功能不同，借教室人的身份不同，借教室的手续也不一样。面对海量租借教室的信息，我们自然希望编程解决这个问题。我们需要处理接下来n天的借教室信息，其中第i天学校有ri个教室可供租借。共有m份订单，每份订单用三个正整数描述，分别为dj,sj,tj，表示某租借者需要从第sj天到第tj天租借教室（包括第sj天和第tj天），每天需要租借dj个教室。我们假定，租借者对教室的大小、地点没有要求。即对于每份

attack

2018/04/13

1.4K0

AiiDA 开源数据管理软件

rabbitmq postgresql 开源任务调度数据库

对于机器学习来说，模型和数据是非常重要的。而模型与数据相比，模型即便是优化得再好，数据不够、不好的话，最终也不能得到一个好的预测结果。因此，我们在使用机器学习方法去建立某个领域模型的同时，也要注意相关原始数据的收集和整理。当我们需要通过庞大的计算量来获取数据的时候，通常可能需要使用大型服务器集群，甚至高性能集群、超算等等。这个时候，即使我们提交的计算在一段时间后得到了结果，恐怕也会是很多个结果文件，我们也很难从这些文件中抽取出我们关心的、想要的某些数据，更难将其整理成可直接用于机器学习的数据格式。

zhonger

2022/10/28

1.9K0

基于Web的学校教室租赁系统

基于Web的学校教室租赁系统是一款便捷、高效、实用的教育工具，旨在为学生和教师提供一个良好的教学环境。系统主要包括学生模块和管理员模块，分别实现教室租借、查看信息、信息介绍、审核功能等功能。通过采用Bootstrap框架、Google日历FullCalendar、SSH技术等多种技术手段，实现了稳定运行、信息完全、可自适应屏幕等多种特性。项目运行截图包括登录界面、会议室列表界面、会议室申请界面、会议室审核界面、会议室修改界面、会议室信息展示界面、我的会议室申请界面和系统主界面。

林老师带你学编程

2018/01/04

2.3K0

【NOIP2012提高组】借教室[通俗易懂]

编程算法 java https 网络安全

在大学期间，经常需要租借教室。大到院系举办活动，小到学习小组自习讨论，都需要向学校申请借教室。教室的大小功能不同，借教室人的身份不同，借教室的手续也不一样。面对海量租借教室的信息，我们自然希望编程解决这个问题。

全栈程序员站长

2022/09/23

4730

数据存储之文件存储

java android xml

openFileOutput和openFileInput方法可以获得操作文件的OutputStream以及InputStream对象，而且可以通过流对象处理任何文件的数据，但是这两个方法同SharedPreferences一样，只能在手机内存卡的指定目录建立文件，因此在使用上仍然有一定的局限性。

小小工匠

2021/08/16

23.6K0

云数据库 Redis®爬虫缓存

通过《网络数据采集和解析》一文，我们已经知道了如何从指定的页面中抓取数据，以及如何保存抓取的结果，但是我们没有考虑过这么一种情况，就是我们可能需要从已经抓取过的页面中提取出更多的数据，重新去下载这些页面对于规模不大的网站倒是问题也不大，但是如果能够把这些页面缓存起来，对应用的性能会有明显的改善。

用户8442333

2021/05/21

4.7K0

android 数据存储<二>---- SharedPreferences实现数据的存储

android xml 编程算法

2.本质就是就是以xml文件在应用程序所在包中存放数据。（/data/data/xxxx/sharePreferfence/xxx.xml)

用户4148957

2022/06/14

5K0

android 数据存储<二>---- SharedPreferences实现数据的存储

数据分类及存储特性——NoSQL数据存储

文件存储存储大数据 sql 数据库

◆ NoSQL数据存储传统的架构方法是在服务之间共享一个数据库，而微服务却与之相反，每个微服务都拥有独立、自主、专门的数据存储。微服务数据存储是基础设施构建的重点，因为它提供服务解耦、数据存储自主性、小型化开发、测试设置等特性，有助于应用程序更快地交付或更新。选择理想的数据存储的第一步是确定微服务数据的性质，可以根据数据的特点将数据大致做如下划分。全局共享数据：缓存服务器是存储短暂数据很好的例子。它是一个临时数据存储，其目的是通过实时提供信息来改善用户体验。事务数据：从交易（如付款处理和订单处理）收集

IT大咖说

2022/06/16

5.6K0

数据分类及存储特性——NoSQL数据存储

给新同学：编程教室资源索引

本编程教室建号四年多，已经发布了数百篇教程和文章，并且还分享了不少资源和习题。不过最近新加入的同学可能会找不到以前的内容，所以我们定期整理一下，方便大家使用。 Python零基础入门系列 http://crossincode.com/course/lesson_list/ 微信文章中无法跳转外部链接，可在公众号回复 python 获取地址后进入，这个列表中的文章做过更新。从菜单栏“课程列表”也可查看历史文章的列表，但历史文章无法更新，所以建议从网址进入。另有 web.py、pygame、git 系列教程

Crossin先生

2018/04/17

7700

MacX MediaTrans Mac(iOS数据管理软件)

MacX MediaTrans Mac，它是运行在Mac平台上的一款iOS数据管理软件。可以一键式在iPhone iPad和Mac之间传输内容，备份数据的速度极快，传送速度可让您在8秒钟内传送100张4k照片。MacX Mediatrans还可以动态加密您的个人媒体文件，具有最高级别的安全性。

Mac知识分享

2022/09/22

5030

存储数据的基础存储数组

编程算法容器存储

软件的基本功能是处理数据，而在处理数据时，必须先进行数据持有，将数据持有之后，再对数据进行处理。我们将程序中可以临时存储数据的部分叫做容器。

星哥玩云

2022/09/14

4.5K0

探索PostgreSQL数据存储存储之数据页

存储数据库 sql

计算机内数据访问的时间从CPU L1->CPU L2->DRAM->SSD->HDD->Network Storage->Tape Archives不同层次的访问，访问的时间差距很大。上图的左边是每个层次的硬件访问数据的时间周期，上图的右边是不同硬件访问时间的放大，越上层访问越短，越下层访问时间越长；但是从容量上看越上层的容量越小，越下层的容量越大。 PG磁盘数据到内存概览任何传统传统数据库都会借助DRAM来加速数据库磁盘数据的访问。比如PG中的share_buffer，全局为PG数据库中表

用户4700054

2023/02/26

3.8K0

探索PostgreSQL数据存储存储之数据页

Mac 安装数据库管理软件 DBeaver

数据库管理数据库 sql 云数据库 SQL Server 开源

大家好，我是阿常。今天阿常和大家分享——Mac 安装数据库管理软件DBeaver。

程序媛淼淼

2022/09/01

3.1K0

Mac 安装数据库管理软件 DBeaver

Android数据存储

数据存储 Android数据存储的几种形式 Internal Storage Store private data on the device memory. 通过mContext.getFilesDir()来得到data/data/包名/File目录 External Storage Store public data on the shared external storage. TextView tv = (TextView) findViewById(R.id.tv_sdsize);

xiangzhihong

2018/01/26

2.4K0

Python3中，urllib.request.urlretrieve根据文件的URL下载文件。

用户1250179

2018/08/02

1.9K0

Python数据存储

二进制计算机

一、对于数据存储的思考为什么使用计算机？为了存储、处理数据数据存在哪里？数据存储在内存中内存是怎么存储数据的？首先要弄清楚怎么存储数字二、内存概念内存是计算机中重要的部件之一，它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的，因此内存的性能对计算机的影响非常大。内存(Memory)也被称为内存储器，其作用是用于暂时存放CPU中的运算数据，以及与硬盘等外部存储器交换的数据。只要计算机在运行中，CPU就会把需要运算的数据调到内存中进行运算，当运算

星哥玩云

2022/09/08

3.1K0

SharedPreferences存储数据

android 数据库存储

本文介绍了Android应用开发中SharedPreferences存储数据的使用方法，通过实例代码详细讲解了如何在不同Activity中调用SharedPreferences保存和读取数据。

用户1148523

2018/01/09

2.1K0

相似问题

目前可用教室数据库

11

最佳存储库和项目管理软件

20

Agora云教室登录失败

11

项目管理软件

48

列出组织的教室

10

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例