开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用Spark 2 Scala使用经纬度坐标计算距离

Spark是一个开源的分布式计算框架，它提供了高效的数据处理和分析能力。Scala是一种运行在Java虚拟机上的编程语言，它与Spark紧密结合，是Spark的主要编程语言之一。

经纬度坐标是用来表示地球上某一点位置的坐标，通常使用经度和纬度两个值来确定一个点的位置。计算两个经纬度坐标之间的距离可以使用地理信息系统（GIS）中的距离计算方法。

在Spark 2 Scala中，可以使用以下代码来计算两个经纬度坐标之间的距离：

import org.apache.spark.sql.functions._

val lat1 = 40.7128 // 第一个点的纬度
val lon1 = -74.0060 // 第一个点的经度
val lat2 = 34.0522 // 第二个点的纬度
val lon2 = -118.2437 // 第二个点的经度

val distance = udf((lat1: Double, lon1: Double, lat2: Double, lon2: Double) => {
  val earthRadius = 6371 // 地球半径，单位为千米
  val dLat = math.toRadians(lat2 - lat1)
  val dLon = math.toRadians(lon2 - lon1)
  val a = math.sin(dLat / 2) * math.sin(dLat / 2) +
    math.cos(math.toRadians(lat1)) * math.cos(math.toRadians(lat2)) *
    math.sin(dLon / 2) * math.sin(dLon / 2)
  val c = 2 * math.atan2(math.sqrt(a), math.sqrt(1 - a))
  val distance = earthRadius * c
  distance
})

val result = spark.range(1).select(distance(lit(lat1), lit(lon1), lit(lat2), lit(lon2)).as("distance"))
result.show()

上述代码中，首先定义了两个经纬度坐标点的纬度和经度。然后使用udf函数定义了一个自定义函数distance，该函数接受四个参数：两个点的纬度和经度。在函数内部，使用Haversine公式计算了两个点之间的距离。最后，使用Spark的DataFrame API计算并显示了距离。

这种计算距离的方法适用于需要在Spark中处理大规模地理数据的场景，例如地理位置推荐、路径规划等。

腾讯云提供了多个与Spark相关的产品和服务，例如腾讯云数据分析（Tencent Cloud DataWorks）、腾讯云弹性MapReduce（Tencent Cloud EMR）等。您可以通过访问腾讯云官方网站获取更多关于这些产品的详细信息和文档。

参考链接：

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

经纬度坐标距离计算

百度地图两点之间距离【传送门】 PHP版本 <?...php /** * 计算两点之间直线距离 * @param float $lon1 经度 * @param float $lat1 维度 * @param float $lon2..., $lat2){ return (2*ATAN2(SQRT(SIN(($lat1-$lat2)*PI()/180/2) *SIN(($lat1-$lat2)*PI()/...180/2)+ COS($lat2*PI()/180)*COS($lat1*PI()/180) *SIN(($lon1-$lon2)*PI()/180/2...*SIN(($lon1-$lon2)*PI()/180/2) *SIN(($lon1-$lon2)*PI()/180/2))))*6378140; } echo

6.1K9 0

mysql根据经纬度计算距离函数_根据两点经纬度坐标计算距离

,point(116.3424590000,40.0497810000)) as juli FROM table ORDER BY juli ASC 没用除以1000，所以是以米为单位方式2：...point(116.3424590000,40.0497810000))*111195/1000 ) as juli FROM table ORDER BY juli ASC st_distance 计算的结果单位是度...方式3 select *, ROUND(6378.138*2*ASIN(SQRT(POW(SIN(({$lat}*PI()/180-lat*PI()/180)/2),2)+COS({$lat}*PI(...)/180)*COS(lat*PI()/180)*POW(SIN(({$lng}*PI()/180-lng*PI()/180)/2),2)))*1000) AS juli from table order

1.5K1 0

经纬度距离计算 python_Python已知两坐标求距离

longitude2= (Math.PI/180)*longitude2 #因此AB两点的球面距离为:{arccos[sinb*siny+cosb*cosy*cos(a-x)]}*R #地球半径...*math.cos(latitude2)*math.cos(longitude2-longitude1))*R return d; } 实现了根据输入两点经纬度，计算这两点距离的函数，但是在实际操作过程中...解决方案：查看越界代码，使用repr将数字转化为字符串显示、查看 temp = math.sin(latitude1)*math.sin(latitude2)+\ math.cos(latitude1...temp>1.0: print format(temp,".19e") 可看出在科学计数法下的输出 >>1.0000000000000002220e+00 推导公式本身出问题的机率很小，但计算机中的浮点数舍入误差会放大...longitude2= (math.pi/180.0)*longitude2 #因此AB两点的球面距离为:{arccos[sina*sinx+cosb*cosx*cos(b-y)]}*R (a,b,

5841 0

两个经纬度之间的距离计算公式excel_excel经纬度坐标计算距离

已知AB列分别为起点经纬度，CD列分别终点经纬度，根据两点经纬度计算距离在E2单元格里输入： =6371004*ACOS(1-(POWER((SIN((90-B2)*PI()/180)COS...(A2PI()/180)-SIN((90-D2)*PI()/180)COS(C2PI()/180)),2)+POWER((SIN((90-B2)*PI()/180)SIN(A2PI()/180)-SIN...((90-D2)*PI()/180)SIN(C2PI()/180)),2)+POWER((COS((90-B2)*PI()/180)-COS((90-D2)*PI()/180)),2))/2) 计算出第二行两点的距离...：点击E2单元格，将鼠标移动到右下角小正方形点上，此时鼠标变为+号，双击鼠标，计算出所有数据的距离：版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。

2.8K2 0

java根据经纬度计算距离_java经纬度转换xy坐标公式

赤道为6378左右 public static double getDistance(Double lat1,Double lng1,Double lat2,Double lng2) { // 经纬度...; // B经弧度 double radiansBY = Math.toRadians(lat2); // B纬弧度 // 公式中“cosβ1cosβ2cos(α1-α2)+sinβ1sinβ2”的部分...，传入坐标系、经纬度用于计算距离 GeodeticCurve geoCurve = new GeodeticCalculator().calculateGeodeticCurve(ellipsoid,...= getDistanceMeter(source, target, Ellipsoid.WGS84); System.out.println(“Sphere坐标系计算结果：”+meter1 + “米”...); System.out.println(“WGS84坐标系计算结果：”+meter2 + “米”); } 版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。

1.7K2 0

Python学习——库Geopy用法之经纬度坐标转换、经纬度距离计算

Geopy作为一个专注于地理位置处理包，能实现地理编码、逆地理编码功能；此外，还可以根据两个经纬度坐标计算在地球上的最短距离。 2. 具体用法 2.1....，纬度在前，经度在后 print(location.address) 结果： 1#, 西二旗北路, 东北旺村, 海淀区, 北京市, 102208, 中国 2.3 根据两个经纬度坐标计算距离 Geopy的距离计算功能包含在...distance 中计算距离有两种：大圆距离与大地线距离（默认，更精确）。...大圆算法将地球简化为一个圆球，其计算的距离是球面上过两点的大圆距离。大地线使用目前国际通用的方法，用旋转椭球面表示地球，其计算的是两点在椭球面上的最短距离。...13%的差异内容参考： (24条消息) Python 库 Geopy 的用法，经纬度坐标转换、经纬度距离计算_小张Python-CSDN博客_geopy 使用 geopy 处理地址和坐标数据 | GNSS

4.5K5 1

Spark学习使用笔记 - Scala篇（2）- 数组

2, 222, 2222, 22222, 22, 3, 4, 5) //移除第二个元素 b.remove(2) println(b) //输出ArrayBuffer(1, 2, 2222, 22222...= ArrayBuffer[Int]() arr2 +=(1, 2, 3, 4, 5, 6) val result2 = for (i <- arr2) yield i println...val result3 = for (i <- arr2 if i % 2 == 0) yield i * 10 val result4 = arr2.filter(_ % 2 ==...a.sorted.reverse) //输出：ArrayBuffer(324.0, 123.2, 123.0, 23.0, 12.0, 7.0, 4.0) val b = a.toArray scala.util.Sorting.quickSort...3, 0, -1, 2, 3, 45, -32, -43, 2, 0)).mkString(""))//输出：

5462 0

在scala中使用spark sql解决特定需求（2）

接着上篇文章，本篇来看下如何在scala中完成使用spark sql将不同日期的数据导入不同的es索引里面。...首下看下用到的依赖包有哪些：下面看相关的代码，代码可直接在跑在win上的idea中，使用的是local模式，数据是模拟造的：分析下，代码执行过程：（1）首先创建了一个SparkSession对象，...注意这是新版本的写法，然后加入了es相关配置（2）导入了隐式转化的es相关的包（3）通过Seq+Tuple创建了一个DataFrame对象，并注册成一个表（4）导入spark sql后，执行了一个...处理组内的Struct结构（7）将组内的Seq[Row]转换为rdd，最终转化为df （8）执行导入es的方法，按天插入不同的索引里面（9）结束需要注意的是必须在执行collect方法后，才能在循环内使用...sparkContext，否则会报错的，在服务端是不能使用sparkContext的，只有在Driver端才可以。

7814 0

【GIS - 地理信息系统】经纬度计算 ( 经度、纬度概念 | 地球周长计算 | 地球经线周长计算 | 经纬度相关计算 | 经纬度坐标距离计算公式 | 经纬度与实际距离换算 | 相关代码实现 )

垂直 y 轴的坐标 , 纬度的取值范围 -90 度 ~ + 90 度 ; 西经和南纬是负数 ; 经度使用 W ( 东经 ) 和 E ( 西经 ) 表示 , 纬度使用 N ( 北纬 ) 和...---- 1、经纬度坐标距离计算公式 经纬度坐标距离计算公式 : S = 2 \arcsin \sqrt{ \sin^2 \frac{a}{2} + \cos Lat1 \times \cos Lat2...- Lng2 , 是两个坐标点的经度之差 ; 地球半径为 6378.137 千米 ; 使用代码实现上述逻辑 : public class LocationUtils {...° / 40030173 = 0.00000899° 3、实际距离与经纬度换算 1 度经度对应东西距离 1 度经度对应东西距离 : 赤道位置的公式为 : \frac{2\pi R}{360} = \frac...米四、相关代码实现 ---- 1、计算两个经纬度之间的距离 public class LocationUtils { private static final double EARTH_RADIUS

3.6K2 0

Python实践 | 亿级经纬度距离计算工具V2

计算经纬度的代码网上一搜一大把，通常是单点距离的计算，无法实现批量计算，本文将利用pandas实现亿级经纬度距离代码的实现。最短距离计算建议参考下文，mapinfo能够很好的实现。...由于地球是球形，不同纬度下，同一经度差值对应的距离不同，纬度相同且纬度越大时，同一经度对应的距离越小，中国经纬度跨度约为73°33′E至 135°05′E；纬度范围：3°51′N至53°33′N，此处为了计算最大经度差值...不同经纬度差异对应最小距离表格如下： ?...], ser['lat2']), axis=1) 根据经纬度差值判断距离是一个大致的范围，我们选取纬度值54.0获取了最大的经度差值，随着纬度减小，此时计算的距离会大于该阈值，所以要对初次计算结果进行过滤...，经纬度距离亿次计算量耗时约88.73秒，秒杀VBA。

2.4K3 1

如何使用scala+spark读写hbase？

最近工作有点忙，所以文章更新频率低了点，希望大家可以谅解，好了，言归正传，下面进入今天的主题：如何使用scala+spark读写Hbase 软件版本如下： scala2.11.8 spark2.1.0...关于批量操作Hbase，一般我们都会用MapReduce来操作，这样可以大大加快处理效率，原来也写过MR操作Hbase，过程比较繁琐，最近一直在用scala做spark的相关开发，所以就直接使用scala...+spark来搞定这件事了，当然底层用的还是Hbase的TableOutputFormat和TableOutputFormat这个和MR是一样的，在spark里面把从hbase里面读取的数据集转成rdd...整个流程如下：（1）全量读取hbase表的数据（2）做一系列的ETL （3）把全量数据再写回hbase 核心代码如下：从上面的代码可以看出来，使用spark+scala操作hbase是非常简单的。.../spark-hbase-connector https://github.com/hortonworks-spark/shc

1.6K7 0

使用numpy计算分子内坐标

但是除了笛卡尔坐标表示方法之外，其实也有很多其他的方法用于粗粒化或者其他目的的表征方法，比如前一篇文章中所介绍的在AlphaFold2中所使用的残基的刚体表示方法。...换句话说，每一个残基的内坐标是保持不变的，本文主要介绍分子的内坐标表示方法。具体表示方法图片代码实现其实这个算法逻辑是很简单的，我们更多的注重一个原生算子的使用以及代码的复用。...以下是几个相关的关注点：在计算距离、角度和二面角的过程中，我们都会使用到序列原子之间的相对矢量(B, A-1, D)，那么在计算过一次之后我们应该保存下来以供几个不同的函数使用。...在计算相对矢量的时候我们一般使用的是错位相减，比如可以使用crd[1:]-crd[:-1]，但是这里我们在计算过程中使用的是numpy.roll对数组进行滚动之后做减法，最后再去掉一个结果。...总结概要本文主要介绍了在numpy的框架下实现的分子内坐标的计算，类似的方法可以应用于MindSpore和Pytorch、Jax等深度学习相关的框架中。

2707 0

Spark学习使用笔记 - Scala篇（1）

基础 def primitiveType(): Unit = { //scala没有原始类型，都是对象 println("1.toString -> " + 1.toString)..."Hello".intersect("low")) //a.方法(b) == a 方法 b println("1.to(199) -> " + (1 to 199)) //scala...没有受检异常，throw表达式类型为Nothing def handleException: Unit = { //scala没有受检异常 //throw表达式类型为Nothing...at com.hash.learn.scala.Chapter2.exception$.handleException(exception.scala:21) at com.hash.learn.scala.Chapter2....CMain$.main(CMain.scala:25) at com.hash.learn.scala.Chapter2.CMain.main(CMain.scala) at sun.reflect.NativeMethodAccessorImpl.invoke0

4582 0

Android使用FontMetrics对象计算位置坐标

Canvas绘制文本时，使用FontMetrics对象，计算位置的坐标。...80); // FontMetrics对象 FontMetrics fontMetrics = mPaint.getFontMetrics(); String text = "abcdefg"; // 计算每一个坐标

6721 0

Spark学习使用笔记 - Scala篇（3）- 对象

= new Counter println(counter.largerThan(counter2))//输出：true } } Constructor //main constructor...println(person.description)//输出：Name: zhxhash, Age: 24, Salary: 20000 val person2 = new Person("...println(person2.description)//输出：Name: zhxdick, Age: 15, Salary: 0 } } 练习： object Exercise { class...= "[" + hours + ":" + minutes + "]" } def ex03 = { val time = new Time(13, 59) val time2...= new Time(13, 25) val time3 = new Time(14, 25) println(time.description + time2.description

3022 0

在scala中使用spark sql解决特定需求

Spark sql on hive的一个强大之处就是能够嵌在编程语言内执行，比如在Java或者Scala，Python里面，正是因为这样的特性，使得spark sql开发变得更加有趣。...比如我们想做一个简单的交互式查询，我们可以直接在Linux终端直接执行spark sql查询Hive来分析，也可以开发一个jar来完成特定的任务。...（2）使用Hive按日期分区，生成n个日期分区表，再借助es-Hadoop框架，通过shell封装将n个表的数据批量导入到es里面不同的索引里面（3）使用scala+Spark SQL读取Hive表按日期分组...方式二：直接使用Hive，提前将数据构建成多个分区表，然后借助官方的es-hadoop框架，直接将每一个分区表的数据，导入到对应的索引里面，这种方式直接使用大批量的方式导入，性能比方式一好，但由于Hive...生成多个分区表以及导入时还要读取每个分区表的数据涉及的落地IO次数比较多，所以性能一般方式三：在scala中使用spark sql操作hive数据，然后分组后取出每一组的数据集合，转化成DataFrame

1.3K5 0

Spark学习使用笔记 - Scala篇（5）- 继承

items.mkString("") } } object Item{ def test = { val item1 = new SimpleItem(9.9,"pencil") val item2...SimpleItem(99.9,"pen") val items = new Bundle items.addItems(item1) items.addItems(item2)

3442 0

spatial4j.jar用法分享-计算2点经纬度之间的距离

spatial4j.jar计算2点经纬度之间的距离引入jar包 org.locationtech.spatial4j <artifactId

5612 0

Spark学习使用笔记 - Scala篇（4）- 对象、包

包是被载入的 //val a = collection.mutable.ArrayBuffer(1,2,3,4) 语句有错，因为是相对路径引入包 //任意地方可以...1,2,3,4) //也可以绝对路径 val b = _root_.scala.collection.mutable.ArrayBuffer(1,2,3,4)...execute = { //这里不会出错，因为如此定义com和com.hash下的都不可见 val a = collection.mutable.ArrayBuffer(1,2,3,4...HashMap(1 -> 2) val b = new JavaHashMap[Int, Int]() } import java.util....2) } //scala程序默认隐式引入： //import java.lang._ //import scala._ //import Predef._ }

3633 0

Spark学习使用笔记 - Scala篇（3）- 映射，元组

scores = Map("Alice" -> 10, "aaa" -> 9, "bbb" -> 5) //构造一个可变Map[String,Int] val mscores1 = scala.collection.mutable.Map...("Alice" -> 10, "aaa" -> 9, "bbb" -> 5) val mscores2 = scala.collection.mutable.Map(("Alice", 10...), ("aaa", 9), ("bbb", 8)) } def curdMap = { val scores = scala.collection.mutable.Map("Alice...for (v <- mapping.values) yield v println(c)//输出：List(10, 9, 5) } def sortedMap = { //scala.../输出：3 } 链式操作： def test = { val key = Array("zhx", "dick", "hash") val value = Array(1, 2,

3962 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭