我有来自不同餐馆的数据,它们也有餐厅的地址,现在我想根据给定的数据预测送餐时间,现在餐厅地址是我需要预测送餐时间的关键数据之一,现在我的问题是地址是字符串格式,所以我如何处理这个地址来输入ML模型中的数据。我总共有35个唯一的地址,如果我做一个热编码,我的数据集将非常大,它将花费太多的时间来训练,除了一个热编码处理餐厅的地址。
数据样本-
发布于 2019-11-20 17:27:55
您可以将每个地址转换为一对地理坐标(纬度、经度)。这样,您就可以粗略地测量不同位置之间的距离。例如,这可以通过Google来完成。
我建议你使用计算曼哈顿之间的距离,以便正确估计城市内的旅行时间。
发布于 2019-11-20 18:01:01
有一些API有很好的限制免费的每日通话,您可以使用它将世界上每个单独的地址转换为一个( Lat,Lon )点。然后,这些Lat - Lon点可以用来做一些地理分析,或者像上面所建议的那样,用曼哈顿距离来寻找旅行距离,以便在ML模型中使用。Lon还可以帮助您开发许多有趣的Insightsa dn,也可以与其他数据集相关联。
您还可以将您的信息分组到主要城市区域,然后您可以使用这些区域来估计交付时间。
共享几个Geocoding API的名称
希望这对你有用!
https://datascience.stackexchange.com/questions/63437
复制相似问题