我在Pandas中有一个数据框,其中有一列标记为“Location”。
该列是一种对象数据类型,并且在列中采用以下格式:
位置
点数(-73.525969
41.081897)
我想删除格式,并将每个数据点存储在两个列中:纬度和经度,这两个列必须创建。我该如何做到这一点呢?
我评论过的类似帖子总是在数字之间有分隔符(例如逗号),但这篇文章没有。谢谢!
序列号列表年份日期记录的城镇地址评估价值销售量销售比率物业类型住宅类型非使用代码评估者备注位置0 141466 20142015-08-06斯坦福德83 OVERBROOK DRIVE 503270.0 850000.0 0.592082住宅单户NaN点(-73.525969 41.081897) 1 140604 20142015-06-29新黑文56海景街86030.0 149900.0 0.573916住宅单户NaN点(-72.878115 41.30285) 2 14340 2014 2015-07-01里奇菲尔德32俯瞰DR 351880.0 570000.0 0.617333住宅单身家庭NaN POINT电话:(-73.508273 41.286223) 3 140455 20142015-04-30新不列颠171 BRADFORD WALK 204680.0 261000.0 0.784215住宅共管公寓NaN POINT电话:(-72.775592 41.713335) 4 141195 20142015-06-26斯坦福特区格伦布鲁克路555号229330.0 250000.0 0.917320住宅单身家庭NaN POINT电话:(-73.519774 41.07203)
发布于 2021-08-22 17:52:34
您可以使用pandas.Series.str.extract
df['Location'].str.extract('POINT \((?P<latitude>[-\d.@+])\s+(?P<longitude>[-\d.@+])\)').astype(float)
您可能需要根据实际输入更改\s+
分隔符
https://stackoverflow.com/questions/68883636
复制相似问题