前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >项目四 OpenRefine 处理北京公交线路数据

项目四 OpenRefine 处理北京公交线路数据

原创
作者头像
弟大翻着洗
发布2024-09-23 09:09:04
960
发布2024-09-23 09:09:04
举报
文章被收录于专栏:人邮电数据采集与预处理

服务器启动OpenRefine

  • 根目录下启动OpenRefine 脚本
  • 复制web地址至浏览器

导入csv数据

  • 左上角设置语言
  • 设置完毕点击右上角的新建项目

列格式的转换功能

  • 选中功能
  • 输入表达式 value.replace("运行时间:" , "")
  • 运行时间:替换为空字符串
  • 最后单击确定即可
  • 输入表达式value.replace("[", "").replace("]", "")
  • bus_type列的[]去掉

派生新的列

  • 派生公司列
  • 派生为服务热线列
  • 将服务热线的列转换出对应的格式
  • 输入表达式value.split("(")[1].split(":")[1].split(")")[0]
  • gongsi列的电话号码提取出来

导出数据

  • 右上角点击导出
  • 选择文件格式即可导出

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 服务器启动OpenRefine
  • 导入csv数据
  • 列格式的转换功能
  • 派生新的列
  • 导出数据
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档