前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【干货】谷歌 TensorFlow 工程负责人:标记大规模图片的最简方法

【干货】谷歌 TensorFlow 工程负责人:标记大规模图片的最简方法

作者头像
新智元
发布2018-03-28 14:13:18
9250
发布2018-03-28 14:13:18
举报
文章被收录于专栏:新智元

【新智元导读】前谷歌 TensorFlow 工程负责人 Peter Warden 和大家分享了利用 OSX 系统里的 Find 快速为大规模图片打标签,以优化深度学习的训练集合的方法。

我发现:如果想在深度学习中得到优质结果,收集大量数据的能力比使用最新的架构更为重要。因此,自从入职了 Jetpac,我投入了很多精力研究优化训练集合的最佳方法。我使用过,甚至自己写过许多不同的为此设计的用户界面,但最后令人惊讶的是,OSX 系统里内嵌在 stock 中的 Finder 的生产力居然是最高的!

通过以下方法,我可以在一个小时内整理好数千张图片:

  • 把图片复制并解压到 OS X 系统中的文件夹中。
  • 在 OS X的 Finder 应用(普通的文件浏览器)中打开这个文件夹。
  • 在 Finder 中选择以分栏视图浏览文件(在窗口顶端的工具栏中,视图浏览方式从左数的第三个图标)。
  • 选择第一张图片。你可以在右边的栏目中看到该图片的预览。
  • 把鼠标指针移动到窗口的右侧边缘,鼠标会变成“向左/右拖”的图标。
  • 拖动 Finder 窗口的右侧边缘,预览窗口会相应变大。当预览大小不再改变的时候,停止拖拽。

现在,你应该能看到一个这样的窗口:

有许多灵活运用这个功能的办法可供参考。假如我想从一组杂乱的图片中剔除一些分错类别的图,我就会用“上”,“下”键在图片中移动,并且快速判断预览中的图片是否需要删除。如果需要,就直接按下 Command 和 Delete 键删除该图。非常方便的是,删除后,窗口会自动呈现下一个图像。

如果我有一大堆图片需要分别标记到不同的类别中,而非简单地剔除杂项,那么我就会使用稍微复杂一点的办法——OSX 系统中的“标签(Tags)”功能。

首先,你要在键盘中创建一个打开标签菜单的快捷键,具体方法可参考如下说明:http://hints.macworld.com/article.php?story=20140504114022595;然后,使用“下”键浏览文件,并同时给文件贴上标签。不幸的是OSX已经取消了仅用单键贴标签的功能(老版本可行),但是这仍不失为一个给大量图片标签分类的好办法。

另一个我常用的快速剔除小部分杂项文件的办法是:在 Finder 中用图标视图打开图片文件夹,然后增大位于窗口右下角的预览视窗的大小。你可能还要从顶层的菜单里选择“显示->排列方式按->名称”,从而确保放大的图标可以在窗口中完全显示出来。

这个办法没有用分栏视图检视每张图片那么高效,但是如果我想快速浏览找到杂项的时候,就非常便利了。我通常都会直接拖动右边的滚动条或者直接用鼠标滚动,快速浏览整个文件夹,然后点击选取我要删除的文件。

我青睐这些小技巧的原因主要是因为它们的“轻量”,我不需要下载任何特定软件,而且Finder 加载预览的速度可以打败任何我用过的客户端软件,浏览图片的速度非常快。总而言之,我希望我的总结对你有所裨益。如果你有自己的标签小窍门,欢迎在 Twitter 上跟我交流。

原文地址:https://petewarden.com/2017/04/26/how-to-label-images-quickly/?nsukey=SceqDkLT4ERF6fEsL2U5wzb5olksVYIamH7y3NkVIYK9XZ9FSnK+wfO1coh12Oqto8D2CXufpwZzN5GRhRj5NA4daUGaCgKILdXPbgOrxiRv2a/2abTknOHHfc35KFBA+J2N7ft0ENHO38cFyo4Z7i+Okqflu189UMWPlXpnc1S8oMg0bGiVmUGzn2OS+5i6

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-05-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
内容识别
内容识别(Content Recognition,CR)是腾讯云数据万象推出的对图片内容进行识别、理解的服务,集成腾讯云 AI 的多种强大功能,对存储在腾讯云对象存储 COS 的数据提供图片标签、图片修复、二维码识别、语音识别、质量评估等增值服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档