前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【图像分割】图像分割专栏栏主自述:分割,我们究竟在研究什么?

【图像分割】图像分割专栏栏主自述:分割,我们究竟在研究什么?

作者头像
用户1508658
发布2019-07-27 20:14:03
6380
发布2019-07-27 20:14:03
举报
文章被收录于专栏:有三AI有三AI

专栏《图像分割模型》已经完结,也是时候向大家正式介绍一下自己了。趁着新专栏刚刚开始,也借此机会聊聊在我眼中,我们做的分割究竟是什么,又该怎么做。

文/编辑 | 孙叔桥

我是谁

我叫孙叔桥,从14年开始从事计算机视觉研究,先后研究过目标检测、视觉跟踪、立体匹配和图像分割四个主要领域,对基于深度学习的图像处理的相关问题比较熟悉。

作为有三AI的专栏作者,我负责图像分割领域的相关文章。目前,已完结专栏《图像分割模型》,主要介绍在图像分割领域的主流网络结构及设计思想;正在进行中的专栏《图像分割应用》,旨在从应用角度分析各领域内的图像分割问题。

下面聊聊我是怎么开始计算机视觉的吧。其实,与其说是我选择了从事计算机视觉,不如说是计算机视觉找到的我。

入坑是从本科毕设开始的,题目是硕导定的,恰巧我也感兴趣,就这样一拍即合。要是早点知道这个研究方向会从本科一路陪我到博士,还火的一塌糊涂,我可能管管自己的性子,早早用功努力。

选题后不久我就去了国大做交换生,在新加坡的Universal Studio里,计算机视觉在我脑海里留下了第一批具体印象:虚拟视觉加小型过山车太爽了!飞下来救我们的变形金刚好帅!法老那个简直High翻天!

显然,在那个时候的我眼里,所有计算机+视觉的东西都属于“计算机视觉”,至于包括什么、应用领域、实现方法都还一无所知。

后来随着研究的慢慢深入,我慢慢接触了计算机视觉的几个细分领域,掌握的知识和技能也逐渐丰富。此时,计算机视觉与神经网络在我的脑海才真正算是有了点形态,其中的趣味也就慢慢显露了。

我眼中的AI和图像分割

经常有人问我,你是不是搞人工智能的啊?其实,这个问题我不知道该怎么回答。要说是吧,我做的东西其实是底层的技术,计算机视觉层面的东西,这东西我认为它自己是无法单独被称为“人工智能”的,所以我做的东西并没有人工智能这么庞大;但要说不是吧,计算机视觉确实是人工智能的重要一环,它是机器的眼睛,甚至能成为人类眼睛的延伸,确实某些应用领域下就属于人工智能。

后来,我就不纠结这个问题了。别人问我,我就回答“我做计算机视觉的”。要是提问者认为这个回答是肯定,那就是肯定;要是否定,那就是否定。

至于我为什么要做计算机视觉,我以后想不想做,倒是我经常问自己的问题。我深知,哪怕是计算机视觉随便拿出一个芝麻大的分支,也有太浩繁的知识、技巧、应用领域;以我的能力和精力,是不可能面面俱到的,我也不想。我只想用我能做到的事让日子过得轻松一些。

所以,AI和计算机视觉在我眼中,更像是夏天的空调、冬天的暖气,一个小工具罢了,更需要关注的反而是实际生活中遇到的问题和如何去解决。

目前所专注研究的图像分割恰巧是一个切入点。在我看来,图像分割所实现的功能更贴近于人类认知世界的结果。比如我们看到了一个杯子,其实是识别出了杯子所存在的整个空间,根据要实现的目的,我们选择性地是只利用“杯子”这个标签还是整个空间都利用上。举个例子,比如我们需要用杯子接水,那么只需要正确拿起杯子就可以了;但是如果要收拾桌面,则需要保证不会有其他东西砸在被子上面。这也是为什么我选择了图像分割。

即使图像分割已经是一个很具体的方向,但是其需要研究和学习的内容也非常庞杂。从传统的图像分割方法到基于深度学习的方法,其中涉及到的基础知识、网络模型、设计思想、代码实现等等,是一个交叉领域的学习过程,包括了数学、计算机、信号处理、优化等多个学科。公众号内发表的专栏更多的是让大家对这个领域有一定的了解,但是想要真正掌握图像分割的技术,还是需要实际的动手与操作的。

我与有三AI

与有三AI的相遇是个巧合,悄悄关注了很久然后就瞅准机会加入了这个“神秘组织”。组织的老大有三是个很拼的技术大神,但私下却难得的活跃和亲民。他给我们足够的自由决定要做什么,却也用每天的更新提醒我们牛人已经开始工作。很幸运能够遇到这个集体,并逐渐融入。虽然在技术的路上还任重而道远,但我相信,与同样有梦想的人一起坚持,总能做点事情。

目前已经完结的《图像分割模型》专栏面向的是有一定深度学习基础,想要入门图像分割领域的人群;正在进行的《图像分割应用》则是面向想要找到能够实际落地方法的人。后续可能会在公众号开展面向小白的介绍类文章,并配套专栏在星球内展开面向工程师们的代码研读。想了解更多图像分割领域的内容并向我们提问,欢迎大家关注”有三AI图像分割”微信群和”深度学习+图像分割”星球。

路漫漫其修远兮,吾将上下而求索。与君共勉。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 有三AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档