数据智能=云计算+大数据+算法,袋鼠云高级算法专家胡丰十年如一日的深耕历程

胡丰,福建人,真名胡逢法。源于福建人基因里的HF不分,他偶尔也对自己的名字感到些头疼,于是取花名的时候沿袭了学生时代的别称“胡丰”,,一则意味丰收,二则也是为自我介绍的时候降低难度level。他笑称:胡丰总比胡逢法要好读些吧。虽然依旧逃不开HF的“魔咒”。

2018年6月23日,养码场将会联合袋鼠云、3W举办一场关于“数据智能实践”的线下主题技术沙龙,借着这个由头,场主成功地搭上了作为讲师之一的袋鼠云高级算法专家胡丰。

为什么要聊胡丰?

大数据风口下,这位10年算法经验技术人可以给出一些行业见解与前瞻;呆过上市公司,也会选择一家当时仅1岁的年轻初创团队,中年转型或许可以给技术人一些思考;发表第一作者发明专利十余篇、国际发明专利一篇,技术大牛的成长史究竟如何。

带着很多的好奇和面见大佬的心态,场主访谈了胡丰。有些谦虚,话不多但很真诚,这就是场主对胡丰的初始印象,而根据胡丰的“战友”爆料:胡丰很低调、不太会说场面话,是个对待工作特别严谨的人,最后更是不忘调侃一句: 我们袋鼠云的日志产品(EasyLog),在胡丰口中则变成了“绿聚”产品。

仔细一算,这是胡丰深耕图像处理、模式识别、机器视觉等领域的第十个年头,从研究生毕业后,选择了杭州这个城市,一呆就是10年,本科学的是通信却对支末的图像感到“有意思”、“会火”,于是跟着主攻计算机视觉的研究生导师开始深钻,毕了业就入行,也是10年,很是长情。

确认过眼神,袋鼠云是我想去的地方

曾经在坐拥6000+人的研发技术团队的上市企业工作,最后却选择进入仅有4人的初创技术团队。前者是胡丰有着3年情谊的老东家——大华(浙江大华技术股份有限公司),后者则是胡丰的新战地——袋鼠云。

进入到一家刚成立一年左右的互联网公司——袋鼠云,胡丰坦言:“做出这个选择自己也考虑了很多。”

当技术人职业发展到一定程度时,更多的会去考虑技术对业务的赋能,在团队中的角色(开始学会团队协作,和其他伙伴一起配合做项目),产生管理的需求。对于胡丰自身而言也是,希望寻求突破,寻求更加年轻化的互联网企业。

做了很多功课也接触了很多的大厂岗位,最后发现,天猫、搜狐、闲鱼、蚂蚁金服……互联网一亩三分地的动物园里其实还有一只袋鼠云。联创团队里都是阿里系出身的大牛,创始人拖雷更是阿里11年老兵;互联网的氛围年轻有活力,也是对自己的转型考验……这些都是胡丰选择袋鼠云的原因。

现在,胡丰陪着袋鼠云度过了1年的时间,做着自己喜欢的工作,见证一个团队、一家企业的飞速成长。从2016年1月6日诞生直到今天,尽管袋鼠云刚满2周岁,但是成立一年半,累计融资一个亿,更是被外界评为估值超过1亿美元的准独角兽公司,成为闪闪发光的明星宝宝。技术团队也从最初的4人扩展到了150多人,占公司总人数的80%,胡丰一手带着的算法团队已经有 20余人,每一个在图像算法、自然语言、深度学习等细分领域还都特别能打。

胡丰认为,自己不仅仅是一个技术人,还是一个技术管理者、一个创业者。或许可以说,袋鼠云的土壤给了他这样的机会,让他见证、参与团队的架构、项目的推进,也完成了他转型、学习提升的初衷。

数据智能,让未来变成现在

目前,袋鼠云在工业场景和OCR有了一定的沉淀和算法模式积累,其他应用场景也在深耕细作地实践,未来会形成全场景多矩阵的大数据应用。

注:袋鼠云正在测试OCR技术在社保领域实现异地医疗报销的文档识别,报销者获得医疗清单后,社保局通过拍照图像进行自动识别关键字段,智能比对减少人力资源的输出,胡丰表示,目前OCR在医疗各类证件及报销单据识别准确率高达90%。

除了通用算法,根据不同B端用户的差异化需求和个性化特点,胡丰表示团队也在做定制开发,“譬如图像识别场景中就覆盖了人脸识别、车牌识别等,在算法上都会存在差异”。而针对B端做差异化算法定制时,会面临一个问题:聚焦细分行业用户的打法对于技术团队来说具备行业壁垒,尤其是涉及工业等不被大众熟悉的产业。

据胡丰介绍,工业场景的门槛高,而且进行图像识别处理的时候往往和业务流程相关,这意味着人眼识别看似相同的缺陷实则原因可能来自于产业线不同环节的问题。譬如之前做过的一个项目是服务于半导体行业的一家企业,技术团队就是针对该客户的业务流程、产业线进行精准评估后,通过图像算法识别生产线上的产品缺陷,譬如将A流程的图片识别归为一类,B流程的图片识别归为另一类,而各个流程内存在缺陷、腐蚀等问题的又二次归类区分。面对行业壁垒较高的应用,胡丰给出的建议是“沟通”,不断地主动地和B端交涉,从而将算法与业务流程相结合从而分析落地。

针对一些保密级别较高的企业,胡丰甚至会带着团队到现场开发,通过考察、调研将算法输出到该客户的自有机房,减少客户的损耗。所以办公室里经常找不到胡丰,问及:胡丰去哪了?答曰:又被抓去现场了!

不久前,胡丰就出差到贵州,为贵州交警项目做现场算法开发项目推进及茅台集团定制的大数据可视化展示解决方案,通过数据建模分析,NLP自然语言处理技术帮助在茅台实现标签聚类,快速形成画像系统,这个解决方案还在中国国际大数据产业博览会上亮相。而直到项目落地后,胡丰才忍不住发朋友圈:“凉凉的贵阳辣辣的粉,辣得拉肚子没商量。”这就是算法专家的真实生活,忙碌但是可以感受到价值。

袋鼠云一直以来的slogan:数据智能,让未来变成现在。而对胡丰来说,可以让更多人接触到算法,让算法和大数据更好地结合就是他期待的未来和为之努力的现在!

我或许败北,或许迷失自己,或许哪里也抵达不了,或许我已失去一切,任凭怎么挣扎也只能徒呼奈何,无所谓。有一点是明确的,至少我有值得等待有值得寻求的东西。

原文发布于微信公众号 - 养码场(yangmachang0)

原文发表时间:2018-06-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏企鹅号快讯

斯坦福年度AI报告:人工智能全面逼近人类能力?

人工智能有多火,相信铺天盖地的新闻已经证实了这一点,不可否认,我们已经迎来了人工智能的又一次高潮。人工智能会给哪些行业带来新的生命力?它接下来的发展大方向是什么...

23080
来自专栏人工智能LeadAI

报告丨2016年全球人工智能十大热点事件

? 2016年,全球人工智能技术和产业发展迅速,公众对人工智能的关注持续上升。在对该领域的重要事件进行分析和比较的基础上,选取了2016年该领域十个最具有影响...

31570
来自专栏AI科技大本营的专栏

一周看 AI | TensorFlow1.2.0版发布,美国2.58亿启动E级超算研发

hello,大家好,我是依然熬周末为大家写总结的小ai妹。我们来简单回顾下这周有哪些热门事件。 TensorFlow1.2.0版发布,新增14大新功能,热不热?...

43760
来自专栏DT数据侠

担心被“暴雷”?不如做好数据的“为用之道” | 数据科学50人·李丹枫

李丹枫,【友盟+】CDO首席数据官,本科毕业于清华大学,在美国伊利诺伊大学(UIUC)电子与计算机工程专业取得博士学位。“用之为用之,不用为不用,是为用也”,从...

11920
来自专栏达观数据

大数据挖掘技术在企业创新中的应用(下篇)

4、应用、方式和收益 4.1数据统计是大数据的最直接应用 数据统计是大数据应用的最直观的形式,数据统计在企业中常被称为商业智能(BI, Business Int...

35370
来自专栏灯塔大数据

深度|大数据落地,带来了权威的转移

翻看科技发展史,当某些跨时代的技术转捩点来临之时,两种状况似乎同时出现:大众观念里的鸡同鸭讲,以及,从业者对于概念追逐的狂热。近几年一个好例子即是:大数据。 ...

36550
来自专栏大数据文摘

沿着地铁买房怎样更划算?2017上海城市大数据报告发布

18850
来自专栏新智元

【当金融遇到人工智能】富者越富,穷者愈穷?

《21世纪资本论》通过详实的数据研究,提出了一个观点:20世纪70年代以来,在全球范围内投资增长率高于经济增长率。 全球范围内贫富差距扩大,富有者越发富有,而贫...

39140
来自专栏量子位

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

这是2011年诺贝尔经济学奖获得者托马斯·萨金特(Thomas J. Sargent)近期在中国公开演讲时对AI的结论。

16220
来自专栏PPV课数据科学社区

【聚焦】旅游大数据,你看懂了吗?

  小林用一家在线旅游公司平台搜索比较了机票和酒店价格,然后进行预订,在他的自由行旅游结束后,他写了游记并将旅行照片上传到朋友圈……上述一系列如今在游客中司空见...

47450

扫码关注云+社区

领取腾讯云代金券