这多年来我一直在钻研的技术

我大学时代最爱玩的一个游戏,法老王-埃及艳后,这是一个以古代文明为背景的城市建设游戏。最近又捡起来玩了玩,还是那个味儿,倍爽。

上次有人说,听说tinyfool看到AlphaGo火了,马上去赶时髦学机器学习,结果真的获益匪浅。

我给大家介绍下,我从业10多年是怎么赶时髦的吧。

怎么赶上搜索技术的时髦

98年,第一次上网,也是第一次看到Google,那时候简直觉得Google就是天下第一的好东西。互联网是个无穷无尽的宝库。但是没有Google这把钥匙,你什么也不知道。

那时候,我就对搜索技术很感兴趣。一直在看各种技术文章,但是因为基础的问题,对各种文章的描述也不是很懂。01年,我根据一些自己的理解,写过一个原理性 的单字倒排搜索引擎,那时候,我连怎么做好中文分词都不了解。05年,看文章知道了Lucene,但是一直没有机会用,也没上过手。

08年做技术咨询的时候,客户想上一套搜索,方案公司的报价是20万。客户询问我们有没有解决方案,我当时觉得是个千载难逢的好机会,我就跟霍炬商量好,我们 试试看客户满意的话,未来还可以卖给别人。但是我们两个当时的技术路线思路不同,我看好Lucene,基于Java开发简便社区成熟,文档全面,刚刚还出 了本Lucene in action,他看好Tokyo Cabinet作者用C++写的一个搜索内核。春节放假回家,我们各自写一套,因为大家技术路线不同,所以越好不吵不闹,看产品见真章。春节7天假后,我 的更成熟一点,所以他的就放弃了。

马上交付客户,客户很满意,搜索流量暴增且每天都在持续增长,一个月不到,客户的竞争对手打电话要求买一套。

这套系统曾用于饭统、点评、六间房、FtChinese,等公司。单一服务器最大日搜索量2000万次。

怎么赶上移动互联网的时髦

01-02年,J2ME刚刚推出来的时候,我就很有热忱想在手机上写程序,但是受限于当时J2ME的设计思想,以及当时手机的机能,玩了玩,我觉得这不是我要的可以编程的手机。

其后到iOS之前,所有流行过的手机操作系统和开发环境我都碰过。我研究过J2ME在Nokia s40上的开发,研究过Symbian,研究过Android 1.0 SDK,那时候还没Android手机呢。

到了07年乔布斯宣布iPhone的时候,我觉得这就是我梦想的手机。但是那时候没有原生SDK,只有一个Web SDK,我第一时间就开始玩,后来失望的放弃了。过了1年以后,乔布斯发布了当时还叫iPhoneOS SDK的iOS SDK第一版。当天,我就发邮件给在美国读博士的朋友徐宥,请他用他的信用卡帮我买了一个开发者账号。

有了开发者账号后,我自己开发的第一个App是运行在我在朋友公司年会抽奖,运气好,得到的iPod touch上的一个记账软件。这个软件大概开发了2个星期以后,网易有道的人辗转找到我,请我帮我开发有道词典iOS版。

后来,有道词典iOS版是我上线App Store的第一个App。

最近为什么在赶机器学习的时髦

08-09 年,我们做搜索创业的时候,我就开始自学机器学习。那时候,机器学习的理念还不是很流行,更多的说法还是人工智能。还是徐宥博士,他读完回国探亲的时候, 因为他是相关专业的博士,所以他给我做了最早的启蒙。当时人工智能行业的现状,为什么从规则开始往概率转变。为什么现在流行的概念是机器学习,什么是监督 学习和非监督学习,等等。

那时候开始对机器学习感兴趣的主因是,我们做搜索的时候,大量的看跟Google有关系的东西,当Google有了大量数据积累后,大量的使用机器学习去改善自己的搜索结果,寻找更好的组织信息的方式,等等。

我是国内当时最早翻译Google GFS、Mapreduce、Bigtable论文的人之一。Google公布这三篇论文后不久,Lucene的创造者Doug Cutting就领导创建了Hadoop社区,后来还创建了Mahout,这个当然后来不够火。但是我们的研究和对市场的分析都认可,我们的搜索服务未来 和机器学习服务是非常相配的,所以,我当时花了很大精力在学习机器学习和研究怎么把他们搞成服务。我们可能也是做搜索服务的公司,最早给用户提供搜索数据 分析服务,关键词提醒服务等等,这些都是从搜索服务延展到数据服务的例子。

后来,美国次贷危机造成我们A轮融资失败以后,我们被经济形势吓到了,公司关门了。后来,我们几个先后去了盛大。而当时盛大对iOS方面的人也很缺乏,所以,我暂时就放下了机器学习。

那个时候,深度学习还没有兴起。大概是12年的一次imagenet的比赛上,深度学习的结果夺冠,然后各种比赛和论文都表现出深度学习的效果和便利性以后,才大行其道起来。

自学机器学习暂时放下以后,在我自己的网站,还让我当时的下属,在我的指导下,搭了一个贝叶斯的文章分类器做自动抓取,自动分类,放了很多年。最近,关了上 一家公司,才又有时间和心思专心学了一段时间机器学习和深度学习。当然,有动力去好好学,也是跟深度学习最近有了非常多可惜的进展有关。

不得不告诉大家的是,AlphaGo真的不算里面多重要的一个。当然AlphaGo有其非常大的价值,因为它是外界最容易理解的,也是最容易被误解的。就跟 当年的深蓝一样,其实深蓝本身对这个世界的价值不大,但是深蓝引发了大家对机器智能的兴趣,激起很多相关的讨论和研究,这是它的价值。

原文发布于微信公众号 - 磐创AI(xunixs)

原文发表时间:2018-07-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏JAVA高级架构开发

程序员如何在百忙之中不走岔路,不白忙!

程序员忙,似乎是个公论,有些程序员甚至会认为,不忙的程序员无法快速地进步,从而会落伍。或者说,不忙的程序员有可能被公司末尾淘汰掉。对此,一直危机感很重的我深以为...

1000
来自专栏智能算法

深度 | 美国大选 Facebook 误导公众?智能时代,推荐算法主导群体意识

作者:胡祥杰,刘小芹 Facebook 将一则美国大选的假新闻置顶,引发热议。在批判 Facebook 的喧嚣之中,很少有人看清,问题的本质并非 Facebo...

3795
来自专栏BestSDK

产品的成败,关键在设计!

在不到一秒钟的时间内,决策就已经开始了。人是视觉动物。因此设计对说服人的工作效果影响巨大。设计影响着受众对内容的第一印象,影响着用户的消费决策和营销效果。 在你...

2505
来自专栏大数据文摘

艺术和科学的奇妙结合:虚拟现实技术能拯救大数据吗?

1833
来自专栏数据的力量

水平思考——突破创新的思考方式

982
来自专栏PPV课数据科学社区

【观点】数据挖掘三要素解析

我对数据挖掘和机器学习是新手,从去年7月份在Amazon才开始接触,而且还是因为工作需要被动接触的,以前都没有接触过,做的是需求预测机器学习相关...

2795
来自专栏奇点大数据

大数据变现十日谈之八:门槛和工具

已经谈了七天的大数据变现相关话题,今天我们来聊一聊大数据变现的门槛和工具。我们先说说门槛。 说到大数据变现的门槛,我想这种门槛主要是来源于两个方面的。 方面一,...

3427
来自专栏新智元

深度 | 美国大选 Facebook 误导公众?智能时代,推荐算法主导群体意识

【新智元导读】Facebook 将一则美国大选的假新闻置顶,引发热议。在批判 Facebook 的喧嚣之中,很少有人看清,问题的本质并非 Facebook 传播...

42012
来自专栏CDA数据分析师

如何成为一名数据科学家 | 学习篇(附视频中字)

CDA字幕组 编译整理 本文为 CDA 数据分析师原创作品,转载需授权 数据科学家是21世纪最性感的职业,那么该如何成为一名数据科学家呢?HackerEarth...

2457
来自专栏程序员互动联盟

三种人学不会编程

很多人都觉得编程入门特别难,特别在刚开始的时候,敢问切入一个新的行业不付出点努力,不坚持下不深刻的挖掘下自己的潜力,都会觉得难得不行。编程学习的成本相对比较低廉...

2814

扫码关注云+社区

领取腾讯云代金券