前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >李开复看好AI创业为天使投资人支招,谷歌大牛分享处理极大复杂数据的三类实际建议 | 大咖周语录

李开复看好AI创业为天使投资人支招,谷歌大牛分享处理极大复杂数据的三类实际建议 | 大咖周语录

作者头像
数据猿
发布2018-04-20 14:49:48
6770
发布2018-04-20 14:49:48
举报
文章被收录于专栏:数据猿数据猿

数据猿导读

对于大数据的概念以及大数据在各行业的应用,每个人心中都有不同的看法。小编每周都会整理大数据牛人们的精彩观点,让你在最短的时间获得最精的思想荟萃。后续,数据猿也会邀请更多行业大牛通过线上线下等形式,对目前大数据行业的现状进行深度交流,汇集更多“大咖语录”给大家。

创新工场李开复表示,AI是中国领先全世界的最大机会。AI创业要成功,需要AI科学家和懂这行的销售人员,一个合格的天使投资人需要去“牵线搭桥”,“撮合”双方;谷歌数据科学团队负责人在处理极大复杂数据方面分享了技术、过程、沟通三大类实用建议……更多精彩观点尽在本周的【大咖周语录】中。

星图数据CEO谷熠:企业最大化实现数据价值的“三部曲”

一直以来,资本市场大力鼓吹“DaaS服务要做中小型企业市场”,但我认为,DaaS服务模式就应该做大客户市场,企业不要因为资本市场的风向变化而改变自己的发展之路。

大数据时代,企业的数据价值一定是结合具体场景产生的,完成“三部曲”企业方可实现数据价值的最大化:

1、“决策辅助”,这是数据最基础的价值——“情报兵”作用。无论是数据报告还是数据交易,企业要利用好自己的数据,为自己提供“情报”服务。

2、“辅助决策”,数据的中层价值——“军师作用”。通过数据分析,企业决策者能够高效的调整包括价格、促销、产品线规划、广告投放策略等在内的营销方案。

3、“替代决策”。大数据的最高层价值是要替代企业决策者,结合企业内外部数据和AI算法,帮助企业做出最优决策,实现自动下发执行。

原文链接:

http://www.datayuan.cn/profile/9140.htm

创新工场李开复:人工智能创业正热,一个合格的天使投资人应该“搭桥牵线”

AI是中国最大的机会,中国有充分的理由在人工智能时代达到世界领先的地位,因为人才在这里,市场在这里。

对于天使投资人来说,要追寻一个良性的天使投资生态系统:有附加价值、技术、市场和人脉优势的人。每一个创业者起初找“天使”,并不只是寻找资金,更多的是需要“天使”在他们初创时给予一些解决问题的办法与对策。

AI的创业成本要很高,从人才角度看,AI创业要成功,需要AI科学家和懂这行的销售人员。这两类人都很稀缺,同时兼具两种特质更是难上加难,因此合格的天使投资人需要去“牵线搭桥”,“撮合”双方。当然最初始、最重要的是先找AI科学家,他们对产品有一定的理解,才能打造出一个AI,之后再找一个面向企业的销售做科学家的初始搭档。目前,很多业务都是按照这种方向发展的。

创业者们,当你找第一笔投资的时候,千万不要只看金额和估值,更多的是要看投资背后能帮上你的附加值。

原文链接:

http://www.datayuan.cn/article/9138.htm

信天创投蒋宇捷:不靠风口也能成功,未来的创业机会在人工智能和大数据

移动互联网红利已经结束,但没有红利也可以成功,只是会花费更多时间和精力。未来的创业机会在人工智能和大数据。

创业者可以从细分领域切入,最后通过智能化产品解决不同行业共通的问题,最后做成平台级产品,而这种产品的市场规模,很有可能是千亿美元级别。更重要的是,目前进入大数据和AI领域的并不多,每个细分行业都有大机会。

但是,大数据行业还有两个问题咎待解决:数据不互通和数据格式不统一。

一方面,很多第三方企业有价值的数据都是用私有化方式进行存储,不能利用公开有效的方式进行流通和交易,造成数据不互通。

另一方面,各行各业甚至同行业之间的数据格式不统一,给大数据技术公司与服务公司带来一定门槛和要求,并降低了行业的整体效率。因此必须将数据进行清洗或重新分装,才能进行更好的抽取和搜集数据,必须通过大数据交易平台来完成,还要统一行业大数据的标准。

原文链接:

http://www.datayuan.cn/profile/9062.htm

谷歌数据科学团队负责人:处理极大复杂数据的三类实际建议

许多工程师和分析师养成了下面这些习惯,并进行高质量的工作,总结起来,有三类:

技术:

1、数据分布。需要时常关注分布的更丰富的表示形式,比如直方图、累积分布函数(CDFs)、Q-Q图等,决定如何总结它们。

2、考量异常值。关注数据中的异常值,它们会成为“煤堆中的金丝雀”,是分析所暴露的更基本的问题。如果将他们排除或者归类,要确保自己为什么这样分,但要注意花费在异常值里的时间,有一些异常值是永远无法解释的。

3、报告噪音或者置信度。

4、划分数据。将数据划分为不同的子集,分别看下在这些子集中测到的值。当划分数据来比较两组时,需要注意混淆的迁移。

5、检查经过时间后的一致性。很多人以时间为单位划分,通常一个特征或初始数据集的初始版本将会受到仔细的检查,但是依这种方法继续,出现例外并不罕见。

过程:

1、分开验证、描述、评估。探索性数据分析的三个相互关联。

2、确认实验及数据收集的建立。实验者和分析师之间交流融洽,是一个巨大的挑战,看任何数据之前,确保了解实验和数据收集的设置。

3、检查关键标记。“验证”阶段的重要组成部分。

4、标准化第一,个性化第二。一个不容改变的检查规则。

5、测两遍,甚至更多。通过使用多种测量,可以鉴别测量或日志记录代码中的错误,底层数据的意外特征,或过滤出一些重要的步骤。如果用这些测量方法测量不同的数据源,更好。

6、检查再现性。分割和一致性随着时间的推移是检查再现性的特定例子。

7、检查与过去测量的一致性。新的指标应该首先适用于旧的数据/特征,当你收集一种新型数据时,应该首先将此数据应用到已知的特征或数据。

8、提出假设和寻找证据。一个复杂问题的探索性数据分析是迭代的,如果发现数据的异常、趋势或其他特征,一定要提出假设并且寻找证据。

9、从端到端迭代获益的探索性分析。最初的重点不应该是完美,而是一路得到合理的东西。给自己留笔记,并承认像过滤步骤和数据记录这样你不能分析/理解的东西,但所有在探索性分析开始时试图摆脱这些就是在浪费时间。

沟通:

1、数据分析从问题开始,而不是数据或技术。不带问题的分析始终是地毫无目的。

2、教育你的消费者,当你的数据具有较高的被曲解或选择性地列举的风险时这一点尤其重要。

3、做怀疑者和拥护者。当处理数据时,你必须做一个获得见解的拥护者以及一个怀疑论者。

4、与同行分享第一,外部消费者第二。一个熟练的同行评审可以比你数据的消费者提供更有质量不同的反馈和健全的检查,特别是因为消费者通常有一个他们想得到的结果。

原文链接:

http://www.datayuan.cn/article/9022.htm

来源:数据猿

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据猿 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档