首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大数据时代,传统统计学依然是数据分析的灵魂

    在数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前,刘军做客人民日报、人民网《文化讲坛》,分享他的思考。 让大数据区别于数据的,是其海量积累、高增长率和多样性 什么是数据?数据(data)在拉丁文里是“已知”的意思,在英文中的一个解释是“一组事实的集合,从中可以分析出结论”。笼统地说,凡是用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据

    010

    【统计学习】大数据时代,我为什么说统计学依然是数据分析灵魂

    在数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前,刘军做客人民日报、人民网《文化讲坛》,分享他的思考。 让大数据区别于数据的,是其海量积累、高增长率和多样性 什么是数据?数据(data)在拉丁文里是“已知”的意思,在英文中的一个解释是“一组事实的集合,从中可以分析出结论”。笼统地说,凡是用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据

    07

    弈聪软件卓建超:大数据资源使用在非恶性竞争及共享前提下方能凸显其价值

    在数据“爆炸”的时代,大数据常常被寄予厚望。到底什么样的数据才算大数据,怎样才能用好大数据?很多没有接触过大数据的人,都很难清楚地知道,究竟多大的数据量才可以称之为大数据。什么是大数据呢?西安弈聪信息技术有限公司(简称:弈聪软件)CEO卓建超认为,量的增多是人们对大数据的第一个认识。根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。企业端数据近十万的级别,就可以称为大数据;个人端(C端)的大数据要达到千万级别。收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据,形成数据服务即可。

    05

    中国的大数据优势:数据规模+数据传统

    《中国经济周刊》:大数据的真正价值是什么,它可以为中国带来什么?   舍恩伯格:大数据的价值并不仅仅局限于它初始被收集的目的,而在于它之后可以服务于其他目标而被重复使用。因此,大数据的价值将会是所有这些用途的总和,并且将远远大于其初次使用的价值。正如在海洋中漂浮的冰山,起初我们只能够看到它浮在水面上的一部分,但事实上冰山的体积要大得多。随着更便宜的存储和分析技术、分析工具的发展,以及“大数据观”的建立,我们会获得大数据“表面下”的价值。   目前,中国依然缺乏全面综合的数据收集。事实上,与其他国家相

    06

    大数据到底如何在企业中发挥价值

    一、企业大数据如何起步:从小数据到大数据 目前国内外关于大数据的谈论很多,大多是谈运营级别的,或者说从服务端、服务方提得较多一些。笔者要跟大家交流的问题是作为各类企业尤其是客户方的企业来说,大数据跟他们有什么关系,或者说作为企业方怎样去参与,这是企业方现在面临的最大问题。   这个问题的答案重点在于大数据应该从小数据开始。因为现在很多企业面临的最大问题不是怎么用大数据,而是内部的一些小数据整合出现问题,或者小数据都没用好的情况下怎么用大数据。大数据应该是从小数据逐渐演变上去的,是一个正常的生态,而不是瞬间变

    014

    【推荐阅读】大数据的泡沫、价值和陷阱,你分得清吗?

    如何从混沌中发现规律,成为预测未来的“先知”,抑或是少出几只黑天鹅?是历代人类的梦想。不管是古人的占卜、算命还是现在的专家系统、商业智能、数据挖掘、机器学习、人工智能、智慧地球、智慧城市等应用,都源于我们对未来不确定性的恐惧。 随着舍恩伯格教授《大数据时代》一书的面世,给我们带来了“醍醐灌顶”式的认知洗礼,难道抓住大数据这根救命稻草,我们就有机会做“先知”?从而也更有能力把自己和周遭世界管理得更好吗?在一定程度上是这样的,但我们也要知道,任何技术都是把双刃剑。 大数据泡沫:泡沫是必然但有其深远意义 甲骨文公

    05

    来自大数据的反思:需要你读懂的10个小故事

    自2011年以来,大数据旋风以“迅雷不及掩耳之势”席卷中国。毋庸置疑,大数据已然成为继云计算、物联网之后新一轮的技术变革热潮,不仅是信息领域,经济、政治、社会等诸多领域都“磨刀霍霍”向大数据,准备在其中逐得一席之地。 中国工程院李国杰院士更是把大数据提升到战略的高度,他表示【1】,数据是与物质、能源一样重要的战略资源。从数据中发现价值的技术正是最有活力的软技术,在数据技术与产业上的落后,将使我们像错过工业革命机会一样延误一个时代。 在这样的认知下,“大数据”日趋变成大家“耳熟能详”的热词。图1所示的是谷

    09

    数据科学研究的现状与趋势全解

    大数据时代的到来催生了一门新的学科——数据科学。首先,本文探讨了数据科学的内涵、发展简史、学科地位及知识体系等基本问题,并提出了专业数据科学与专业中的数据科学之间的区别与联系;其次,分析现阶段数据科学的研究特点,并分别提出了专业数据科学、专业中的数据科学及大数据生态系统中的相对热门话题;接着,探讨了数据科学研究中的10个争议及挑战:思维模式的转变(知识范式还是数据范式)、对数据的认识(主动属性还是被动属性)、对智能的认识(更好的算法还是更多的数据)、主要瓶颈(数据密集型还是计算密集型)、数据准备(数据预处理还是数据加工)、服务质量(精准度还是用户体验)、数据分析(解释性分析还是预测性分析)、算法评价(复杂度还是扩展性)、研究范式(第三范式还是第四范式)、人才培养(数据工程师还是数据科学家)。再次,提出了数据科学研究的10个发展趋势:预测模型及相关分析的重视、模型集成及元分析的兴起、数据在先,模式在后或无模式的出现、数据一致性及现实主义的回归、多副本技术及靠近数据原则的广泛应用、多样化技术及一体化应用并存、简单计算及实用主义占据主导地位、数据产品开发及数据科学的嵌入式应用、专家余及公众数据科学的兴起、数据科学家与人才培养的探讨。最后,结合本文工作,为数据科学研究者给出了几点建议和注意事项。

    03

    大数据的泡沫、价值和陷阱,你分得清吗?

    对未来不确定性的恐惧 我们所生活的世界,就像一片混沌(chaos),大数据时代,我们周围更是充斥着各种不同的理论、知识、信息和噪音,数据爆炸式增长和科技高速发展所带来的冲击,加大了未来的不确定性。当我们接收的数据和信息越多,面临的选择就越多,如若不善于过滤、挖掘和处理,对各种决策就可能会造成负面影响,当然也会放大我们对未来不确定性的恐惧。小到个人命运大到国家前途,都是在这样一片混沌中煎熬着。 如何从混沌中发现规律,成为预测未来的“先知”,抑或是少出几只黑天鹅?是历代人类的梦想,不管是古人的占卜、算命还是现在的专家系统、商业智能、数据挖掘、机器学习、人工智能、智慧地球、智慧城市等应用,都源于我们对未来不确定性的恐惧。当然还有应对当前管理走向的失控,软件在加速吞噬世界,而大部分人类对其原理和特性却知之甚少,就像华尔街的金融交易一样,系统越复杂出现黑天鹅的概率就会增大;社交网络的实时性打破了时空限制,信息的流动速度和广度让也管理者越发难以掌控。随着舍恩伯格教授《大数据时代》一书的面世,给我们带来了“醍醐灌顶”式的认知洗礼,难道抓住大数据这根救命稻草,我们就有机会做“先知”?从而也更有能力把自己和周遭世界管理得更好吗?在一定程度上是这样的,但我们也要知道,任何技术都是把双刃剑。 舍恩伯格其实没有机器学习背景,书上所说的某些内容也是有争议的,不过在教育民众和政府官员科普方面,还是具有重要意义,至少让大家知道了什么是大数据,也能在一定程度上促使我们思考大数据的价值和潜力,从而提升大数据应用水平以应对管理失控和黑天鹅等问题。

    02

    刘德寰:不关注人性的大数据已成大忽悠

    2014年夏季腾讯思享会“中国说”在北京举办。本次思享会的两个主题演讲“大数据开启时代转型”和“基因技术把人类带向何方”,分别邀请了北大传播学系教授刘德寰、华大基因研究院董事长汪建。历史学者吴思、社会学者于建嵘、郭于华、知名IT评论人谢文、《大数据时代》译者周涛等数十位知名科学家、学者在论坛环节跨界碰撞,共同探讨大数据与社会转型、新技术发展对中国社会产生的深刻影响。 刘德寰教授在“大数据开启时代转型”的主题演讲中,指出大数据开启了一个新的时代,带来了新机会,但更需要冷静面对,“大数据本身很像大忽悠”,数据本

    05
    领券