首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

spark入门框架+python

不可否认,spark是一种大数据框架,它的出现往往会有Hadoop的身影,其实Hadoop更多的可以看做是大数据的基础设施,它本身提供了HDFS文件系统用于大数据的存储,当然还提供了MR用于大数据处理,但是MR有很多自身的缺点,针对这些缺点也已经有很多其他的方法,类如针对MR编写的复杂性有了Hive,针对MR的实时性差有了流处理Strom等等,spark设计也是针对MR功能的,它并没有大数据的存储功能,只是改进了大数据的处理部分,它的最大优势就是快,因为它是基于内存的,不像MR每一个job都要和磁盘打交道,所以大大节省了时间,它的核心是RDD,里面体现了一个弹性概念意思就是说,在内存存储不下数据的时候,spark会自动的将部分数据转存到磁盘,而这个过程是对用户透明的。

02

大数据的起源和错失大数据市场的鼻祖Google

大家好,我是飞总。目前就职与全球领先的大数据可视化公司Tableau。应该有很多人以前就读过我的大数据系列的公众号文章,我今天的这个讲座和以往的嘉宾都有一些不同。讲的不是现在流行的大数据工具和使用大数据来解决业务的具体问题。主要的原因有两个,一个是我主要做系统的研究和开发,而且讲的不是现在流行的大数据工具和使用大数据来解决业务的具体问题。做的都不是开源的系统。开发和使用来说差别比较大。所以我并没有使用系统解决实际问题的经验。二是我本身的背景很多出自学术圈,读论文讲八卦为主,所以大家可以听得轻松一点。 今

014

学习大数据需要什么基础?大数据要学哪些内容?

大数据只需要学习Java的标准版JavaSE就可以了,像Servlet、JSP、Tomcat、Struct、Spring、Hibernate,Mybaits都是JavaEE方向的技术在大数据技术里用到的并不多,只需要了解就可以了,当然Java怎么连接数据库还是要知道的,像JDBC一定要掌握一下,有同学说Hibernate或Mybaits也能连接数据库啊,为什么不学习一下,我这里不是说学这些不好,而是说学这些可能会用你很多时间,到最后工作中也不常用,我还没看到谁做大数据处理用到这两个东西的,当然你的精力很充足的话,可以学学Hibernate或Mybaits的原理,不要只学API,这样可以增加你对Java操作数据库的理解,因为这两个技术的核心就是Java的反射加上JDBC的各种使用。

03
领券