温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
接下来我们来讲一下data set,呃,那么data set呢,对于我们来讲呢,其实啊,跟那个data frame也差不多,呃,那我们讲的时候呢,先把咱们前面的代码注掉,好吧,先注掉啊,在这个port这个代码呢,我们就不注掉了,为什么呢?因为我们后面的转换呢,其实基本上都要用到它啊,所以这个呢,我们就保留了,保留其实我们最好的方式是把它挪到前面去。你把它挪到我们的最开始的位置,当我们去创建Spark circle的环境对象之后。马上就把它的这个地方给它导入进来,那么在这种情况下呀,就不容易遗忘了,否则呀,你可能总是忘,那忘的话,你这个代码可能就出不来啊,有可能就会误会了,是吧?诶为了方便我们的开发,把它记住了啊,有这么几个步骤,第一个环境,第二个呢,我们的对象,第三个我们的隐私转换,好那我们接着往下啊,这个叫做data set,那么咱们如何构建一个data set呢?其实非常简单,你构建一个序列啊,比方说SEQ,然后1234,好,SEQ点我们叫做to,诶我们就有个DS,然后点va回车,这个时候你拿到的其实就是一个DS叫data set,然后data set点我们在这里呢,给它来展示一下,好,那我们现在呢就运行啊,咱们就运行,就这么简单。
01:24
看一看咱们会出现什么样的结果。好,同学们,我们现在的结果是不是已经出来了,就是我们普通的什么1234吧,但是呢,我们其实可以增加一些类嘛,这都无所谓啊,咱们这个理解一下就行了,那好这个,那我们还有别的方法可以用吗?其实啊,我们把那个data frame呀,我们拿过来大家看这不有data frame,你把这个data frame你点一下,点完以后你看怎么了。其实他就是给data set一个特定类型的一个对象,或者说一个我们的泛型啊。
02:02
给它弄了个别名吧,所以啊,也就意味着其实data frame是一个特定泛型的data set对不对?那好说到这看到这里以后,咱们就可以说一下啊,咱们的data frame它其实它是什么呢?是特殊会叫特定吧,特定泛型啊,特定泛型的data set,所以这个事儿如果你能明白的话,那是不是就简单了,那你的data frame不就是一个data set吗?那所以前面data frame的那些方法,咱们这能不能用,肯定能用,对吗?所以大家看我们这个地方叫做什么呢?咱们叫做DS点点了以后咱们说那个叫create,能不能用咱们这个里面来啊,比方说诶,还有一个我们的展示啊,或者说什么select,或者说什么我们的叫做呃,比方说group是不是都能用啊,所以啊,在我们之前所学习的data frame的操作当中,这些东西都能用,那就没啥说。
03:02
好吧,而且这个data set呢,是我们Spark一点之后所出现的,它出现的更晚一些,所以它的功能就更强大一些,诶,就是这样啊,好了,这个既然跟我们的data frame很像,那其实咱们就没什么可说的了啊。
我来说两句