祥子的故事-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

祥子的故事

专栏成员

190

文章

344951

阅读量

40

订阅数

python | pandas 改变列的位置、填充缺失值

本期的文章源于工作中，需要固定label的位置，便于在spark模型中添加或删除特征，而不影响模型的框架或代码。 spark的jupyter下使用sql 这是我的工作环境的下情况，对你读者的情况，需要具体分析。 sql = ''' select * from tables_names -- hdfs下的表名 where 条件判断 ''' Data = DB.impala_query(sql) -- 是DataFrame格式 **注意：**DB是自己写的脚本文件改变列的

努力在北京混出人样

2019-02-18

4.8K0

spark | 学习记录：启动Scala、python

初学者，记录学习spark的最基本东西,不忘记在spark下启动scala： ./bin/spark-shell 测试例子： sc.parallelize(1 to 1000).count() 在spark中启动python： ./bin/pyspark 测试例子： sc.parallelize(range(1000)).count()

努力在北京混出人样

2019-02-18

5080

spark | spark 机器学习chapter3 数据的获取、处理与准备

注意：数据集是电影评分等数据，下载链接：http://files.grouplens.org/datasets/movielens/ml-100k.zip

努力在北京混出人样

2019-02-18

5470

spark | 做基本计算和批量提交

结果： Total purchases: 5 Unique users: 4 Total revenue: 39.91 Most popular product: iPhone Cover with 2 purchases

努力在北京混出人样

2019-02-18

1.1K0

hadoop | spark | hadoop的搭建和spark 的搭建

hadoop http spark html xml

版本hadoop-2.7.1.tar.gz,去官网下载就可以。解压到ubuntu下hadoop用户的目录下。

努力在北京混出人样

2019-02-18

7150

spark | metastore_db cannot be creat

快找工作了，也得把spark和hadoop学起来，于是安装便碰到问题。 <console>:14: error: not found: value spark import spark.

努力在北京混出人样

2019-02-18

6030

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态