首页
学习
活动
专区
工具
TVP
发布

祥子的故事

专栏作者
190
文章
335397
阅读量
40
订阅数
python | pandas 改变列的位置、填充缺失值
本期的文章源于工作中,需要固定label的位置,便于在spark模型中添加或删除特征,而不影响模型的框架或代码。 spark的jupyter下使用sql 这是我的工作环境的下情况,对你读者的情况,需要具体分析。 sql = ''' select * from tables_names -- hdfs下的表名 where 条件判断 ''' Data = DB.impala_query(sql) -- 是DataFrame格式 **注意:**DB是自己写的脚本文件 改变列的
努力在北京混出人样
2019-02-18
4.8K0
spark | 学习记录: 启动Scala、python
初学者,记录学习spark的最基本东西,不忘记 在spark下启动scala: ./bin/spark-shell 测试例子: sc.parallelize(1 to 1000).count() 在spark中启动python: ./bin/pyspark 测试例子: sc.parallelize(range(1000)).count()
努力在北京混出人样
2019-02-18
4860
spark | spark 机器学习chapter3 数据的获取、处理与准备
注意:数据集是电影评分等数据,下载链接:http://files.grouplens.org/datasets/movielens/ml-100k.zip
努力在北京混出人样
2019-02-18
5260
spark | 做基本计算和批量提交
结果: Total purchases: 5 Unique users: 4 Total revenue: 39.91 Most popular product: iPhone Cover with 2 purchases
努力在北京混出人样
2019-02-18
1.1K0
hadoop | spark | hadoop的搭建和spark 的搭建
版本hadoop-2.7.1.tar.gz,去官网下载就可以。解压到ubuntu下hadoop用户的目录下。
努力在北京混出人样
2019-02-18
7020
spark | metastore_db cannot be creat
快找工作了,也得把spark和hadoop学起来,于是安装便碰到问题。 <console>:14: error: not found: value spark import spark.
努力在北京混出人样
2019-02-18
5860
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档