前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >SparkCore 编程

SparkCore 编程

作者头像
曼路
发布2018-10-18 15:14:04
2590
发布2018-10-18 15:14:04
举报
文章被收录于专栏:浪淘沙浪淘沙

1.sparkCore实现wordCount(Idea+scala)

代码语言:javascript
复制
import org.apache.spark.{SparkConf, SparkContext}

object wordCount {

  def main(args: Array[String]): Unit = {
    //设置本地运行  2核
    val conf = new SparkConf().setAppName("scalaWordCount").setMaster("local[2]")
    val sc = new SparkContext(conf)

    //读取文件
    //val rdd1 = sc.textFile(args(0))
    val rdd1 = sc.textFile("d:/data/word.txt");
    //切分后压平
    val rdd2 = rdd1.flatMap(x=>x.split(" "))
    //将数据都赋值 1
    val rdd3 = rdd2.map((_,1))
    //很据key  进行计算
    val rdd4 = rdd3.reduceByKey(_+_)
    //排序
    val rdd5 = rdd4.sortBy(_._2)
    //生成新文件 保存到hdfs
   // val rdd6 = rdd5.saveAsTextFile(args(1))
    println(rdd5.collect().toBuffer);

    sc.stop()
  }
}

2.创建一个数组,根据数据创建一个Bean对象,继承Order,实现序列化(Serializable).从而对数组进行排序。

代码语言:javascript
复制
import org.apache.log4j.{Level, Logger}
import org.apache.spark.{SparkConf, SparkContext}

object CustomSort1 {

  def main(args: Array[String]): Unit = {
    Logger.getLogger("org.apache.spark").setLevel(Level.OFF)

    val conf = new SparkConf().setAppName("IPLocation").setMaster("local[*]")
    val sc = new SparkContext(conf)
                        //id 姓名 年纪 颜值
    val users = Array("1,tom,18,100","2,lisa,19,500","3,lisi,30,50","4,zhangsan,25,100")
    val userLines = sc.makeRDD(users)
    val userRDD = userLines.map(line => {
      val fields = line.split(",")
      val num = fields(0).toInt
      val name = fields(1)
      val age = fields(2).toInt
      val rate = fields(3).toInt
      new User(num,name,age,rate)

    })

    //排序
    val sorted = userRDD.sortBy(x => x)
    println(sorted.collect().toBuffer)
  }


}

class User(val num:Int,val name:String,val age:Int,val rate:Int) extends Ordered[User] with Serializable {
  override def compare(that: User): Int = {
    //先根据颜值排序,如果颜值相同,根据年龄排序。
    if(this.rate == that.rate){
      this.age-that.age
    }else{
      that.rate-this.rate
    }
  }

  override def toString: String = {
    s"user:$num,$name,$age,$rate"
  }
}

3.SparkCore数据保存到Mysql

代码语言:javascript
复制
import java.sql.{Connection, DriverManager}

import org.apache.log4j.{Level, Logger}
import org.apache.spark.rdd.JdbcRDD
import org.apache.spark.{SparkConf, SparkContext}

object JDBCDemo {
  val conn: () => Connection = () =>{
    DriverManager.getConnection("jdbc:mysql://localhost:3306/test?characterEncoding=UTF-8","root","123456")
  }

  def main(args: Array[String]): Unit = {
    Logger.getLogger("org.apache.spark").setLevel(Level.OFF)
    val conf = new SparkConf().setAppName("").setMaster("local[*]")
    val sc = new SparkContext(conf)
    val jdbcRDD = new JdbcRDD(
      sc,
      conn,
      "select * from logs where id >=? and id <=?",
      1,
      5,
      2,
      rs=>{
        val id = rs.getLong(1)
        val name = rs.getString(2)
        val age = rs.getInt(3)
        (id, name, age)
      }


    )
    val result = jdbcRDD.collect()
    println(result.toBuffer)
    sc.stop()

  }

}
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年10月12日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档