碰到复杂的需求, 可以使用 udf 或 udaf
查询出来所有的点击记录, 并与 city_info 表连接, 得到每个城市所在的地区....准备数据
我们这次 Spark-sql 操作中所有的数据均来自 Hive.
首先在 Hive 中创建表, 并导入数据.
...` string,
`order_product_ids` string,
`pay_category_ids` string,
`pay_product_ids` string,
`city_id...每个地区的每个商品 缓冲所有城市的点击量 北京->1000, 天津->5000 Map, 总的点击量 1000/?...每个地区的每个商品 缓冲所有城市的点击量 北京->1000, 天津->5000 Map, 总的点击量 1000/?