前言
由于硬件等各种原因需要把大概170多万2t左右的微博图片数据存到Mysql中.之前存微博数据一直用的非关系型数据库mongodb,由于对Mysql的各种不熟悉,踩了无数坑,来来回回改了3天才完成...挖坑填坑之旅
建表
存数据的时候首先需要设计数据库,我准备设计了3个表
微博表:[id, userid, blog_text, lat, lng, created_time, reserve] pkey...pic_url, pic_bin, exif, reserve] pkey: md5
关系表:[id, md5, reserve] pkey: (id, md5) fkey: (id, 微博表...建表的时候别的问题都还好,主要是 pic_bin 的类型和 blog_text 的类型有很大的问题,首先是pic_bin的类型,开始设置的为BLOB,但是运行之后发现BLOB最大只能存1M的数据,并不能满足微博图片的存储...get_info.content)
info_json['uid'] = uid
statuses = info_json['statuses']
# 处理筛选微博数据