专栏首页夏时利用微博当图床-php语言实现

利用微博当图床-php语言实现

什么是微博图床?

微博图床,指把图片上传到新浪微博的图库,然后用这个图片外链达到节约本地服务器空间及加快图片加载速度的目的。

相比于其它的图床,利用微博当图床具有加载速度快、不限流量、不限容量等优点。网上有许多浏览器插件或在线工具能够实现。直接利用第三方的工具如果只是上传一两张图片倒也方便,如果要大批量上传并获取外链就得自己写一个了。

微博图床实现方法探究

目前已知有两个方法能实现,其一是利用微博官方的开放平台的发微博 API 实现。这种方法也是我最先考虑的方法,因为毕竟是官方渠道,应该靠谱些。

然而经过一番折腾后,我发现这一方法根本不可行。因为微博限制了这一 API 的调用频次,在连续上传时立即就会被封堵。

方法二是利用微博的 MINI 发布框(http://weibo.com/minipublish)的图片上传功能。

正是这个发布框暴露了微博的一个图片上传接口

  1. http://picupload.service.weibo.com/interface/pic_upload.php

网上的这些微博图床大都也是利用这个接口实现的。

利用这一接口的优点是可以实现快速连续上传图片而不被封。缺点是必须要带着微博登录的 Cookie 才能访问。

PHP代码

说了这么多,现在贴一下相关php代码:

  1. /**
  2.  * 上传图片到微博图床
  3.  * @author mengkun  http://mkblog.cn
  4.  * @param $file 图片文件/图片url
  5.  * @param $multipart 是否采用multipart方式上传
  6.  * @return 返回的json数据
  7.  */
  8. function upload($file, $multipart = true) {
  9. $cookie = '';    // 微博cookie
  10. $url = 'http://picupload.service.weibo.com/interface/pic_upload.php'
  11.     .'?mime=image%2Fjpeg&data=base64&url=0&markpos=1&logo=&nick=0&marks=1&app=miniblog';
  12. if($multipart) {
  13. $url .= '&cb=http://weibo.com/aj/static/upimgback.html?_wv=5&callback=STK_ijax_'.time();
  14. if (class_exists('CURLFile')) {     // php 5.5
  15. $post['pic1'] = new CURLFile(realpath($file));
  16.         } else {
  17. $post['pic1'] = '@'.realpath($file);
  18.         }
  19.     } else {
  20. $post['b64_data'] = base64_encode(file_get_contents($file));
  21.     }
  22. // Curl提交
  23. $ch = curl_init($url);
  24.     curl_setopt_array($ch, array(
  25.         CURLOPT_POST => true,
  26.         CURLOPT_VERBOSE => true,
  27.         CURLOPT_RETURNTRANSFER => true,
  28.         CURLOPT_HTTPHEADER => array("Cookie: $cookie"),
  29.         CURLOPT_POSTFIELDS => $post,
  30.     ));
  31. $output = curl_exec($ch);
  32.     curl_close($ch);
  33. // 正则表达式提取返回结果中的json数据
  34.     preg_match('/({.*)/i', $output, $match);
  35. if(!isset($match[1])) return '';
  36. return $match[1];
  37. }

如你所见,代码中包含两种上传方式,一种是 multipart 方式上传,通过这种方式上传效率较高,局限性是只能上传服务器的本地图片。 另一种方式是base64方式,可以上传远程图片。(文字的表述可能不清楚,用代码就明白了

)

  1. upload('mypic.jpg', true);  // multipart方式上传
  2. upload('http://www.mysite.cn/mypic.jpg', false);  // 非multipart方式(base64)上传

无论通过以上哪种方式,返回的都会是一段如下所示的json数据。

  1. {"code":"A20001","data":{"count":2,"data":"eyJ1aWQiOjIyODczOTc1NzUsImFwcCI6Im1pbmlibG9nIiwiY291bnQiOjIsInRpbWUiOjE0OTM3ODE0NzQuMzQ5LCJwaWNzIjp7InBpY18yIjp7InJldCI6LTIsIm5hbWUiOiJwaWNfMiJ9LCJwaWNfMSI6eyJ3aWR0aCI6MzAwLCJzaXplIjo4Njk5LCJyZXQiOjEsImhlaWdodCI6MzAwLCJuYW1lIjoicGljXzEiLCJwaWQiOiI4ODU2ZWFjN2d5MWZmODA4NGhtanpqMjA4YzA4YzN5ZSJ9fX0=","pics":{"pic_2":{"ret":-2,"name":"pic_2"},"pic_1":{"width":300,"size":8699,"ret":1,"height":300,"name":"pic_1","pid":"8856eac7gy1ff8084hmjzj208c08c3ye"}}}}

其它的不用管,我们只需要 pic_1 这个子节点中的数据

如图所示,pid码就是忙活了这么久之后最终要用到的。

http://ww2.sinaimg.cn/large/ + 获取到的pid 就能组合成图片的外链。

比如上面示范的那段数据中包含的图片外链地址就是

http://ww2.sinaimg.cn/large/8856eac7gy1ff8084hmjzj208c08c3ye

其实 pid 中还包含了更多“秘密”,这里提供一下 pid 的终极解码算法

  1. /**
  2.  * 获取图片链接(本函数修改自 https://github.com/consatan/weibo_image_uploader)
  3.  *
  4.  * @param string $pid 微博图床pid,或者微博图床链接。传递的是链接的话,
  5.  *     仅是将链接的尺寸更改为目标尺寸而已。
  6.  * @param string $size 图片尺寸
  7.  * @param bool $https (true) 是否使用 https 协议
  8.  * @return string 图片链接
  9.  * 当 $pid 既不是 pid 也不是合法的微博图床链接时返回空值
  10.  */
  11. function getImageUrl($pid, $size = 0, $https = true)  
  12. {  
  13. $sizeArr = array('large', 'mw1024', 'mw690', 'bmiddle', 'small', 'thumb180', 'thumbnail', 'square');  
  14. $pid = trim($pid);  
  15. $size = $sizeArr[$size];  
  16. // 传递 pid
  17. if (preg_match('/^[a-zA-Z0-9]{32}$/', $pid) === 1) {  
  18. return ($https ? 'https' : 'http') . '://' . ($https ? 'ws' : 'ww')
  19.             . ((crc32($pid) & 3) + 1) . ".sinaimg.cn/" . $size
  20.             . "/$pid." . ($pid[21] === 'g' ? 'gif' : 'jpg');  
  21.     }  
  22. // 传递 url
  23. $url = $pid;  
  24. $imgUrl = preg_replace_callback('/^(https?:\/\/[a-z]{2}\d\.sinaimg\.cn\/)'  
  25.         . '(large|bmiddle|mw1024|mw690|small|square|thumb180|thumbnail)'  
  26.         . '(\/[a-z0-9]{32}\.(jpg|gif))$/i', function ($match) use ($size) {  
  27. return $match[1] . $size . $match[3];  
  28.         }, $url, -1, $count);  
  29. if ($count === 0) {  
  30. return '';  
  31.     }  
  32. return $imgUrl;  
  33. }  

附:微博Cookie获取方法

首先登录微博,然后按F12打开控制台 Network,然后再刷新页面就可以在 Headers 中看到cookie。

注:微博 cookie 的有效期似乎只有一天……要想“永久”有效,还得研究研究微博的模拟登录算法……博主水平有限,暂未研究成功

本文作者为mengkun,转载请注明。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • C语言union关键字

    夏时
  • 分享几个IP获取地理位置的API接口

    夏时
  • 从零开始,学会 PHP 采集

    夏时
  • python获取日期和判断字符串

    # Filename : util.py # author by gulf # 引入 datetime 模块 import datetime #获取昨天...

    用户1220053
  • 大数据专家易观CTO郭炜:你用的WiFi,其实正在暴露你的身份!

    <数据猿导读> 对于大众来说,进入移动互联网时代以后,自然已无法离开WIFI和APP。殊不知,专家表示,这些工具正在“暴露”你的身份。别慌。对于企业来说,正是基...

    数据猿
  • Python笔记-使用 JupiterNotebook 写一个爬虫实例

    将 JupiterNotebook 使用 Docker 部署在服务器后,即能实现随时随地的 Python 开发,新建项目,使用 Terminal 进行操作,甚至...

    李郑
  • python 面向对象编程 - 小游戏

    小小咸鱼YwY
  • 智能下拉刷新框架-SmartRefreshLayout

    框架?下拉刷新控件还能框架化?智能?啥玩意来着?二话不多少先上Demo效果图,咱们再来探个究竟。 Github 传送门(https://github.com/s...

    非著名程序员
  • (六)关于网络编程的一些实用技巧和细节

    这些年,接触了形形色色的项目,写了不少网络编程的代码,从windows到linux,跌进了不少坑,由于网络编程涉及很多细节和技巧,一直想写篇文章来总结下这方面的...

    范蠡
  • 专访 | 蚂蚁金服MISA:比用户更懂自己的自然语言客服系统

    机器之心

扫码关注云+社区

领取腾讯云代金券