今天碰到一个替换问题:需要把全部接口中出现的一个链接改成另一个链接。虽然链接地址是保存在数据库中的,但是由于某些原因,不能直接修改数据库中的内容,只能在渲染结果的时候再进行替换。
如果有很好的逻辑封装的话,这个问题并不是什么难事儿,可恰恰代码一团乱,搞不清楚到底哪些接口需要修改。我本打算依靠蛮力挨个文件查,但试了试发现工作量实在太大了,没办法只能想想别的招儿。
最后找到的招儿就是「tcpdump」,通过它可以直接过滤服务器渲染的内容:
shell> tcpdump -i eth0 src port 80 -l -s 0 -w - | strings | grep -B 100 www.foo.com
因为访问量大,所以通过一段时间的采样,就可以捕捉到绝大部分需要替换的内容。需要额外说明的是,如果开启了GZIP,最后先关闭,否则无法匹配。
不过仅仅这样还不够,因为虽然我们过滤出了有问题的内容,但是我们并不知道其对应的地址是什么,所以我们需要想办法把地址放到响应结果里去。
如果用PHP的话,可以借助「auto_prepend_file」为所有的PHP响应增加一个头:
<?php
header('X-Request-URI: ' . $_SERVER['REQUEST_URI']);
?>
如果用Nginx的话,可以借助「add_header」为所有的响应增加一个头:
http {
add_header X-Request-URI $request_uri;
}
有了这些铺垫工作,再用「tcpdump」过滤内容的时候,就能直观的看到地址了:
HTTP/1.1 200 OK
Server: nginx
Date: Fri, 22 Mar 2013 07:50:39 GMT
Content-Type: text/html
Transfer-Encoding: chunked
Connection: close
X-Powered-By: PHP
X-Request-URI: <URI>
找到了地址,剩下的替换就简单了,就不多说了。这个问题并不难,不过如果选错了方法,那么耗费的时间可能会多很多,可见即便是简单的问题也值得深思熟虑。
BTW:Nginx有一个「Substitution」模块能完成替换,但对本例而言用它有点过了。