我从实际用户中筛选机器人的方法之一是检查useragent。检测到后,我阻止他们正在使用的IP。我看到很多访问者都带着“”嵌入了他们的用户代理(例如):
mozilla/5.0 (x11; linux x86_64) applewebkit/537.36 (khtml, like gecko; google
web preview) chrome/41.0.2272.118 safari/537.36
当我检查与这个用户代理相关的IP地址时,它们似乎与Google无关。它们都是来自世界各地的家庭IP地址。当我在我的网站上跟踪用户时,我注意到他的用户代理一旦继续浏览我的站点,我就会注意到:
m
为了区分用户代理移动和用户代理平板电脑,我编写了如下regex:
移动电话:
.+iPhone.+|.+Android.+Mobile.+
片剂:
.+iPad.+Mobile.+|.+Android.+[^Mobile].+
并在平板电脑上试用以下用户代理:
Mozilla/5.0 (iPad; CPU OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53
-> OK片
Mozilla/5.0 (Linux; Android 4.3