前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >php记录搜索引擎爬行记录的实现代码

php记录搜索引擎爬行记录的实现代码

作者头像
用户8832582
修改2021-07-14 11:01:52
4840
修改2021-07-14 11:01:52
举报
文章被收录于专栏:编程随想编程随想

下面是完整代码:

//记录搜索引擎爬行记录 $searchbot = get_naps_bot();

if ($searchbot)

{ $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);

$url = $_SERVER['HTTP_REFERER'];

$file = WEB_PATH.'ro/

/botslogs.txt';

$date = date('Y-m-d H:i:s');

$data = fopen($file,'a');

fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n");

fclose($data);

}

WEB_PATH为index.PHP下define的根目录路径,意思就是说robotslogs.txt文件是放在根目录下的。

通过get_naps_bot()获取蜘蛛爬行记录,然后在通过addslashes处理一下,将数据存储于变量$tlc_thispage中。

fopen打开robotslogs.txt文件,将数据通过函数fwrite写入,在通过函数fclose关闭就可以了。

因为我觉得没必要,所以把自己网站上的代码删除了,所以也没有效果示例了。

PS:php获取各搜索蜘蛛爬行记录的代码

支持如下的搜索引擎:Baidu,Google,Bing,Yahoo,Soso,Sogou,Yodao爬行网站的记录!

代码:

<?php

/**

function get_naps_bot()

{

$useragent /**【本文中一些PHP版本可能是以前的,如果不是一定要,建议PHP尽量使用7.2以上的版本】**/= strtolower($_SERVER['HTTP_USER_AGENT']);

if (strpos($useragent, 'googlebot') !== false){

return 'Google';

}

if (strpos($useragent, 'baiduspider') !== false){

return 'Baidu';

}

if (strpos($useragent, 'msnbot') !== false){

return 'Bing';

}

if (strpos($useragent, 'slurp') !== false){

return 'Yahoo';

}

if (strpos($useragent, 'sosospider') !== false){

return 'Soso';

}

if (strpos($useragent, 'sogou spider') !== false){

return 'Sogou';

}

if (strpos($useragent, 'yodaobot') !== false){

return 'Yodao';

}

return false;

}

function nowtime(){

$date=date("Y-m-d.G:i:s");

return $date;

}

$searchbot = get_naps_bot();

if ($searchbot) {

$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);

$url=$_SERVER['HTTP_REFERER'];

$file="www.jb51.net.txt";

$time=nowtime();

$data=fopen($file,"a");

fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispagen");

fclose($data);

}

?>

以上所述是小编给大家介绍的php记录搜索引擎爬行记录,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档