蜘蛛爬取日志网站插件介绍
一、易优蜘蛛访问统计插件目前统计的搜索引擎爬虫主要有:百度、谷歌、搜狗、360、Yandex、微软bing;
二、该插件只保留蜘蛛爬取最近30天的记录,避免给数据表过大的数据量,容易造成管理员在备份数据库时,因多余的无效数据导致备份失败。
![易优CMS网站蜘蛛爬取日志访问统计查询插件 图片[1]-易优CMS网站蜘蛛爬取日志访问统计查询插件-萌果小站](https://pic.rmb.bdstatic.com/bjh/5b2cc84fd0cc6123dc17bc81caa56842.jpeg)
![易优CMS网站蜘蛛爬取日志访问统计查询插件 图片[2]-易优CMS网站蜘蛛爬取日志访问统计查询插件-萌果小站](https://pic.rmb.bdstatic.com/bjh/04eeccf50f766a513b2e5992b266167a.jpeg)
Robots技巧
1、如何拒绝搜索引擎爬取不相关的JS接口URL;
如下图所示:JS接口URL都有一个特性,前缀是 /index.php?m=api&c=Ajax&a=
![易优CMS网站蜘蛛爬取日志访问统计查询插件 图片[3]-易优CMS网站蜘蛛爬取日志访问统计查询插件-萌果小站](https://pic.rmb.bdstatic.com/bjh/86a0798b03791a8599afa481f2820163.png)
可以编辑网站的根目录下robots.txt文件,追加一条如下代码:
Disallow: /index.php?m=api&c=Ajax&a=*
2、如何拒绝搜索引擎爬取不想被收录的插件URL;
如下图所示:每个插件URL都有一个特性,前缀是 /index.php?m=plugins&c=插件标识
![易优CMS网站蜘蛛爬取日志访问统计查询插件 图片[4]-易优CMS网站蜘蛛爬取日志访问统计查询插件-萌果小站](https://pic.rmb.bdstatic.com/bjh/0ee37a919dc81a4ffe979071a4b55895.png)
红色圈住的是一个微信分享插件,如果这个URL在浏览器上打开是无效页面,可以通过如下robots.txt规则进行屏蔽,拒绝搜索引擎爬取。
编辑网站的根目录下robots.txt文件,追加一条如下代码:
Disallow: /index.php?m=plugins&c=WeixinShare&a=*
© 版权声明
声明:本站所有资源以及部分文字和图片全部收集于互联网,如无特殊说明或标注,均为本站原创发布(WWW.cvmao.com)。任何个人或组织,在未征得本站允许,禁止复制、盗用、采集、发布本站内容到任何网站。如本站部分内容侵犯到您的合法权益,请及与我们联系,我们会在3个工作日内核实并及时处理。
THE END
暂无评论内容