按 ESC 键关闭

MJ12bot是什么蜘蛛?抓取频率非常高,怎么屏蔽禁止它抓取网页

如果你经常关注自己网站每天都有哪些搜索引擎蜘蛛来爬的话,可能会发现,除了我们常见的百度蜘蛛(Baiduspider)、谷歌蜘蛛(Googlebot)、360蜘蛛(360spider)等外,还有一些一眼看上去也不知道是什么的蜘蛛程序,比如今天我们要介绍的这个:MJ12bot。

MJ12bot是什么蜘蛛?

MJ12bot是一个来自英国网络营销公司的搜索引擎蜘蛛,这个搜索引擎名称叫做:Majestic。这家公司的搜索引擎主要是用来绘制互联网地图的,然后用这个互联网地图数据来为企业提供互联网营销数据服务。目前,这家公司提供了13种语言的网站服务。

MJ12bot

用户可以在Majestic上了解到自己网站的一些数据。

总的来说,如果你的网站业务主要是在国内的话,那么MJ12bot蜘蛛对于你来说就没有多大的作用。

MJ12bot蜘蛛对网站有什么影响?

这个蜘蛛程序同样会轻微的增加服务器的负担,有的时候如果它的抓取量比较大的话,影响也会比较明显,但是一般情况下不会有太大的影响。如果你不想在日志中看到它,可以将它在robots.txt中屏蔽掉,这个蜘蛛是遵循robots规则的。

如何屏蔽MJ12bot蜘蛛?

因为MJ12bot蜘蛛会遵循robots协议,所以我们可以直接在robots.txt中将它屏蔽掉,具体代码如下:

User-agent: MJ12bot
Disallow: /