屏蔽垃圾营销蜘蛛,节约服务器资源 AhrefsBot MJ12bot BLEXBot SemrushBot

最近个一个小站装上了蜘蛛分析的插件,不装不知道,装完才发现,一些垃圾蜘蛛大大占用了服务器资源,包括但不限于AhrefsBot、MJ12bot、BLEXBot、SemrushBot这些营销蜘蛛。

他们来纯粹是为了爬数据,不会给你带来丝毫的流量,这种玩意,还是屏蔽的好,大家可以在网上搜索这些蜘蛛的名字就可以看到他们是干什么的。

来看看我的占用:

屏蔽垃圾营销蜘蛛,节约服务器资源 AhrefsBot MJ12bot BLEXBot SemrushBot

小站没啥流量,正经蜘蛛没爬几个页面,才几个小时功夫这些垃圾蜘蛛倒是把页面爬了个遍。

果断全部屏蔽。

使用robots协议即可屏蔽,这几个垃圾蜘蛛虽然不怎么样,但还是遵守这个协议的,以AhrefsBot、MJ12bot、BLEXBot、SemrushBot这些营销蜘蛛为例,在网站robots.txt文件里面加入如下代码即可:

User-agent: AhrefsBot
Disallow: /
User-agent: BLEXBot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: SemrushBot
Disallow: /

其他蜘蛛同理。

更新:昨天屏蔽了,但今天发现不少蜘蛛不讲武德,根本不遵循robots协议,所以还是服务器添加Nginx或者其他WEB规则来的舒坦,直接拒绝访问:

if ($http_user_agent ~* (YandexBot|spbot|DnyzBot|Researchscan|semrushbot|yahoo|AhrefsBot|DotBot|Uptimebot|MJ12bot|MegaIndex.ru|ZoominfoBot|Mail.Ru|SeznamBot|BLEXBot|ExtLinksBot|aiHitBot|Barkrowler)){
 return 403;
}

以上已经包含大部分营销蜘蛛,放在这里就行了:

屏蔽垃圾营销蜘蛛,节约服务器资源 AhrefsBot MJ12bot BLEXBot SemrushBot

有需要的可以弄一下,有些蜘蛛爬起来很疯狂,服务器差点都扛不住。

游乐星球 点此下载

相关推荐

SemrushBot是什么蜘蛛,这个爬虫怎么屏蔽

SemrushBot是SEMrush的服务器搜索蜘蛛,SEMrush 是一个强大的、全面的在线营销竞争情报平台,其中包括 SEO、PPC、社交媒体和视频广告研究。机器人抓取你的网页来解析你的网站内容,所以相关的信息在你的网站很容易索 ...

BLEXBot是什么蜘蛛,需要屏蔽这个爬虫吗

BLEXBot这个蜘蛛也是最近爬的比较厉害的一个,属于一家美国的反向链接查询网站(WebMeUp)的蜘蛛程序,它会大量的抓取我们的网站链接,所以一旦我们发现有他的抓取的踪迹,就会发现他真的是大量的抓取你的链接。 这 ...

AhrefsBot是什么蜘蛛,这个爬虫需要屏蔽吗

AhrefsBot蜘蛛是一个比较常见的垃圾蜘蛛,它是Ahrefs网站的蜘蛛,而Ahrefs网站是国外一家比较有名的营销网站,也是大家做外贸网站SEO可能会用到的外链查询分析网站,对大部分网站来说都没什么用,所以我是选择屏蔽这 ...

MJ12bot蜘蛛是什么爬虫,怎么屏蔽

MJ12bot是一个来自英国网络营销公司的搜索引擎蜘蛛,这个搜索引擎名称叫做:Majestic。这家公司的搜索引擎主要是用来绘制互联网地图的,然后用这个互联网地图数据来为企业提供互联网营销数据服务。所以对国内用户没 ...