SemrushBot是什么蜘蛛,这个爬虫怎么屏蔽

SemrushBot是SEMrush的服务器搜索蜘蛛,SEMrush 是一个强大的、全面的在线营销竞争情报平台,其中包括 SEO、PPC、社交媒体和视频广告研究。机器人抓取你的网页来解析你的网站内容,所以相关的信息在你的网站很容易索引和更容易获得用户搜索内容。

SemrushBot是什么蜘蛛,这个爬虫怎么屏蔽

可以看得出来,对我们中文网站来说一样没什么用,属于营销类的蜘蛛,可以选择屏蔽掉。

常规屏蔽方式就是写一下robots规则来屏蔽它的爬取

User-agent: SemrushBot
Disallow: /
User-agent: SemrushBot-SA
Disallow: /
User-agent: SemrushBot-BA
Disallow: /
User-agent: SemrushBot-SI
Disallow: /
User-agent: SemrushBot-SWA
Disallow: /
User-agent: SemrushBot-CT
Disallow: /
User-agent: SemrushBot-BM
Disallow: /
User-agent: SemrushBot-SEOAB
Disallow: /

这个这么长是我在网上找到的,我昨天只添加了第一条,今天他还在继续爬,所以不知道是我自己写的不够全面,还是它压根把robots协议当厕纸就不知道了。

为了防止他不讲武德,直接服务器规则搞起,这次我们改进一下,毕竟这些蜘蛛是真的多,比如我们换个思路,只保留我们需要的蜘蛛,其他全部屏蔽:

 if ($http_user_agent !~* "Baidu|Yisou|Sogou|360|Bytes|bing")
    {
       return 403;
     }

就是除了百度,神马、搜狗、360、头条、bing以外的蜘蛛,全部返回403状态(没有权限访问本站),代码来自网络,据发代码的说是这样简写也可以,不放心的话,可以把简写全部换成蜘蛛全名。

游乐星球 点此下载

相关推荐

DotBot是什么蜘蛛,需要屏蔽这个爬虫吗

DotBot是国外Moz旗下链接分析网站opensiteexplorer的,DotBot蜘蛛专门用来分析网站的外链数据,我也是装上了蜘蛛分析插件以后才发现这么多没什么用的蜘蛛在持续消耗我的服务器资源,好的是现在知道了,一个个屏蔽了 ...

BLEXBot是什么蜘蛛,需要屏蔽这个爬虫吗

BLEXBot这个蜘蛛也是最近爬的比较厉害的一个,属于一家美国的反向链接查询网站(WebMeUp)的蜘蛛程序,它会大量的抓取我们的网站链接,所以一旦我们发现有他的抓取的踪迹,就会发现他真的是大量的抓取你的链接。 这 ...

MJ12bot蜘蛛是什么爬虫,怎么屏蔽

MJ12bot是一个来自英国网络营销公司的搜索引擎蜘蛛,这个搜索引擎名称叫做:Majestic。这家公司的搜索引擎主要是用来绘制互联网地图的,然后用这个互联网地图数据来为企业提供互联网营销数据服务。所以对国内用户没 ...

DataForSeoBot是什么蜘蛛 爬虫,怎么屏蔽

最近安装了蜘蛛分析插件,发现了DataForSeoBot这个蜘蛛,每天爬几百上千的页面,搜了搜,是一个国外的seo运营公司的蜘蛛,换句话说,就是DataForSeoBot爬虫采集的数据是提供给众多SEO从业人士的,这些数据可以被用作 ...