DataForSeoBot是什么蜘蛛 爬虫,怎么屏蔽

最近安装了蜘蛛分析插件,发现了DataForSeoBot这个蜘蛛,每天爬几百上千的页面,搜了搜,是一个国外的seo运营公司的蜘蛛,换句话说,就是DataForSeoBot爬虫采集的数据是提供给众多SEO从业人士的,这些数据可以被用作SEO竞争分析、SEO软件开发、市场调查、甚至网络推广等方面。也就是说,对于被抓取的网站本身来说,无任何价值,甚至有数据被采集的负面影响。

DataForSeoBot是什么蜘蛛 爬虫,怎么屏蔽

这还有啥说,果断屏蔽啊!

怎么屏蔽DataForSeoBot蜘蛛?

官网宣称DataForSeoBot爬虫支持robots.txt协议,但其实这货不怎么守规矩,robots.txt禁止以后,还爬的飞起。

所以建议需要屏蔽这个蜘蛛的,两手抓:

1、robots.txt协议禁止爬取

User-agent: DataForSeoBot
Disallow: /

2、通过修改Nginx或其它WEB服务器规则禁止抓取

if ($http_user_agent ~*  "DataForSeoBot/1.0" )
{
      return 403;
}

3、通过禁止蜘蛛IP方式禁止访问

这个办法不推荐,蜘蛛IP有不少,还会新增改变,很难全部禁止掉。

总结:禁止DataForSeoBot爬虫最佳办法就是直接在服务器规则里面禁止,效果最好。

游乐星球 点此下载

相关推荐

DotBot是什么蜘蛛,需要屏蔽这个爬虫吗

DotBot是国外Moz旗下链接分析网站opensiteexplorer的,DotBot蜘蛛专门用来分析网站的外链数据,我也是装上了蜘蛛分析插件以后才发现这么多没什么用的蜘蛛在持续消耗我的服务器资源,好的是现在知道了,一个个屏蔽了 ...

SemrushBot是什么蜘蛛,这个爬虫怎么屏蔽

SemrushBot是SEMrush的服务器搜索蜘蛛,SEMrush 是一个强大的、全面的在线营销竞争情报平台,其中包括 SEO、PPC、社交媒体和视频广告研究。机器人抓取你的网页来解析你的网站内容,所以相关的信息在你的网站很容易索 ...

BLEXBot是什么蜘蛛,需要屏蔽这个爬虫吗

BLEXBot这个蜘蛛也是最近爬的比较厉害的一个,属于一家美国的反向链接查询网站(WebMeUp)的蜘蛛程序,它会大量的抓取我们的网站链接,所以一旦我们发现有他的抓取的踪迹,就会发现他真的是大量的抓取你的链接。 这 ...

MJ12bot蜘蛛是什么爬虫,怎么屏蔽

MJ12bot是一个来自英国网络营销公司的搜索引擎蜘蛛,这个搜索引擎名称叫做:Majestic。这家公司的搜索引擎主要是用来绘制互联网地图的,然后用这个互联网地图数据来为企业提供互联网营销数据服务。所以对国内用户没 ...