搜索引擎蜘蛛照妖镜


目前支持识别的搜索引擎ip蜘蛛有6个:


百度蜘蛛谷歌蜘蛛手机端百度蜘蛛转码蜘蛛搜狗蜘蛛Yahoo搜索引擎蜘蛛Yahoo中国搜索引擎蜘蛛

360蜘蛛ip官方已明确给出,后期本站会把ip列表加入进去

使用场景


对于一个攻击者,或者采集者,伪装成搜索引擎,很容易躲过你的肉眼检查,兴奋的你还在为搜索引擎来访而洋洋得意的时候,其实是个假蜘蛛

如果你的站点对搜索引擎蜘蛛要求比较精细,你可以通过openresty的resty.dns.resolver模块+user-agent,在content_by_lua_file中实现精确的访客控制!

通过ip反向查询蜘蛛,可以让假引擎蜘蛛现行,直接扼杀在黑名单中!

识别出假蜘蛛处理的方法有很多,不再一一细说!

实现原理


部分官方已明确给出了确定真实蜘蛛的方法,比如百度官网所说,可以使用dns反向解析,可以确认正确的蜘蛛,比如:

E:\bugscansplit>nslookup 220.181.108.80
服务器:  public1.114dns.com
Address:  114.114.114.114

名称:    baiduspider-220-181-108-80.crawl.baidu.com
Address:  220.181.108.80

那么后缀为.baidu.com的就是真实的蜘蛛,其他同理,都有相应的反向域名后缀标志,通过收集这些后缀,就形成了这个工具!

工具亮点


搜索引擎蜘蛛照妖镜,是实时通过nslookup检测,具有很高的时效性和准确性!

另外因为本人能力有限,收集的指纹还不足够多,对于未能检测出来的ip也不一定是假蜘蛛,对于检测出来的一定是真蜘蛛!

工具提供的结果只作为参考,请务用于真实业务场景

使用限制


每天有100次的检测次数!

更新日志


2019年03月01号上线!