谷歌搜索引擎蜘蛛百度搜索引擎蜘蛛百度翻译搜索引擎蜘蛛搜狗搜索引擎蜘蛛雅虎搜索引擎蜘蛛神马搜索引擎蜘蛛必应搜索引擎蜘蛛字节跳动搜索引擎蜘蛛
360蜘蛛ip官方已明确给出,后期本站会把ip列表加入进去
对于一个攻击者,或者采集者,伪装成搜索引擎,很容易躲过你的肉眼检查,兴奋的你还在为搜索引擎来访而洋洋得意的时候,其实是个假蜘蛛
如果你的站点对搜索引擎蜘蛛要求比较精细,你可以通过openresty的resty.dns.resolver模块+user-agent,在content_by_lua_file中实现精确的访客控制!
通过ip反向查询蜘蛛,可以让假引擎蜘蛛现行,直接扼杀在黑名单中!
识别出假蜘蛛处理的方法有很多,不再一一细说!
部分官方已明确给出了确定真实蜘蛛的方法,比如百度官网所说,可以使用dns反向解析,可以确认正确的蜘蛛,比如:
E:\bugscansplit>nslookup 220.181.108.80 服务器: public1.114dns.com Address: 114.114.114.114 名称: baiduspider-220-181-108-80.crawl.baidu.com Address: 220.181.108.80
那么后缀为.baidu.com的就是真实的蜘蛛,其他同理,都有相应的反向域名后缀标志,通过收集这些后缀,就形成了这个工具!
搜索引擎蜘蛛照妖镜,是实时通过nslookup检测,具有很高的时效性和准确性!
另外因为本人能力有限,收集的指纹还不足够多,对于未能检测出来的ip也不一定是假蜘蛛,对于检测出来的一定是真蜘蛛!
工具提供的结果只作为参考,请务用于真实业务场景
2019年03月01号上线!
2021年6月05号重新调整了线程