百度蜘蛛如何识别

教程分享 > SEO教程 > 博文分享 (1616) 2024-03-15 09:42:58

一、查看UA信息

如果UA信息不对,可以直接判断该蜘蛛为非百度搜索的蜘蛛

目前UA分为移动、PC、和小程序三个应用场景,分别如下:

【移动UA】

Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html) 

 

【PC UA】

Mozilla/5.0(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
Mozilla/5.0(compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

 

【小程序UA】

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)

二、双向DNS解析认证

第一步:DNS反查IP

开发者可以对日志中访问服务器的IP地址进行反向DNS查找,判断某只spider是否来自百度搜索引擎,Baiduspider的hostname以*.baidu.com或*.baidu.jp 的格式命名,非*.baidu.com或*.baidu.jp即为冒充

 

在Linux/Windows/OS三种平台下,验证方法分别如下:

 

1) 在Linux平台下,可以使用host IP命令反解IP来判断该抓取是否来自Baiduspider。

 

2) 在Windows平台或者IBM OS/2平台下,可以使用nslookup IP命令反解IP:打开命令处理器,输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析IP,判断该抓取是否来自Baiduspider。

 

3) 在macOS平台下,可以使用dig命令反解IP:打开命令处理器输入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析IP,判断该抓取是否来自Baiduspider。

 


第二步:对域名运行正向DNS查找

 

对第一步中通过命令检索到的域名运行正向DNS查找,验证该域名与日志中访问服务器的原始IP地址是否一致,IP地址一致可确认spider来自百度搜索引擎,IP地址不一致即为冒充

 

【示例】
 

> host 111.206.198.69 

69.198.206.111. in-addr.arpa domain name pointer baiduspider-111-206-198-69.crawl.baidu.com. 



>hostbaiduspider-111-206-198-69.crawl.baidu.com 

baiduspider-111-206-198-69.crawl.baidu.com has address 111.206.198.69

相关文章
一、查看UA信息如果UA信息不对,可以直接判断该蜘蛛为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,分别如下:
转发百度搜索SEO官方文档,获得流量的基础——良好收录
百度seo之撰写搜索引擎喜爱的标题-(转),【网站优化】产品、编辑必看:撰写搜索引擎喜爱的标题
百度云网盘百度网盘介绍       百度网盘(原百度云)是百度推出的一项云存储服务,已覆盖主流PC和手机操作系统,包含Web版、Windows版、Mac版、Android版、iPhone版和Wi...
都2024了,各位使用百度搜索的时候第一个结果很多情况下遇到百度智能回答或百度智能文章吧。例如,在百度中收索jdk安装配置第一篇就是百度的智能文章,下面来看看具
事情是这样的,昨天给博客进行了程序更新。刚开始都还是好好的。突然就访问错误了 经过排除发现是静态资源文件访问挂了,本站的静态资源一直是用的百度云加速的CDN服务。   于是马上去访问s...
6月底我们发布了细雨算法的公告《百度搜索推出细雨算法 促进供求黄页类站点生态健康发展》。今天我们重点说b2b领域站点究竟应该怎么做。
前言       在写作前,作者也百度查了很多Spring boot 301重定向资料
前言在写这篇文章前,我百度了很多教程,大多数都是相似的,结果都是失败
Java通过sourceafis比对指纹图片的相似度判断指纹,sourceafis,Java指纹图片
1.新增nginx屏蔽配置文件文件暂时为/etc/nginx/conf.d/deny_ua.config说明:文件名deny_ua.config,后缀为.config非.conf,原因是.con...
这里主要讲解如何通过调用api自动推送URL到bing站长平台,让Bing蜘蛛及时抓取你发布的内容。随着Windows 10 Windows11 全面推广后,自带的edge浏览器也越来越流行。默...
最近一大佬好心,送了一枚已经刷入群晖ds119j的猫盘给我玩,到手第一步就是拆机,拆机就难题来了不知道怎么拆以为是旋转中间哟,百度了半天才找的一个文字描述的说要下脚垫,我之前也扣过不过太紧就扣不...
这几个月技术圈聊的最火的就是ChatGPT这个项目,目前ChatGPT已经掌握了互联网大部分公开信息并进行了分析处理。通过提问可以快速的从ChatGPT得到答案,对于用户来说非常方便,比搜索引擎...