详细罗列出各个搜索引擎蜘蛛日志及服务器常见状态码含义。

其实我们做SEO网站优化的一般来说都是一个全知全能的职位,因为做优化做排名影响的因素太多了,就比如我们今天要讲的课题,日志的分析如果不会分析看不懂蜘蛛的爬行轨迹,那么在优化的过程中出现问题,就很有可能思路是错的而不自知。

详细罗列出各个搜索引擎蜘蛛日志及服务器常见状态码含义(图1)

IIS日志的用途就是能够观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,爬取反应出来的HTTP状态码,为我们带来清晰的分析便利。

一、各大搜索引擎的蜘蛛名称:

百度(Baidu)爬虫名称(Baiduspider)

谷歌(Google)爬虫名称(Googlebot)

雅虎(Yahoo)爬虫名称(YahooSlurp)

有道(Yodao)蜘蛛名称(YodaoBot)

搜狗(sogou)蜘蛛名称(sogouspider)

MSN的蜘蛛名称:msnbot

二、IIS分析:

案例日志:61.135.168.22--[11/Jan/2009:04:02:45+0800]"GET/thread-7303-1-1.HtmlHTTP/1.1"2008450"-""Baiduspider(+http:-www-baidu-com/search/spider.htm)"

分析:

1、61.135.168.22是访问了是服务器IP为这个的网站.

2、11/Jan/2009:04:02:45表示蜘蛛爬行时间

3、GET/thread-7303-1-1.htmlHTTP,表示蜘蛛抓取了这个页面。

4、200状态码表示蜘蛛抓取页面成功;404表示蜘蛛抓取页面失败。

5、8450表示此次抓取了8450个字节

6、Baiduspider(+http:-www-baidu-com/search/spider.htm)表示百度蜘蛛的名称

三、基本状态码:

200:请求已经完成,蜘蛛访问页面正常

301:已经移动,永久重定向

302:临时重定向

304:蜘蛛爬取后发现,页面没有修改

305:使用代理

400:请求错误

404:找不到页面

四、IIS详细状态码含义:

100-表示已收到请求的一部分,正在继续发送余下部分。

101-切换协议。

2XX-成功服务器成功地接受了客户端请求。(只要是2XX的状态,都表示成功)

200-确定。客户端请求已成功。

201-已创建。

202-已接受。

203-非有名性信息。

204-无内容。

205-重置内容。

206-部分内容。

300-针对收到请求,服务器可执行多种操作。

301-永久移动转移,请求的内容已永久移动其他新位置。

302-临时移动转移,请求的内容已临时移动新的位置

304-未修改。自从上次请求后,请求的内容未修改过。

307-临时重定向。服务器目前从不同位置响应请求,但请求者应继续使用原有位置来进行以后的请求。

400-错误的请求。

401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示:

401.1-登录失败。

401.2-服务器配置导致登录失败。

401.3-由于ACL对资源的限制而未获得授权。

401.4-筛选器授权失败。

401.5-ISAPI/CGI应用程序授权失败。

401.7-访问被web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用。

403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:

403.1-执行访问被禁止。

403.2-读访问被禁止。

403.3-写访问被禁止。

403.4-要求SSL.

403.5-要求SSL128.

403.6-IP地址被拒绝。

403.7-要求客户端证书。

403.8-站点访问被拒绝。

403.9-用户数过多。

403.10-配置无效。

403.11-密码更改。

403.12-拒绝访问映射表。

403.13-客户端证书被吊销。

403.14-拒绝目录列表。

403.15-超出客户端访问许可。

403.16-客户端证书不受信任或无效。

403.17-客户端证书已过期或尚未生效。

403.18-在当前的应用程序池中不能执行所请求的URL.这个错误代码为IIS6.0所专用。

403.19-不能为这个应用程序池中的客户端执行CGI.这个错误代码为IIS6.0所专用。

403.20-Passport登录失败。这个错误代码为IIS6.0所专用。

404-未找到请求的内容。

404.0-未找到文件或目录。

404.1-无法在所请求的端口上访问Web站点。

404.2-Web服务扩展锁定策略阻止本请求。

404.3-MIME映射策略阻止本请求。

405-用来访问本页面的HTTP谓词不被允许(方法不被允许)

406-客户端浏览器不接受所请求页面的MIME类型。

407-要求进行代理身份验证。

412-前提条件失败。

413-请求实体太大。

414-请求URI太长。

415-不支持的媒体类型。

416-所请求的范围无法满足。

417-执行失败。

423-锁定的错误。

500-服务器内部错误。

500.12-应用程序正忙于在Web服务器上重新启动。

500.13-Web服务器太忙。

500.15-不允许直接请求Global.asa.

500.16-UNC授权凭据不正确。这个错误代码为IIS6.0所专用。

500.18-URL授权存储不能打开。这个错误代码为IIS6.0所专用。

500.100-内部ASP错误。

501-服务器无法完成请求的功能。

502-服务器用作网关或代理服务器时收到了无效响应。

502.1-CGI应用程序超时。

502.2-CGI应用程序出错。

503-服务不可用。这个错误代码为IIS6.0所专用。

504-网关超时。

505-HTTP版本不受支持。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/219829.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
重蔚的头像重蔚管理团队
上一篇 2023年2月16日 11:27
下一篇 2023年2月16日 11:27

相关推荐

  • 我来分享wordpress 百度seo。

    WordPress是一个强大的内容管理系统,通过优化插件和主题,可以有效地提高百度SEO排名。 WordPress百度统计的简单介绍 什么是百度统计? 百度统计是一款由百度公司推出的网站流量分析工具,可以帮助网站管理员了解…

    2024年6月27日
    00
  • 运用搜索引擎优化来进行企业网站建设。

    很多企业在做企业网站建设的时候,网站本身的制作和设计做的很好,然而因为没有做到良好的优化,网站在搜索引擎中的排名不是很好,没能达到很好的宣传自身的产品与品牌的效果。那么,如何做好网站的优化呢? 第一、…

    2023年2月20日
    00
  • 教你搜索引擎优化的理由都有哪些。

    seo”Search Engine Optimization”汉译为搜索引擎优化 ,搜索引擎优化是一种利用搜索引擎的搜索规则来提高目前网站在有关搜索引擎内的自然排名的方式,搜索引擎优化是提高网站在搜索引擎结果中排名的战略。它涉及确定…

    2023年6月23日
    00
  • 外链建设的最有效方法有哪些

    网站外链建设无疑是对网站优化有一定的帮助,通过外链建设可以提升网站的关键词排名,提升网站权重,所以它对於网站运营推广过程是必不可少的一步。但很多seo新手不会做外链,所以非常头痛,下面,我们就来看看外链…

    2017年7月28日
    0129
  • 通过监控品牌词可清楚反应搜索引擎优化情况及网站面临的问题。

    在做SEO的过程中,实际上很少有运营商会关注企业网站品牌词的变化,甚至有些网站仍然忽视了“品牌词”的概念。为什么SEO员工每天都需要监控品牌词?因为在监测品牌词搜索量的过程中,它清楚地反映了网站面临的问题、…

    2023年2月17日
    00
  • 说说莱芜服务器租用。

    莱芜服务器租用是指在中国山东省莱芜市内,企业或个人通过与数据中心或服务商签订合同,租用服务器空间和网络资源,以托管自己的网站、应用程序或数据。 莱芜服务器租用概述 莱芜服务器租用是指在莱芜地区提供服务…

    2024年6月30日
    00
  • 选择什么样的seo公司能做好整站优化。

    随着移动互联网的快速发展和客户成本的不断增加,很多企业都会采用有效的SEO优化方法来降低成本,达到更好的推广效果。然而,SEO优化是一个漫长而漫长的过程。缺乏经验的企业可能会过度优化或错误优化,导致网站无…

    2023年2月25日
    00
  • 盘点搜索引擎摒弃的页面优化技术。

    每个SEO人员都知道,搜索排名需要适当的研究策略、优化的页面和页面外的SEO因素、迷人的内容和持久的搜索价值。换句话说,进入前十的搜索引擎并不是一件容易的事。考虑到白帽SEO策略需要花费大量时间,一些SEO实践…

    2023年2月15日
    00

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息