详细罗列出各个搜索引擎蜘蛛日志及服务器常见状态码含义。

其实我们做SEO网站优化的一般来说都是一个全知全能的职位,因为做优化做排名影响的因素太多了,就比如我们今天要讲的课题,日志的分析如果不会分析看不懂蜘蛛的爬行轨迹,那么在优化的过程中出现问题,就很有可能思路是错的而不自知。

详细罗列出各个搜索引擎蜘蛛日志及服务器常见状态码含义(图1)

IIS日志的用途就是能够观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,爬取反应出来的HTTP状态码,为我们带来清晰的分析便利。

一、各大搜索引擎的蜘蛛名称:

百度(Baidu)爬虫名称(Baiduspider)

谷歌(Google)爬虫名称(Googlebot)

雅虎(Yahoo)爬虫名称(YahooSlurp)

有道(Yodao)蜘蛛名称(YodaoBot)

搜狗(sogou)蜘蛛名称(sogouspider)

MSN的蜘蛛名称:msnbot

二、IIS分析:

案例日志:61.135.168.22--[11/Jan/2009:04:02:45+0800]"GET/thread-7303-1-1.HtmlHTTP/1.1"2008450"-""Baiduspider(+http:-www-baidu-com/search/spider.htm)"

分析:

1、61.135.168.22是访问了是服务器IP为这个的网站.

2、11/Jan/2009:04:02:45表示蜘蛛爬行时间

3、GET/thread-7303-1-1.htmlHTTP,表示蜘蛛抓取了这个页面。

4、200状态码表示蜘蛛抓取页面成功;404表示蜘蛛抓取页面失败。

5、8450表示此次抓取了8450个字节

6、Baiduspider(+http:-www-baidu-com/search/spider.htm)表示百度蜘蛛的名称

三、基本状态码:

200:请求已经完成,蜘蛛访问页面正常

301:已经移动,永久重定向

302:临时重定向

304:蜘蛛爬取后发现,页面没有修改

305:使用代理

400:请求错误

404:找不到页面

四、IIS详细状态码含义:

100-表示已收到请求的一部分,正在继续发送余下部分。

101-切换协议。

2XX-成功服务器成功地接受了客户端请求。(只要是2XX的状态,都表示成功)

200-确定。客户端请求已成功。

201-已创建。

202-已接受。

203-非有名性信息。

204-无内容。

205-重置内容。

206-部分内容。

300-针对收到请求,服务器可执行多种操作。

301-永久移动转移,请求的内容已永久移动其他新位置。

302-临时移动转移,请求的内容已临时移动新的位置

304-未修改。自从上次请求后,请求的内容未修改过。

307-临时重定向。服务器目前从不同位置响应请求,但请求者应继续使用原有位置来进行以后的请求。

400-错误的请求。

401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示:

401.1-登录失败。

401.2-服务器配置导致登录失败。

401.3-由于ACL对资源的限制而未获得授权。

401.4-筛选器授权失败。

401.5-ISAPI/CGI应用程序授权失败。

401.7-访问被web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用。

403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:

403.1-执行访问被禁止。

403.2-读访问被禁止。

403.3-写访问被禁止。

403.4-要求SSL.

403.5-要求SSL128.

403.6-IP地址被拒绝。

403.7-要求客户端证书。

403.8-站点访问被拒绝。

403.9-用户数过多。

403.10-配置无效。

403.11-密码更改。

403.12-拒绝访问映射表。

403.13-客户端证书被吊销。

403.14-拒绝目录列表。

403.15-超出客户端访问许可。

403.16-客户端证书不受信任或无效。

403.17-客户端证书已过期或尚未生效。

403.18-在当前的应用程序池中不能执行所请求的URL.这个错误代码为IIS6.0所专用。

403.19-不能为这个应用程序池中的客户端执行CGI.这个错误代码为IIS6.0所专用。

403.20-Passport登录失败。这个错误代码为IIS6.0所专用。

404-未找到请求的内容。

404.0-未找到文件或目录。

404.1-无法在所请求的端口上访问Web站点。

404.2-Web服务扩展锁定策略阻止本请求。

404.3-MIME映射策略阻止本请求。

405-用来访问本页面的HTTP谓词不被允许(方法不被允许)

406-客户端浏览器不接受所请求页面的MIME类型。

407-要求进行代理身份验证。

412-前提条件失败。

413-请求实体太大。

414-请求URI太长。

415-不支持的媒体类型。

416-所请求的范围无法满足。

417-执行失败。

423-锁定的错误。

500-服务器内部错误。

500.12-应用程序正忙于在Web服务器上重新启动。

500.13-Web服务器太忙。

500.15-不允许直接请求Global.asa.

500.16-UNC授权凭据不正确。这个错误代码为IIS6.0所专用。

500.18-URL授权存储不能打开。这个错误代码为IIS6.0所专用。

500.100-内部ASP错误。

501-服务器无法完成请求的功能。

502-服务器用作网关或代理服务器时收到了无效响应。

502.1-CGI应用程序超时。

502.2-CGI应用程序出错。

503-服务不可用。这个错误代码为IIS6.0所专用。

504-网关超时。

505-HTTP版本不受支持。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/219829.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
重蔚的头像重蔚管理团队
上一篇 2023年2月16日 11:27
下一篇 2023年2月16日 11:27

相关推荐

  • 什么是长尾关键词?

    如果我告诉您,有一种方法可以获得有针对性的有机流量,这实际上比驱动大量随机页面浏览更容易吗? 我们都熟悉谷歌争夺高容量关键词的竞争,但在整个比赛中,长尾关键词可能会被忽视。 如果你问我,这没有任何意义…

    2019年8月2日 SEO操作
    0640
  • 从搜索引擎分词技术入手来专研关键词排名技巧。

    中国企业做网站SEO主要集中在百度排名上,而站点关键字的质量是影响百度排名的重要因素。如果你对百度搜索引擎的分词技术有一定的了解,你就可以更容易地做提高关键词排名的工作。分词技术:什么是分词,怎么搜索引…

    2023年2月16日
    01
  • 教你 seo学习必备很多人都不知道。

    seo学习必备很多人都不知道 来到了搜索引擎优化职业,成为了搜索引擎优化人,人人都可以在老板面前说自己是一个SEO,但并不是所有人都可以称自己为“搜索引擎优化人才”。搜索引擎优化人才需求具有哪些技能?或许在许…

    2022年11月10日
    04
  • 营销型网站怎么做才有利于建立与搜索引擎之间的信任。

    营销型网站是现在中小企业主流的建站方式,那么营销型网站怎么做才有利于建立与搜索引擎之间的信任呢,下面小编就为你总结下提高营销网站与搜索引擎之间的信任的技巧,一起来看看吧。 一、造成营销型网站与搜索引擎…

    2023年2月22日
    06
  • 长尾词SEO优化策略:提升网站用户的参与度和转化率

    网站上可以带来搜索流量的非目标关键词,我们称为长尾关键词。Google数据也证实网站上长尾关键词的重要性,通用关键词虽然能比具体关键词获得更多搜索量,但具体关键词可能意味着更高的访客参与度和转化率。 长尾词…

    2018年5月18日
    0119
  • 为什么说服务器的稳定性会影响网站排名与流量。

    服务器是网站开展在线业务的主要设备之一,其稳定性直接决定着业务的发展。许多网站的业务问题不可避免地会出现。因为服务器的稳定性不仅会影响网站的运行速度,还会影响网站的SEO优化。我们来看看服务器的稳定性会…

    2023年2月24日
    03
  • 我来分享搜索引擎优化的网站导航设计技巧。

    搭建网站的任何细节都需要考虑到是否利于seo优化,这是作为seoer必须时刻都要有的意识。那么网站导航设计的过程中,我们应该怎么样进行操作才是符合搜索引擎优化的呢? 1、文字类型的导航设计 针对于搜索引擎蜘蛛的…

    2023年6月20日
    01
  • 服务器的稳定性直接影响关键词排名。

    我们在做网站优化时,经常会考虑关键字、链接、文章等的设置。谁知道,在网站正式上线之前,有一个非常重要的因素,这对网站优化排名也有很大影响,那就是服务器。有很多种服务器。强大的单位可以选择独立的服务器…

    2023年2月27日
    03

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息