怎样在Apache中用shell脚本提交网站404死链

怎样在Apache中用shell脚本提交网站404死链?百度站长平台提供的死链提交器材,可将网站存在的死链(条约死链、404页面)进行提交,可迅速删除死链,协助网站SEO优化。在提交死链的文件中逐一手动填写死链的话太困难,工作中咱们提倡复杂自动化,所以本文咱们一起交流分享Apache服务中经过shell脚本清理网站死链,便于咱们提交。

SEO优化

1.配置Apache记载搜寻引擎

Apache是目前网站建设为主流的web服务,可是apache的日志文件承认是不记载百度、google等各大搜寻引擎的爬取程序的,所以首先需求咱们配置Apache的配置文件。

找到Apache的配置文件httpd.conf,在配置文件中找到底下两行:

CustomLog "logs/access_log" common #CustomLog "logs/access_log" combined

承认选用的是common,这里咱们只需求将common这一行前方加#说明注解掉,而后将combined这一行前的#去掉能够。而后保存重启Apache服务。

注:假如你的服务器上增加了多个站点,每个站点有独自的配置文件,则咱们只需求在相应站点的配置文件中配置CustomLog项能够,例如:

vim /usr/local/apache/conf/vhost/www.chanzhi.org.conf ServerAdmin [email protected] DocumentRoot "/data/wwwroot/www.chanzhi.org" ServerName www.chanzhi.org ServerAlias chanzhi.org ErrorLog "/data/wwwlogs/www.chanzhi.org_error_apache.log" CustomLog "/data/wwwlogs/www.chanzhi.org_apache.log" combined SetOutputFilter DEFLATE Options FollowSymLinks ExecCGI Require all granted AllowOverride All Order allow,deny Allow from all DirectoryIndex index.html index.php

底下是配置前后的网站日志记载格式:

配置前:

配置后:

SEO优化

2.编写shell脚本

咱们经过shell脚本获得网站日志中指定爬虫的抓取记载,而后汇总到一个文件中,便于晚期运用。代码如下,譬如保存为deathlink.sh

#!/bin/bash#初始化变量#定义蜘蛛UA信息(承认是百度蜘蛛)UA='+http://www.baidu.com/search/spider.html' #前一天的日期(apache日志)DATE=`date +%Y%m%d -d "1 day ago"` #定义日志路径logfile=/data/wwwlogs/www.chanzhi.org_apache.log-${DATE}.log #定义死链文件储存路径deathfile=/data/wwwroot/www.chanzhi.org/deathlink.txt #定义网站拜访位置website=http://www.chanzhi.org #分析日志并保存死链数据for url in `awk -v str="${UA}" '$9=="404" && $15~str {print $7}' ${logfile}`do grep -q "$url" ${deathfile} || echo ${website}${url} <<${deathfile}done

众人在运用该脚本时,根据自身服务器状况调节下路径和字段能够,而后实行脚本,:

bash deathlink.sh

3.提交死链

实行上面脚本时辰,就会在指定目次下生成包括全部获得的404页面链接的文件,每个连接占一行。例如:

后在站长平台提交死链页面中,填写自身的死链文件位置能够,例如:

百度在审核经过之后,会将依然收录的失效链接删除,以防止失效页面链接对网站形成不良的影响。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/39103.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
优化家优化家订阅用户
上一篇 2022年5月30日 21:05
下一篇 2022年5月30日 21:05

相关推荐

  • [seo快速排名方法]影响关键词排名的因素有哪些?

    网站优化过程中,关键词的排名受很多因素的影响,下面我总结处八个能影响关键词排名的因素供大家参考,如果你的网站排名始终处于一种徘徊上不去的状态,不妨试下下面的方法:1、网站服务器的稳定性:Web服务器的稳定…

    2022年6月1日
    0189
  • 网站内链优化的4大留意事项

    网站内链优化是SEO优化中很重要的一个环节,网站全体权重的布局分配全赖内链的引导。所以在做内链优化必定要留意。详细有哪些留意细节呢?一、内链所涉及到的锚文本必定要和指向的页面相关其实,锚文本就是内链的一…

    2022年5月30日
    0263
  • 百度下拉框:刷百度下拉框的原理和办法

    度下拉菜单反应性关键词是用户在查找时与查找引擎的第一步互动,在互动过程中,查找引擎的反应关键词不断调整来满意用户的特性需求。自打百度成为中文第一大查找引擎以来,环绕百度的推行营销从来就没有间断过。在…

    2022年5月31日
    0501
  • 分析企业网站SEO从零做起的5大策略。

      随着互联网的高度发展,越来越多的企业和个人都意识到网站的重要性。作为用户与互联网之间的媒介,网站承担着原来越重要的角色,现在大部分企业已有了自己的网站,剩下那些没有网站的也表示出来想拥有网站的愿…

    2022年3月12日
    0178
  • 页面中多处使用nofollow会影响收录和权重吗?

    首先我们看一下百度百科对于nofollow的定义我这里就直接从百度百科上面复制过来:nofollow是一个HTML标签的属性值。它的出现为网站管理员提供了一种方式,即告诉搜索引擎"不要追踪此网页上的链接"或&quot…

    2022年6月2日
    0308
  • 应该怎么写网站标题描述关键词有利于SEO?

    网站的标题描述关键词(即title、description、keywords)是网站优化必不可少的一部分,一个好的网站标题描述关键词对于网站SEO优化可以起到事半功倍的效果。ONE资源网接下来为SEO新手们介绍网站标题描述关键词如何…

    2022年6月1日
    0293
  • 详细解说QQ空间推广自己的网站。

      QQ空间现在已超一亿用户了,身边的人,几乎每个人现在都有QQ,而QQ空间一有什么更新的,QQ面板上就显示出来有多少个好友更新的消息,一天下来总会有不少人去点击那个空间小图标浏览里边的内容,于是QQ空间这个…

    2022年3月12日
    0261
  • 网站提高用户关注度的三个有效方法

    一个精品网站,若是没有营销出去,那也只是个毫无用处的花瓶,为了提高网站知名度,站长就要学会操作各类渠道进行推广,方法如新闻投稿、论坛及百度引擎平台推广等,除了一些常见的,还有一些如网站描述、做好百度…

    2022年5月28日
    0411

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息