怎样在Apache中用shell脚本提交网站404死链

怎样在Apache中用shell脚本提交网站404死链?百度站长平台提供的死链提交器材,可将网站存在的死链(条约死链、404页面)进行提交,可迅速删除死链,协助网站SEO优化。在提交死链的文件中逐一手动填写死链的话太困难,工作中咱们提倡复杂自动化,所以本文咱们一起交流分享Apache服务中经过shell脚本清理网站死链,便于咱们提交。

SEO优化

1.配置Apache记载搜寻引擎

Apache是目前网站建设为主流的web服务,可是apache的日志文件承认是不记载百度、google等各大搜寻引擎的爬取程序的,所以首先需求咱们配置Apache的配置文件。

找到Apache的配置文件httpd.conf,在配置文件中找到底下两行:

CustomLog "logs/access_log" common #CustomLog "logs/access_log" combined

承认选用的是common,这里咱们只需求将common这一行前方加#说明注解掉,而后将combined这一行前的#去掉能够。而后保存重启Apache服务。

注:假如你的服务器上增加了多个站点,每个站点有独自的配置文件,则咱们只需求在相应站点的配置文件中配置CustomLog项能够,例如:

vim /usr/local/apache/conf/vhost/www.chanzhi.org.conf ServerAdmin [email protected] DocumentRoot "/data/wwwroot/www.chanzhi.org" ServerName www.chanzhi.org ServerAlias chanzhi.org ErrorLog "/data/wwwlogs/www.chanzhi.org_error_apache.log" CustomLog "/data/wwwlogs/www.chanzhi.org_apache.log" combined SetOutputFilter DEFLATE Options FollowSymLinks ExecCGI Require all granted AllowOverride All Order allow,deny Allow from all DirectoryIndex index.html index.php

底下是配置前后的网站日志记载格式:

配置前:

配置后:

SEO优化

2.编写shell脚本

咱们经过shell脚本获得网站日志中指定爬虫的抓取记载,而后汇总到一个文件中,便于晚期运用。代码如下,譬如保存为deathlink.sh

#!/bin/bash#初始化变量#定义蜘蛛UA信息(承认是百度蜘蛛)UA='+http://www.baidu.com/search/spider.html' #前一天的日期(apache日志)DATE=`date +%Y%m%d -d "1 day ago"` #定义日志路径logfile=/data/wwwlogs/www.chanzhi.org_apache.log-${DATE}.log #定义死链文件储存路径deathfile=/data/wwwroot/www.chanzhi.org/deathlink.txt #定义网站拜访位置website=http://www.chanzhi.org #分析日志并保存死链数据for url in `awk -v str="${UA}" '$9=="404" && $15~str {print $7}' ${logfile}`do grep -q "$url" ${deathfile} || echo ${website}${url} <<${deathfile}done

众人在运用该脚本时,根据自身服务器状况调节下路径和字段能够,而后实行脚本,:

bash deathlink.sh

3.提交死链

实行上面脚本时辰,就会在指定目次下生成包括全部获得的404页面链接的文件,每个连接占一行。例如:

后在站长平台提交死链页面中,填写自身的死链文件位置能够,例如:

百度在审核经过之后,会将依然收录的失效链接删除,以防止失效页面链接对网站形成不良的影响。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/39103.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
优化家优化家订阅用户
上一篇 2022年5月30日 21:05
下一篇 2022年5月30日 21:05

相关推荐

  • seovip流量的组成能给站长带来什么。

      这几天都在研究seovip,研究这是一个什么样的站点,同时也在关注robin这个人,还翻看了他好多的资料,包括微博的历史数据等,突然看到某一篇文章那里有他的一段话,我直接复制图片过来了,是他描述seovip这个网…

    2022年3月12日
    0218
  • 必须了解的搜索引擎算法分析

    搜索引擎九大算法NO.1 绿萝算法 算法内容:为了打击买卖外链、批量群发外链的行为。目的,避免站长不用心做用户体验,纯粹的利用搜索引擎漏洞投机取巧,影响搜索引擎自身用户体验。主要打击的网站类型有,超链中介…

    2022年5月28日
    0396
  • 谈谈网站跳出率以及如何改善的问题。

      第一次接触网站跳出率的问题,是看到记录自己网站各项数据时。当时就问了经理,得到的回复是:不同程度反映了用户喜不喜欢你的网站。    那准确地说,什么是网站跳出率?用文绉绉的一句话来解释就是指单…

    2022年3月12日
    0167
  • [网站优化培训]如何制定网站优化方案?

    大家都知道网站优化是一门技术活,是需要一些策略和手段的,那我们又该怎样制定这些策略呢?其实,在实际操作优化的过程中,我们发现不同类型的网站所运用的策略是不一样的。因为企业的预算都是有限的,所以有必要…

    2022年6月2日
    0270
  • Seo是怎么优化关键词的。

    在我们网站优化的过程中,我们一个URL可以对应很多关键词。但是一个关键词就只能对应一个URL。就好比:seo.aizhan.com要做的关键词是 SEO教程 SEO培训 SEO基础。我们在发写文章的时候 这个三词都指向我这个seo.aizh…

    2022年3月12日
    0332
  • 网站SEO优化多久才能见效。

    据爱站网SEO培训客服消息,经常有学员咨询网站优化效果多久可见效,多久可以看到排名效果这些问题,其实这个问题没有明确的答案,与网站优化为什么不能保证排名的原因一样。搜索引擎是一个工具,搜索引擎的技术控制…

    2022年3月12日
    0199
  • 如何去提升自己的网站排名呢?

    很多的企业之做网站就是想通过网站,去对于刚开始没有排名的人,如何去提升自己的网站排名呢?这里就给SEOer介绍一款比较好的seo网站点击软件,所谓的点击软件并不是一个单纯的软件,而是一种seo排名优化技术。已经…

    2022年5月29日
    0250
  • 谈谈SEOer如何去进行互联网创业。

      现在的劳动者越来越多,人才过剩的背景下必然是劳动力廉价。在你找不到工作或者不愿意按部就班地每天打卡上班时,你该做什么?有个若隐若现的答案,艰苦又激情地,来创业吧,这个是一个不错的选择。 (分享3个…

    2022年3月12日
    0331

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息