怎样在Apache中用shell脚本提交网站404死链

怎样在Apache中用shell脚本提交网站404死链?百度站长平台提供的死链提交器材,可将网站存在的死链(条约死链、404页面)进行提交,可迅速删除死链,协助网站SEO优化。在提交死链的文件中逐一手动填写死链的话太困难,工作中咱们提倡复杂自动化,所以本文咱们一起交流分享Apache服务中经过shell脚本清理网站死链,便于咱们提交。

SEO优化

1.配置Apache记载搜寻引擎

Apache是目前网站建设为主流的web服务,可是apache的日志文件承认是不记载百度、google等各大搜寻引擎的爬取程序的,所以首先需求咱们配置Apache的配置文件。

找到Apache的配置文件httpd.conf,在配置文件中找到底下两行:

CustomLog "logs/access_log" common #CustomLog "logs/access_log" combined

承认选用的是common,这里咱们只需求将common这一行前方加#说明注解掉,而后将combined这一行前的#去掉能够。而后保存重启Apache服务。

注:假如你的服务器上增加了多个站点,每个站点有独自的配置文件,则咱们只需求在相应站点的配置文件中配置CustomLog项能够,例如:

vim /usr/local/apache/conf/vhost/www.chanzhi.org.conf ServerAdmin [email protected] DocumentRoot "/data/wwwroot/www.chanzhi.org" ServerName www.chanzhi.org ServerAlias chanzhi.org ErrorLog "/data/wwwlogs/www.chanzhi.org_error_apache.log" CustomLog "/data/wwwlogs/www.chanzhi.org_apache.log" combined SetOutputFilter DEFLATE Options FollowSymLinks ExecCGI Require all granted AllowOverride All Order allow,deny Allow from all DirectoryIndex index.html index.php

底下是配置前后的网站日志记载格式:

配置前:

配置后:

SEO优化

2.编写shell脚本

咱们经过shell脚本获得网站日志中指定爬虫的抓取记载,而后汇总到一个文件中,便于晚期运用。代码如下,譬如保存为deathlink.sh

#!/bin/bash#初始化变量#定义蜘蛛UA信息(承认是百度蜘蛛)UA='+http://www.baidu.com/search/spider.html' #前一天的日期(apache日志)DATE=`date +%Y%m%d -d "1 day ago"` #定义日志路径logfile=/data/wwwlogs/www.chanzhi.org_apache.log-${DATE}.log #定义死链文件储存路径deathfile=/data/wwwroot/www.chanzhi.org/deathlink.txt #定义网站拜访位置website=http://www.chanzhi.org #分析日志并保存死链数据for url in `awk -v str="${UA}" '$9=="404" && $15~str {print $7}' ${logfile}`do grep -q "$url" ${deathfile} || echo ${website}${url} <<${deathfile}done

众人在运用该脚本时,根据自身服务器状况调节下路径和字段能够,而后实行脚本,:

bash deathlink.sh

3.提交死链

实行上面脚本时辰,就会在指定目次下生成包括全部获得的404页面链接的文件,每个连接占一行。例如:

后在站长平台提交死链页面中,填写自身的死链文件位置能够,例如:

百度在审核经过之后,会将依然收录的失效链接删除,以防止失效页面链接对网站形成不良的影响。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/39103.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
优化家优化家订阅用户
上一篇 2022年5月30日 21:05
下一篇 2022年5月30日 21:05

相关推荐

  • 做baidu seo多长时间见效?

    做baidu seo多长时间见效?这个困惑也是很多一些站长在优化过程中比较关注的问题,其实现在做优化,我们也是需要长期的坚持,并不是说短期就能够实现一个好的效果,而且这个问题很难回答。 其实做优化,最关键的就是…

    2022年5月29日
    0259
  • 可以发外链的地方有哪些。

    网站外链建设一般可以通过以下这些平台:1、高权重博客;2、相关论坛;3、分类信息网站;4、问答类平台;5、友情链接平台;6、招聘信息平台;7、视频分享平台;8、黄页等。那么现在的网站外链该怎么做呢?   高权重博客…

    2022年3月12日
    0375
  • 内容页的信息丰富度以及内链重要性

    今天主要就谈一下网站内容页优化的方式以及好处,无论是大站还是小站,流量绝大部分都是来自内容页,所以不容小视,首先说一下内容页的优化方式,其实和整个网站的优化是大同小异的。 因为内容页的信息是最丰富的,…

    2022年5月28日
    0273
  • 搜索引擎优化基础知识。

    一、为什么seo同样的关键词检索有的网站排名靠前,有的在后面 因为为客户提供最有价值的原创信息是搜索引擎的责任,面对海量的信息,搜索引擎必须通过算法确定哪些信息是高价值的,是原创的,哪些信息是抄袭来的,…

    2022年3月12日
    0340
  • 网站域名出现劫持要怎么恢复?

    做seo的seoer们都会遇到过网站被劫持的现象,所以做好网站劫持防御还是很重要的,下面小编就来为大家具体说说网站被劫持怎么恢复。 一、通常网站域名劫持会出现几种情况: 1.网站域名泛解析 2.浏览器劫持 3.hack攻…

    2022年6月3日
    0612
  • [手机端网站排名]移动端的网站优化应该怎么做?

    很多SEO优化人员在PC端的优化排名技巧上很厉害,但是一到移动端上就凉了,就比如简单的PC端内容转跳到移动端上面等等。从大数据分析来看,目前中国的手机用户已达数亿,有超过五分之二的移动端用户都有利用手机访问…

    2022年6月2日
    0244
  • 页面优化的重要元素之Keywords与Description标签优化。

    Keywords:定义页面关键词的字段,此部分只存在于源代码中,不呈现给用户,尽量不要超过15个汉字。其内容不影响搜索引擎排名。 例: <meta name=\"Keywords\" content=\"seo培训,seo优化,seo教程,seo,…

    2022年3月12日
    0211
  • seo进阶教程:如何分析竞争对手网站?

    seo进阶教程:如何分析竞争对手网站? 以竞争对手网站的数据,来核定自己网站的优化方向,是seo进阶教程。我们做seo,就要做数据化的seo,做科学的seo。将竞争对手网站做seo数据分析,才能核定我们网站做到相应位置…

    2022年6月3日
    0294

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息