seo中网站镜像有什么影响。

网站镜像是什么?如何判断?

zndixuDpjH_small.jpg

镜像网站指的是别人将你的网站数据进行的同步,网站的界面及内容基本上都和你的网站保持一致,如果不是两个网站的主域不同站长自己都会认为是一个网站,两个网站之间就像镜子成像一样因此称为镜像网站。

网站被恶意镜像后有哪些危害?

那么到底什么是镜像呢?恶意镜像又被称为恶意解析,也被称作为恶意克隆。一般是别人用一些特殊的技术手段将我们的网站完全复制一个出来。除了域名不同,网站的内容完全和我们的网站相同。这些镜像网站的工作原理一般是当用户访问镜像的网站的时候,这个网站的程序就会自动来原网站来调取数据,然后修改相关的链接之后展现给用户,这种实际上系统资源还是利用的原来的站点的。这样用户和搜索引擎无法分辨哪个是真正的站点,哪个是镜像出来的站点。所以就会有可能导致正版网站有可能被搜索引擎停止收录,甚至删除已经被收录过的页面。并且,如果他的这个域名有不健康的内容那么有可能我们的站点也会受到相应的污染,严重者会被拦截报毒或者 K 站的情况。

那么我们应该怎么处理网站镜像呢?

1.通过屏蔽 IP 来防护网站被镜像

我们知道网站镜像的原理就是别人采集复制我们的网站,或者直接解析我们的网站内容进行展现,所以我们只需要屏蔽掉对方网站主机的 IP 即可。下面就以 wordpress 程序为例,其他程序的请自己测试。

我们首先要获取对方服务器的 IP,这个 IP 有可能是对方域名所绑定的 IP,也有可能不是,这个我们可以通过网站日志查看下哪些 IP 访问异常。如果对方是解析我们网站的话,我们可以通过下面的方法来获取对方的 IP。首先复制下面的代码,新建一个 php 文件,然后命名成“ip.php”上传到你的网站根目录。

<?php$file = "ip.txt"; //保存的文件名$ip = $_SERVER['REMOTE_ADDR'];$handle = fopen($file, 'a'😉;fwrite($handle, "IP Address:"😉;fwrite($handle, "$ip"😉;fwrite($handle, "
"😉;fclose($handele);?>

然后访问镜像了你网站的站点,在地址后面加上…/ip.php 这段代码,然后你的网站根目录会出现 ip.txt 文件,我们打开这个文件之后就会看到一个 IP 地址。IP 获取之后我们就需要屏蔽对方的 IP,以 wordpress 为例,我们找到网站的根目录的.htaccess 文件。我们编辑下这个文件,我们添加如下的代码(代码里的 IP 修改成我们从 ip.txt 里面复制的 IP):

#添加 IP 黑名单Order Deny,AllowDeny from 162.158.72.179

如果你的网站采用的 CDN 加速的话,我们可以直接在 CDN 后台添加 IP 黑名单。此时如果你刷新下镜像的网站,如果对方网站是 403 报错的话,就说明我们已经处理完毕了,剩下的就交给蜘蛛来处理了。

2.通过 js 来防护网站被镜像

在网站的头部(也被称作为页眉或者 head)

<head></head>

标签里面添加以下代码:

<script type="text/javascript">if (document.location.host != "www.seokuaipai.cn"😉 {location.href = location.href.replace(document.location.host,'www.seokuaipai.cn'😉;}</script>

或者加上以下 js 代码

<script type="text/javascript">rthost = window.location.host;if (rthost != "www.seokuaipai.cn"😉 {top.location.href = "https://www.seokuaipai.cn";}</script>

需要注意的是,代码中的 www.seokuaipai.cn 域名要换成你的主域名,如果填写错误的话,会导致网站一直在刷新的状态。但是这个也是有缺点的,如果对方的镜像网站屏蔽了 js 的话这个方法是不能用的,所以方法 1 和方法 2 结合使用效果更佳。

3.如果对方屏蔽了 js,应该如何防止被镜像?

找到网站的页眉,也就是 header.php 文件,我们编辑这个文件添加如下代码:

<div style="display:none;"><script>proxy2016 = false;</script><img src="" onerror='setTimeout(function(){if(typeof(proxy2016)=="undefined"😉{window.location.host="www.seokuaipai.cn";}},3000);'></div>

有些网站是屏蔽 js 代码比如下面的这个:

<script>…</script>

所以

<script>proxy2016 = false;</script>

代码将被过滤掉,img 的 onerror 设置超时时间 3000 毫秒,将运行函数部分,检测是否还存在 proxy2016 字符,如果没有找到就会将主机的 URL 改为 www.seokuaipai.cn;为了安全起见,将 js 部分可以使用 js 代码混淆,可以使用站长工具进行代码混淆《代码混淆工具》比如本站的混淆结果如下:

<div style="display:none;"><script>proxy2016 = false;</script><img src=" " onerror='setTimeout(function(){if(typeof(proxy2016)=="x75x6ex64x65x66x69x6ex65x64"😉{window["x6cx6fx63x61x74x69x6fx6e"]["x68x6fx73x74"]="x77x77x77x2ex35x69x7ax7ax2ex63x6fx6d";}},3000);'></div>

经过测试,这代码在 Chrome、IE11、360 极速浏览器上都有效,并且会跳转到原来网站的文章页,如果需要火狐浏览器生效的话需要将代码里面的 img 标签的 src 地址修改成空或者无效图片地址就可以了。

4.借助 img 的 Onerror 事件来进行跳转防止镜像

此方法就是通过拆分域名与镜像站对比,然后用 img 标签 src 空值触发 onerror 来执行 js 比对,比对失败则跳转回源站。

①、WordPress 专用版

具体的代码如下,需要复制到 functions.php 最后一个?>之前:

add_action('wp_footer','lxtx_deny_mirrored_websites'😉;function lxtx_deny_mirrored_websites(){ $currentDomain = 'www" + ".5izz." + "com'; // $currentDomain = '"zhangge." + "net"'; echo '<img style="display:none" src=" " onerror='this.onerror=null;var str1="'.$currentDomain.'";str2="docu"+"ment.loca"+"tion.host";str3=eval(str2);if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ){ do_action = "loca" + "tion." + "href = loca" + "tion.href" + ".rep" + "lace(docu" +"ment"+".loca"+"tion.ho"+"st," + ""' . $currentDomain .'"" + "😉";eval(do_action) }' />';}

Ps:如果是丢到 wp_head,经过测试发现图片放到 head,浏览器会自动进行错误调整,导致一些本来在 head 的元素被丢到了 body 当中,比如 style.css,估计网页标准中 head 里面就不应该放置图片,所以移到了 footer 当中。

或者这段代码

add_action('wp_footer','lxtx_deny_mirrored_websites'😉;function lxtx_deny_mirrored_websites(){ $currentDomain = "www' + '.5izz.' + 'com"; // $currentDomain = "zhangge' + '.' + 'net"; echo '<img style="display:none" src="nothing" onerror="this.onerror=null;var str1=''.$currentDomain.'';str2='docu'+'ment.loca'+'tion.host';str3=eval(str2);if( str1!=str3 ){ do_action = 'loca' + 'tion.' + 'href = loca' + 'tion.href' + '.rep' + 'lace(docu' +'ment'+'.loca'+'tion.ho'+'st,' + '\\'' . $currentDomain .'\\'' + '😉';eval(do_action) }" />';}

或者这段代码

add_action('wp_footer','lxtx_kimsom_reverse_proxy_defense', 99);function lxtx_kimsom_reverse_proxy_defense(){ $currentDomain = '"www." + "5izz" + ".com"'; echo '<img id="inlojv-rpd" style="display: none;" src="nothing" data-url="'.home_url().'" />';}

②、HTML 通用版

既然是利用 js 代码,那么就能用到如何 html 页面当中了。要不是为了可以放到 wp 的 functions.php,都没必要写成 php 的模式,直接用 html 代码即可:

<img style="display:none" src=" " onerror='this.onerror=null;var currentDomain="www." + "ilxtx" + ".com"; var str1=currentDomain; str2="docu"+"ment.loca"+"tion.host"; str3=eval(str2) ;if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ){ do_action = "loca" + "tion." + "href = loca" + "tion.href" + ".rep" + "lace(docu" +"ment"+".loca"+"tion.ho"+"st," + "currentDomain" + "😉";eval(do_action) }' />

将以上代码中的: var currentDomain="www." + "5izz" + ".com"; 自行拆分成自己的域名,避免被镜像代码替换掉,比如: var currentDomain="jszseo." + "com";

然后将代码添加到网站的之后即可(不建议放置到里面,具体原因上文已说明),这个版本适合任何网页。

5:通过禁止某些 User Agent 特征来防止镜像

①、php 通用版:

把下面的代码放在 index.php 中的第一个 如果使用上面的 php 版本,WordPress 每次更新就会需要操作 index.php,比较麻烦,因此弄个专版。

将下面的代码贴到 functions.php 中的最后一个?>之前即可:

add_action('wp_head', 'lxtx_deny_mirrored_request', 0);function lxtx_deny_mirrored_request(){$ua = $_SERVER['HTTP_USER_AGENT'];$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP'😉; if(!$ua) {header("Content-type: text/html; charset=utf-8"😉;wp_die('请勿采集本站,否则会娶不到老婆喝凉水都塞牙!请正常访问,并认准【快排科技】官方网址!'😉;}else{ foreach($now_ua as $value ) if(eregi($value,$ua)) { header("Content-type: text/html; charset=utf-8"😉; wp_die('请勿采集本站,否则会娶不到老婆喝凉水都塞牙!请正常访问,并认准【快排科技】官方网址!'😉; }}}

经过测试,在 functions.php 中加入此代码后,打开镜像站后显示“Internal Server Error”,强制刷新后显示我们设置好的提示文字“请勿采集本站,否则会娶不到老婆喝凉水都塞牙!

本文来自投稿,不代表科技代码立场,如若转载,请注明出处https://www.cwhello.com/82038.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(1)
上一篇 2022年9月7日 00:37
下一篇 2022年9月7日 00:37

相关推荐

  • SEO网站内部优化的几个注意事项。

    网站想提高排名,苦练内力是必须的,因为SEO是个系统工程,不是一蹴而就的,需要大量的积累和尝试。网址内部优化主要有以下几方面:1、站内的链接结构尽量改变原来的图像链接和flash链接,使 用纯文本链接,并定...

    2022年8月20日
    0121
  • 网络优化重点是站内还是站外。

     网站优化到底是站内重要还是站外推广重要?很多人都问过这个问题,渐渐的也发现外链的价值越来越小,是不是应该抛弃外链这一块了?当关键词排名一直在百度前页的时候,外链不管怎么发布而排名却没有半点提高,...

    2022年8月22日
    0105
  • 网站如何被收录 百度收录技巧有哪些

    网站如何被收录?相信这个问题是很多人自从进入站长圈这一个行业就开始在你的心中徘徊了,那么百度收录技巧有哪些呢?下面给大家介绍一下相关的内容,希望能帮到大家。 网站如何被收录 一、百度网站提交收录入口 每...

    2022年5月21日
    0610
  • 做一个新网站前期在SEO布局上要注意哪些因素。

    做一个新网站前期在SEO布局上要注意哪些因素?针对网站的SEO切入点在哪里?耗费精神去想一个新站在前期运营的时候SEO方面要做那些准备和具体做那些事儿,肯定有站长朋友有这方面的疑问,小编花费了一点时间重新整...

    2022年8月22日
    0107
  • seo外包:是什么原因导致site首页不在第一位。

    通常,如果某个网站的首页快照不是搜索引擎找到的第一位,那么这个网站的主页首页权重值低于其他页面权重值。这就导致导致其他权重值高的页面排名高于首页排名。很多站长会想为什么网站没有排在第一位,怎么样找...

    2022年8月24日
    072
  • SEO优化要怎么做关键词排名呢。

    目前,企业做SEO优化的方式和策略都变得越来越多,但很多企业SEO优化都很难在百度中获得更多的权重和排名,从而让企业逐渐失去做SEO优化推广的耐心,那么SEO优化要怎么做关键词排名呢? 怎么做好网站营销呢?这3个...

    2022年8月25日
    0100
  • 纵观seo如何解决网站被镜像、负面新闻等棘手问题。

    对于一个SEO大师来说,很多时候,并不在于营销策略有多细致,算法理解有多深刻,更多的时候,他是在应对来自竞争对手的负面影响。 在很长一段时间内,以下三种问题,一直制约着中小企业SEO项目的顺利进行,对于SE...

    2023年2月18日
    00
  • seo优化方案及费用预算是如何来做的。

    SEO优化工作涉及到了很多方面的内容,如果我们真的是想要让自己的网站排名提前,肯定也是要做好多方面的确认工作才行,这样也是可以有所保障的。一般大企业可能都是没有自己的SEO优化工作人员,那么找到适合的一...

    2022年8月24日
    0109

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息