长治SEO浅谈网页反作弊技术思路与方法。

长治SEO浅谈网页反作弊技术思路与方法。

长治SEO浅谈网页反作弊技术思路与方法

一、网页反作弊出现背景

出于商业利益的驱使,很多网站站长会针对搜索引擎排名进行分析,并采取一些手段来提升排名。这种行为本身无可厚非,很多优化行为都是符合搜索引擎排序规则的,但与此同时也存在很多恶意的优化行为。所以网页反作弊,也是目前所有商业搜索引擎需要解决的重要难点。

快排科技(vx:seokuaipai)孔宇今天来谈一下目前一些常见的互联网网页作弊方法、反作弊的整体思路,以及引申出的淘宝搜索反作弊机制与传统网页搜索反作弊的异同。

网页反作弊

二、网页作弊类型内容作弊:

从大的分类来说,主要的作弊方法包括:内容作弊、链接作弊、隐藏作弊及近几年兴起的web2.0作弊方法。笔者认为,内容作弊与现阶段业务息息相关,因此会在本文着重讲下此类型及相关的反作弊思路。

内容作弊的目的是通过精心更改或者调控网页内容,使得网页在搜索引擎排名中获得与其网页不相称的高排名。常见的作弊方式包括:关键词重复、无关查询词作弊、图片alt标签文本作弊、网页标题作弊、网页重要标签作弊及网页元信息作弊。通过这几种常见的作弊手段,作弊者的作弊意图不外乎以下几种:

1、增加目标作弊词词频来影响排名;

2、增加主题无关内容或者热门查询吸引流量;3、关键位置插入目标作弊词影响排名。

Google在2011年2月高调宣布针对低质量网页内容调整排序算法,据报道此算法影响了大约11.8%的网页排名,而这项调整措施是专门针对以Demand Media(创建于2006年5月,雇员500人,它的业务比较庞杂,包括域名注册、内容广告交易等。它的一个主要业务是,它有包括65个社会化媒体组成的网站群。)网站为代表的内容农场作弊手法的。

内容农场的运营者廉价雇佣大量自由职业者,支持他们付费写作,但内容普遍质量低下,很多文章都是通过复制黏贴完成。但重点是,他们会研究搜索引擎的热门搜索词等,并有机的将这些词汇添加到写作内容当中去。这样,普通搜索引擎用户在搜索时,会被吸引进内容农场网站,通过大量低质量内容吸引流量,内容农场可以赚取广告费用。

与传统的作弊方法相比,内容农场不采用机器拼接内容等机械方式,而是通过雇佣人员写作,这种作弊方式搜索引擎往往难以给出是否作弊的明确界定,但又严重影响搜索结果质量,所以是一种很难处理的作弊手法。

反作弊技术

三、网页反作弊技术的整体思路:

目前搜索引擎作弊手段五花八门且层出不穷,作为应对方的搜索引擎,也相应调整技术思路,所以如果整理一下反作弊思路,则会发现技术方法很多,理清思路着实不易。尽管如此,如果对大多数反作弊思路深入分析,会发现整体思路上还是有规律可循。从基本思路角度看,可以将反作弊手段大致划分为以下3种:信任传播模型、不信任传播模型和异常发现模型。

1、信任传播模型:在海量的网页数据中,通过一定的技术手段或人工半人工手段,从中筛选出部分完全值得信任的页面(可以理解为我们日常所说的白名单),算法以这些白名单内的页面作为出发点,赋予白名单内页面节点较高的信任度分值,其他页面是否作弊,要根据其与白名单内节点链接关系来确定。白名单内节点通过链接关系将信任度分值向外扩散传播,如果某个节点最后得到的信任度分值高于一定的值,则认为没有问题,如果低于这个值则会被判为作弊。

2、不信任传播模型:从大的技术框架来讲,与信任传播模型极其相似。最大的区别在于:初始页面自己不是值得信任的页面节点,而是确认存在作弊行为的页面集合(即我们日常所说的黑名单)。赋予黑名单内页面节点不信任分值,通过链接将这种不信任关系传播出去,如果最后页面节点的不信任分值大于设定的那个值,则被判为作弊。

3、而异常发现模型:简单的譬如分析网页内容来发现词频、链接等的异常,复杂点的像分析网站用户行为异常等。异常发现模型往往和信任传播模型和不信任传播模型进行组合处理。

事实上,纯粹技术手段目前是无法彻底解决作弊的问题,因此现在一般都是用户在浏览搜索结果甚至是上网浏览时举报作弊网页,搜索引擎公司内部会有专门的团队来审核与主动发现可疑页面,经过审核确认的网页则可以放入黑名单或者白名单当中。综上所述,必须将人工手段与技术手段相互结合,才能取得较好的反作弊效果。

四、通用链接反作弊方法:

链接反作弊方法

1、TrustRank 算法 (属于信任传播模型)

2、BadRank 算法(属于不信任传播模型,据传是Google采用的反链接作弊算法。 注意:不要链接给作弊页面)3、SpamRank (属于异常发现模型)SpamRank 的基本假设是:

3.1、对于正常页面来说,其支持者页面的 PangRank 值应该满足 Power-Law 分布,即 PR值有大有小。

3.2、作弊网页不同,一般具有如下3个特点:

Ⅰ、支持者页面数量非常巨大

Ⅱ、支持者页面的 PangRank 值得分都较低

Ⅲ、支持者页面的 PangRank 值都落在一个较小浮动范围内专用链接反作弊技术五、专用链接反作弊技术:

1、识别链接农场:

、网页出链的统计分布规则,作弊网页出链不符合 Power-Law 分布Ⅱ、网页入链的统计分布规则,作弊网页入链不符合 Power-Law 分布Ⅲ、URL名称统计特征,作弊网页的网址较长,包含更多的点画线和数字等Ⅳ、很多作弊网页的URL地址尽管不同,但是对应同一个IP地址Ⅴ、网页特征会随时间变化,比如入链的增长率、出链的增长率等Ⅵ、链接农场的结构特征,农场内的网页之间链接关系非常密切2、识别 Google 轰炸:

判断锚文字是否和被指向页面有语义关系

识别内容作弊

六、识别内容作弊:

1、重复出现关键词,判断文本内一定大小的窗口中是否连续出现同一个关键词2、标题关键词作弊3、统计正常页面中句子长度的规律、停用词的分布规律、词性的分布规律等反隐藏作弊七、反隐藏作弊:

常见的隐藏作弊方式包括页面隐藏和网页重定向。

1、识别页面隐藏

对网页做2次抓取,第1次数正常的搜索引擎爬虫抓取,第2次模拟人工访问网页的方式抓取。这种方法成本非常高。

2、识别网页重定向

Strider 系统给出了根据网页重定向来识别到底哪些是作弊网页的解决方案。

八:石榴算法简介:

2013年5月17日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法”。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面。百度称此举是为了尊重搜索的用户,净化互联网生态环境!

石榴算法简介

发布时间:2013年5月17日

打击对象:针对大量妨碍用户正常浏览的恶劣广告的页面、低质量内容页面。石榴算法针对的尤其以弹出大量低质弹窗广告、混淆页面主体内容的垃圾广告页面为代表。与之前百度绿萝算法相对应,这正是百度搜索引擎提高用户体验,提高搜索质量的有力手段。2013年5月17日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法”。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面。百度称此举是为了尊重搜索的用户,净化互联网生态环境!

整改建议:有弹窗广告?且在主体内容位置显示?赶紧撤掉吧、短期利益是获得了、长期就不讨好了、就如一次借钱忘了还、感觉像是赚到了、实则不然、你的信誉度在他人心中逐渐在减弱……这类型的页面评分也会被降分

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/82060.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
优化家优化家订阅用户
上一篇 2022年9月7日 00:37
下一篇 2022年9月7日 00:37

相关推荐

  • 如何提高网站点展比、点击量。

    Seo策略中,一般我们做排名的,不仅仅只是为了做排名,还需要考虑到点展现比与转化率。什么是点展比:网站点击量:网站展现量=点展比,可以说是没有点击量的SEO都是耍流氓。即使你写的文章再好,页面做到再符合客户…

    2022年8月22日
    0143
  • 常见的互联网问答营销渠道有哪些。

    口碑营销就是问答营销吗?不是的。问答营销只是口碑营销的一种形式,而口碑营销范围更广!今天先跟大家讲讲企业如何选择合适的问答营销渠道呢?一个企业如何选择合适的问答营销渠道呢?那么,最核心的有两个点:一个是…

    2023年2月23日
    07
  • SEO网络推广。

    什么是SEO网络推广?是很大一部分刚进入SEO行业的时候最头痛的事情,于是就会到淘宝去购买各种教程进行学习,在学习的途中发现购买的教程都是过时的了,于是问题就来了:什么是SEO网络推广,在了解什么是SEO网络推广…

    2022年7月1日 SEO操作
    0110
  • 网站权重和网站排名有关联吗。

    第一,为了保证搜索结果逐渐增加,我们还要继续在大网站投稿。这样做是最快的。 第二,为了防止后期竞争对手的截流有必要做一个长期打算,我们需要做一个自己的网站。这个网站就是与关键词对应的网站。最好选择博客…

    2022年8月20日
    0117
  • 百度手机搜索排名低于电脑搜索排名。

     原因很简单。同样的话,你的网站对个人电脑的结果更为重要,所以在主页和手机上有很多更好的页面,所以它就落后了。你认为个人电脑和手机的排名必须一致吗?那很多网站都不做移动终端,移动浏览体验特别差怎…

    2022年9月5日
    0109
  • 石狮SEO谈企业整站优化的标准流程。

    石狮SEO公司与您分享企业整站优化的标准流程。 网站方案策划 这一步也是整站优化中重要的一步!常言道设计构思管理决策发展前景,因而在做一切事情之前,大家都理应有一个总体规划策划方案,有利于日常任务的一切正…

    2022年9月7日
    084
  • 网站在SEO优化的过程中如何避免被K站。

    很多做SEO优化的朋友,对于网站是很敏感的。SEO不能只做表面的工作,每天更新内容,做外链,交换友情链接,但事实上,SEO不仅仅是这些内容,比如网站改版,域名更改,301重定向,robots文件,404页面设置,图片优化…

    2023年2月22日
    00
  • 什么样的内容是搜索引擎需要的?满足用户需求且有使用价值的内容。

    由于网站优化的概念已经为企业所熟知,因此企业开展了网站优化工作。对于优化工作,主要任务是做内容。只有丰富的网站内容才是优化排名的主要条件,但并非所有内容都能实现。搜索引擎只对供应不足的内容感兴趣,而…

    2023年2月17日
    01

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息