2013-07-24 624
网站内容重复,是百度K站的一个主要原因,但是也有一些人并不知道什么情况才算网站内容重复,也不知道如何解决网站内容重复的问题。笔者认为网站内容重复不单单是指网站本身出现了两篇或者多篇一样的文章,还包括很多方面,本文就几个常见的情况进行介绍,有不足的地方欢迎指出。
一、网站内容重复的情况:
1、同样一篇文章出现多个URL,即使这篇文章属于原创,也会被百度给予惩罚。
2、网站内容多为采集,这种网站内容重复会被当做采集站直接被百度处理掉,百度新的绿萝算法就是专门打击采集站点的。
3、网站的固定版块出现次数太多,很多网站的右侧总是固定放一些版块或栏目,这些栏目的内容从来不进行更新,或者各个页面的右侧都是前篇一律的内容,就会造成页面重复度高。
4、未设置404错误页面,当我们删除某一个页面的时候,一定要用404状态码给予用户和蜘蛛一定的提示,如果代码设置错误,那么删除的页面在蜘蛛那里是假想存在的,由此一来就会多次收录。
5、动态页面和静态并存,百度爬去目录时收录了大量动态页面。
6、网站内容以图片为主,文字很少,很多图片都是共用一个URL地址,这样一来蜘蛛在索引的时候很难保证不被重复收录。
重复内容是指不同的URL链接内容却是相同的,同时收录多个重复页面,设置多个页面进行介绍,但是网页的大体内容是相同的,这样处理的方法是错误的。
二、重复内容的检测方法
1、对于检测一篇文章是否重复内容,title:+文章标题可找出相同的文章。
2、从文中摘取一段话,在百度搜一下,出现大量红字,表明这篇文章的重复度高。
3、站内搜索,可以找到出现多次的内容。
4、利用一些页面相似度检查工具,判断一些相邻页面的相似度,80%以上相似度就需要对一些固定栏目进行处理。
三、如何消除重复内容
1、原创内容的增加
对于网站内容多为采集或简单伪原创的网站,企赢001建议增加原创文章的内容,宁可百度收录少一些,也不要让百度把之前收录的文章吐出来。
2、网站固定栏目内容随机展示
可以根据正文的关键词,随机调用右侧栏目的文章内容,让每一个页面都有不一样的内容,避免大量页面相似度高的情况出现。
3、设置404页面
告知用户和搜索引擎某些页面不存在了,防止搜索引擎收录大量死链。
4、页面设置独立的Meta标签
关键词、标签、描述,每一个页面都需要不同,可以采用手动修改,或者根据一定的规则设置。
更多的方法,请跟帖与作者进行交流,共同提高!
三句话浓缩人生
生活百科 2024-05-20
纯净生活—招商臻和璟园
生活百科 2024-05-28
再别东南,无问西东
生活百科 2024-06-21
不负青春,不负梦想,热烈祝贺儿子上岸东南!
生活百科 2021-04-14
研路兜兜转转,兜兜转转研路
生活百科 2021-06-22
感恩吉大,不说再见!
生活百科 2021-09-16
不负青春,不负汗水,吉林大学,我来了!
生活百科 2017-07-20
一图看懂高考平行志愿
生活百科 2018-08-02
你好!江苏省海安高级中学!
生活百科 2014-07-01
究竟哪里才是孩子们的起跑线
生活百科 2021-05-01
软件v2rayN入门教程
电脑应用 2022-02-28
家庭常用电线平方数与功率对照表
生活百科 2020-10-30
可孚红外线体温计KF-HW-001说明书
生活百科 2020-06-28
几款可以检测电脑配置的软件
电脑应用 2023-02-07
PE装机工具推荐—FirPE
资源中心 2019-12-08
热水器回水泵(循环泵)的安装图文教程
生活百科 2018-07-17
关于“菜鸟之家”网站
资源中心 2012-03-20
东南大学硕士研究生招生常用网址整理
生活百科 2025-03-08
西蒙电气开关接线详解
生活百科 2019-02-22
心电监护仪怎么看数据
生活百科 2023-08-22
扫码二维码
获取最新动态
