霜天部落 | 关注LAMP高性能、高并发架构的设计与研究

SEO优化中网站收录率对一个网站的影响

在我们面临搜索引擎收录的问题上经常大家经常会遇到觉得自己的网站收录内容太少,总觉得好像我的网站应该收录很多才对,然后会四处到处找答案,那么什么是一 个网站的收录率?其实对于这个问题很容易理解,收录率也就是搜索引擎对一个网站中所收录的数量来除以整个网站所公开的网页数量,那么就能够得到一个网站的 收录率,当然不管是一个企业站、个人站还是一个行业站点或者是门户网站都应该对网站内容的收录率引起高度重视,没有收录谈何排名?

经常有些朋友在问自己网站收录为什么那么少的时候,那么你有考虑过你的网站整体到底有多少页面?如果你自己本来网站的页面就不多,而且质量也不好,那么收录基本上很困难。当然我们经常看见有些网站收录率也是很不错的,我曾经有一个站点收录率做到了90%以上,但是经常有时候遇到的朋友收录率都在5%以上,算是很不理想的一个数据了。

那么如何知道自己网站的数据和收录的数据?

知道自己网站有多少数据其实方式方法很简单,当然常规来说都只能够知道一个大概的数据,下面是几种大家能够用的上的了解自己网站数据的一个方法。

1、根据网站后台所统计出来的数据分析,一般来说我们不仅要统计网站所有内容页面的数据,还有栏目页面的数据当然在栏目页面里面又要增加一个分页的数据,内容页 面当然也有不过栏目页面是必须要用到的,一般网站后台都会有网站内容页面的一个数据,那么其他的页面基本上就要用估算的了,当然如果你网站中内容页面的数 据有上万,那么只要搜索引擎中收录你的数据能够在万以上,那么来说也是相当理想的了。

2、就是根据网站前台中所有的栏目来做统计,将每一个栏目做好分类,然后对每一个栏目下都会有很多分页,那么先计算出每一个分页有多少数据,然后再乘以页数在加上页数基本也是比较准确的,当然不排除出现动态URL所导致的内容页面重复。

3、使用特别的蜘蛛程序,你能够在你的网站上释放自己的蜘蛛程序。特别的蜘蛛程序,例如免费的XENU(http://home.snafu.de/tilman/xenulink.html),是专门用来在站点上找网页的,可以得到网页的计数结果。和一个公司搜索引擎一样,阻挡互联网搜索蜘蛛的障碍同样也会阻挡这些特别的蜘蛛程序。

4、当然前面说到的方法都是针对于大型的一些网站,如果是小网站就不用那么麻烦了,基本上几分钟就能够了解到自己的网站大概有多少内容,现在收录了多少内容。不 过针对于大型网站方式方法还是有很多的,比如说谷歌的管理员工具就是一个很不错的工具,能够通过你所提交的生成好的网站地图进行统计,效果也是很不错。

要想清楚的知道网站内容在搜索引擎中的收录结果其实很容易,如果针对某个搜索引擎来搜的话,那么可以采用site:xxx.com网站内容,当然不一定要搜索不要www的,常规来说不带www的网站内容更容易看出整个网站内容的收录结果,因为很多大型网站下面都会存在很多二级的域名,所以能够通过域名直接查询出整个网站的收录结果,当然也可以加上www。而现在网上做SEO的都很清楚,大部分都是采用工具来搜索,这样子大大的节约的时间,能够同时搜索出谷歌、百度、雅虎、搜搜、搜狗等的结果所以也是很方便的,常用的有站长工具箱或者直接去站长网站查询。

走出收录率的误区,经常大家会提到就是收录率多少为好,其实收录率肯定是越大越好,当然还要针对某种情况来确定,如果遇到收录率很好,那么你就要注意下面几个问题了,看是否是因为下面的因素所导致:

1、网站采用动态的页面,大量出现重复内容或者是页面。

2、网站被人入侵或者是修改,在该程序下面放置了一个恶意的程序,导致收录急速上升。

3、网站中的安全出现故障,导致网站中的隐蔽内容被搜索引擎抓取放出,在安全问题上面要注意经常去检查是否存在不用登陆都能够查看的页面,搜索引擎其实也是一个浏览者,用户无法进入的页面,搜索引擎也是同样无法登陆。

4、虽然眼看收录了很多,但是却发现有价值的内容很少,大量的收录了一个网站的垃圾页面或者是无任何价值的页面,那么搜索引擎同样会给予计算权重,那么对于垃圾的页面,我们要学会采用ROBOTS进行屏蔽,不仅要保证所收录页面的数量,也要保证所收录页面的质量。

当然大家在对于一个网站的时候经常会遇到收录率很低的情况,那么收录低网站的权重也就不会高,这是有连带关系的,那么我们都清楚这一点,那么应该很多朋友都很清楚收录的重要性,但是到底是哪些因素导致了一个网站的收录?

1、网站采用转载或者是采集

2、内容更新频率有误差,三天两头的更新,不能够坚持。

3、网站长时间无人管理。

4、网站中内容质量差(内容的排版、字数、图文搭配等等)

5、网站太过于注重优化,在内容优化上面有优化过度的情况。

6、网站采用的是黑帽技术。

7、网站被攻击或者是被挂木马与黑链。

8、网站首页布局中无动态数据口。

9、IDC运营商服务器速度与稳定性差。

10、网站中没有网站地图

11、网站大量使用图片与FLASH、JS框架调用

12、网站内容页面垃圾代码过多可读内容太少。

13、网站中网站的大小过度,没有适当做好网站减肥。

14、无意被使用的ROBOTS的错误设置或者是屏蔽。

15、网站中页面所使用的标题无任何修改,所有页面都采用同样的标题。

16、URL地址层次超过3级,搜索引擎蜘蛛爬去困难。

17、URL采用大量动态元素,URL地址太长。

18、网站经常改变或者是做布局上的调整

19、网站域名过去存在被K或者是被惩罚的域名。

20、网站中整站的标题经常发生改变。

21、网站中外部链接过少,蜘蛛很小对网站进行爬去。

22、大部分的导出链接被加上Nofollow属性。

23、网站中存在死链接或者是错误链接

24、网站导出中存在搜索引擎长期不更新或者是被惩罚的链接地址。

25、网站中存在修改URL地址的迹象导致搜索引擎发生错误。

26、大量的友情链接导出到了链接工厂。

27、网站404页面采用了直接跳转至首页

28、网站建好时间不长,需要慢慢培养

初步总结了这么多,大家可以好好的检查一下,比较理想的网站收录率是在50%以上,如果低于百分之50%那么你就要注意一点应该开始引起重视,因为做SEO是一个长期的过程,出现问题到被惩罚还是有一段过程的,不过要学会在这个过程当中发现问题,解决问题,将损失降低到最低。

转自:http://www.chengduseo.org/seo-jishu/136/