很多朋友都说自己的网站快照不更新,或者滞后好几天,个人觉得也是蜘蛛抓取的频率不够造成的。要想快照更新快,特别是新站,前期一定要多做内容建设,内容页面如果没有内容的更新,一般蜘蛛可能不会抓取收录,或者抓取了但是不返回数据,当下次用户搜索时候可能就会调用搜索引擎数据库中存储的一些数据。
搜索引擎蜘蛛的爬取频率很多时候是由网站内容质量决定的,因为只有网站有更新鲜更好的内容,才能更吸引蜘蛛来反复抓取,例如很多大型的内容型网站,每天更新大量的内容,这样就把蜘蛛一直留在了站内,页面抓取的频率自然会提高。而提升了爬取频率,对于页面中内容和链接的更新就会被搜索引擎蜘蛛更快的抓取到,能够更充分的收录网站的页面内容信息。
分析搜索引擎蜘蛛首先会考虑的一个参数就是爬取量,一般我们考虑蜘蛛爬取量的单位是以一天为一个时间段,那么我们很多时候考虑的就是一天时间内的爬取率。当然,你也可以根据自己的需要调整时间段的限定,如划分到每个小时,来充分了解各个时间段的蜘蛛的抓取情况,然后针对性的做一些调整。其中我觉得一类分析可以给我们带来很多的成就感,即对于一些模糊经验理论的验证。
例如我们经常听到这样一句话:“做网站内容的时候要定时定量的更新,培养搜索引擎蜘蛛的抓取习惯,随意的改变更新时间,可能影响蜘蛛对网站内容的抓取”,这句话到底正确不正确呢?这里就可以运用网站的日志进行分析搜索引擎蜘蛛的抓取率来解释。具体的操作方法就是对一个月内每天每个小时段的蜘蛛抓取情况进行拆分统计(注意数据样本选取的合理性),然后对每个时间段进行分析,对比就可以发现哪个时间段搜索引擎蜘蛛来的比较勤,再和自己做内容更新的情况进行一个对比就可以很快的得出结论。
至于后面谈到搜索引擎蜘蛛的爬取深度,饱和度,优先爬取,冗余度以及爬取路径都是对于蜘蛛爬取习惯和爬取策略的研究,因为自己也没有针对性的去实践分析,所以只能在理论上谈谈自己的一些想法。
搜索引擎蜘蛛的爬取深度如果不够深,主要是因为网站在结构布局的时候没有考虑到这蜘蛛是否能够充分抓取或者是否按照一层一层的抓取,这里就涉及到链接入口的布局,也就会考虑到蜘蛛爬取优先的一些入口,很多时候对一些大的网站做诊断,来提升其流量和收录主要的策略布局就是优化蜘蛛抓取优先的入口,实现的方法就是采用nofollow标签屏蔽一些页面。还需要分析的可能是爬取的饱和度,因为对于单个页面的爬取太多是在浪费蜘蛛资源,我们如果能够适当的控制这些资源的分配,那么对于页面的抓取和收录的提升肯定有很大的帮助。
作者:幽 本文由http://www.0532crjy.com 整理 转载请注明出处!
做seo我们应该先深入的了解蜘蛛的工作
分享到:
-
50193
网站
- 11171
小程序
-
11825
文章
-
2
会员
热门网站
- 52PCGame论坛 bbs.52pcgame.net
- 飞华两性频道 sex.fh21.com.cn
- 69乐园 69leyuan.lofter.com
- 玛雅(MAYA)官方网站 maya.com.cn
- 阿里钱盾 qd.alibaba.com
- 云南省国家税务局网上办税服务厅 etax.yunnan.chinatax.gov.cn/zjgfdzswj/main/
- 上海贵族宝贝论坛 guizubibi.com
- 三众能源 sanzenenergy.com
- 读秀网 duxiu.com
- 9877小游戏 099y.com
最新入驻小程序
热门文章
- 如何解除百度提醒网站存在安全风险方法 07-26
- 百度产品运营到底要做什么 07-26
- 关于域名历史的查询和处理 07-26
- 农林副产品要如何进行网络营销销售 07-26
- Google网站管理员工具 07-26
- 网络产品和传统产品的区别 07-26
- 医院该如何打造品牌服务策略 07-26
- 阿里巴巴关键词排名优化最常见最有效的几种方法 07-26
- 百度竞价推广计划及思路 07-26
- 关于网络营销的五大阶段介绍 07-26