我生待明日,万事成蹉跎

搜索引擎原理——网页搜集

SEO首要工作是先了解用户还是搜索引擎?我认为是后者。SEO从某种意义上来说,最重要的就是对网页内容的优化 ,所以理解搜索引擎网页搜集的原理,我觉得对SEO工作是很重要的。
切入正题,网页搜集都是由搜索引擎主动进行的,那么它是咋个搜集的呢?
网页搜集一、定期收集:
顾名思义,就是每隔一个周期进行网页搜集,而且都是重新全部更新搜集一遍,这样做对搜索引擎而言虽然是最简单的方法,但就有两个很大的弊端:
1、耗时很长、耗资也大(所以Google有段时间都是每28天来一次)
2、无法同步更新(专业术语:时新性)
网页搜集二、增量搜集:
我觉得这应该是网页搜集的主流模式吧。主要有以下几种情况:
1、对新出现的网页搜集
2、对已经搜集了,但变化了的网页搜集
3、删除不存在了的网页
上面讲的这些网页搜集的原理都还比较浅显,比如还有主动向搜索引擎提交网页、真正系统是有多个蜘蛛共同爬行等,以后有机会会向大家讲到滴。

未经允许不得转载:徐宏涛博客 » 搜索引擎原理——网页搜集

分享到:更多 ()

评论 抢沙发

评论前必须登录!