| 您现在的位置:中国IDC圈 >> SEO(搜索优化) |
网络蜘蛛:深度优先还是广度优先 |
|
根据以上2个表格 我们可以得出以下结论: 图1:路径1 ==> A ——> B ——> E ——> H 路径2 ==> A ——> B ——> E ——> i 路径3 ==> A ——> C 路径4 ==> A ——> D ——> F ——> K ——> L 路径5 ==> A ——> D ——> G ——> K ——> L 经过优化后 图2: (图片已经帮大家标上方向了!) 路径1 ==> A ——> B ——> E ——> H 路径2 ==> i 路径3 ==> C 路径4 ==> D ——> F ——> K ——> L 路径5 ==> G 深度爬行的优点是:网络蜘蛛程序在设计的时候相对比较容易些把 其他我也没发觉有什么优点…… 还有就是 蜘蛛的这种 "勇往直前"的精神 值得学习下! ^_^ 深度爬行的缺点是:缺点么多了一点点 呵呵! 每次爬行一层总要向"蜘蛛老家" 数据库访问一下。问问老总有必要还要爬下一层吗! 爬一层 问一次…… 引用一句高人的话 如果一个蜘蛛不管3721不断往下爬 很可能迷路更有可能爬到国外的网站去…… 本来目标是中文网站 因为IP的问题 国外IP做了中文站的话…… 就容易去别人"老家"了……这样不仅增加了系统数据的复杂度更是增加的服务器的负担 我想没有一家搜索公司会愿意则样的把,……除非脑子"秀"了 …… ^_^ 接下来 我们介绍下普遍使用的 广度优先策略 大家休息下 喝杯咖啡 看的也累把 我写的也累…… ^^ 广度优先在这里的定义就是层爬行。什么叫蜘蛛层爬行?就是一层一层的爬行 按照层的分布与布局 去索引处理与抓取网页! 当然SE不会派一个蜘蛛去的 每层会派一个或多个蜘蛛Spider去抓取内容! (下面这张就是 广度优先策略图(层爬行图) |
|
【责任编辑:junlee】
|
|
文章评论
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|