第三届中国IDC产业年度大典(北京 2009年1月7日) 第二届大典回顾 第一届大典回顾

新闻资讯 国内 情报 法规  技术 CDN 机房 云计算  名录 电信运营商  企业应用 网站营销 SEO  访谈 供求 下载 搜索
通信 国际 分析 报告 活动  虚拟化 存储 绿色科技  机房 IDC服务商  网游 电子商务 视频 方案  专题 调查 论坛 测速
 
 您现在的位置:中国IDC圈 >> SEO(搜索优化)

搜索引擎如何判断核心内容的思考

来源:Seotest 时间:2008-1-29 作者:康轶文 保存本文 进入论坛 

  中国IDC圈1月29日报道:搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢?

  先说下Kyw认为的搜索引擎运作过程的前几个步骤:

  1. 蜘蛛下载A页面,送回服务器;

  2. 服务器寻找A页面的核心内容位置,然后去除HTML代码;

  3. 寻找网页核心内容;……

  我不确定GOOGLE、百度、YAHOO!是否真的有“判断核心内容”这个步骤,但我相信一定有类似的运算机制,因为如果没这个步骤,搜索引擎将耗费大量资源做重复运算。当然KYW不是搜索引擎工程师,下面只是对搜索引擎的一些思考。

  SE面对一整页HTML代码,如何判断核心内容在哪里呢?第一步:拿该页面和同域名、同目录、同文件名格式的页面做对比,去除相似的部分。经过这个步骤,头部的导航条、底部的版权信息、固定位置的广告就被去掉了。我估计搜索引擎在每增加一个新网站的时候,会建立一个对比模板来提高工作效率。如果网站经常改版,在改版刚开始的期间,搜索引擎还没反应过来,就可能造成新收录网页的排名不理想。

  第二步:去掉有大量链接的部分。经过这步,“相关文章”“推荐文章”等都被去掉了,剩下一些包含文字内容的代码。

  第三步:在剩余的代码中判断哪段标签(可能是DIV、TABLE、P或其它标签)中的文字内容最多,因为一般核心内容的文字量会比较多。

  每个页面经过上面3个步骤,应该就能顺利的判断出核心内容所在的位置。经过这样的思考,我们也许可以这样总结:

  1. 同目录下的页面,最好模板一样。

  2. 核心内容文字量不能太少,特别是企业站和B2C网站,只放价格和包含大量说明文字的图片是很不好的。

  3. HTML代码中如果错误很多,可能会影响排名,因为搜索引擎可能在判断核心内容的时候出差错。

  4. 期待你的补充 ^_^

  Kyw把SEO的主要工作理解成帮助搜索引擎更高效的理解网站及页面的内容,所以建议大家有事没事琢磨琢磨搜索引擎,问题想透的越多,SEO的手法也就更加随机应变了。当然也没必要钻牛角尖,有想不通的问题就到我这留言吧。

【责任编辑:junlee】

最新推荐  
 经济危机下 企业邮箱应用走俏
 亿恩联通GDC数据中心机房 打造国内最专业的
 美橙建站宝典系列:域名陷阱见招拆招(一)
 热烈祝贺五舟销售第一台Nehelam架构的服务器
 博鳌论坛聚焦互联网经济 电子商务逆势看好
 演绎“水泥+鼠标”新模式 建站基石先稳好
 世纪互联云计算正式商用 落地IDC行业
 第三届中国制造业CIO年会在京隆重召开
 防止网页木马  如何加强网站安全后盾
 高性价比服务器主板华硕P5BV-C-2L震撼上市
相关文章  
手段各有利弊 中小企业网络营销浅谈
搜索开放平台 对百度阿拉丁的深入解读
网站遇到瓶颈了吗 不同阶段各有特征
CEO和站长谨记 五种不可取的网站推广
29处细节 网站推广宣传途径集结号
搜索引擎最不喜欢哪些网站 预防九种情况
善用免费工具 网站地图对SEO优化有益
从标题制作到内容提高网站权重的技巧
搜索引擎权重评分表 让你做网站心中有数
“.中国”域名有助提升网站搜索引擎优化
 文章评论
Chinaitlab Group 旗下网站:
北京盛世创富广告传媒有限公司
北京运营中心:北京市海淀区中关村南大街9号理工科技大厦2107室 服务电话:86-10-85655622
深圳研发中心:深圳市福田保税区英达利科技数码园C座701D 服务电话:86-755-82044560
Copyright©2001 - 2009 All Rights Reserved