一个网站只有尽可能多的页面被搜索引擎收录进索引库获得较好的收录比才能逐渐提升权重,进而促进网站在搜索引擎自然搜索中得到更好的曝光量,所以网络蜘蛛能够有效抓取页面是关键字排名的第一步,大部分搜索引擎大体如此。百度收录网站页面的机制是通过一个叫Baiduspider的蜘蛛程序自动抓取互联网上的网页,经过处理后收入索引数据库中。目前Baiduspider只能读懂文本内容,flash、图片、视频和JavaScript等非文本内容处理结果不是很理想,所以很多企业网站为了界面美观放置在flash、图片和视频中的文字,百度无法识别。针对这个特点为了让网络蜘蛛更有效识别页面文字内容并抓取,建议设计开发网页的时候注意如下问题:
1、网页中尽量使用有效的文字而不是flash、图片、Javascript等来显示重要的内容或链接,如果为了页面美观需要使用图片,建议图片一定要设置好带有效关键词的Alt属性,图片命名有意义,图片下面描述性文字有效,图片的周围一定有能够说明图片的文字并最好带有关键字。
2、随着现在网页技术和带宽的进步,有时候网页中需要安排动画、视频、音频等多媒体要素来更好说明产品的制造和使用、研发生产实力、形象和服务等,以便获得网民的高度信任,更好服务目标客户,网站会使用音视频等多媒体元素,建议在这部分网页中尽量同时提供文字说明,文字部分可以参考上面图片的文字要求,可以采用必要技术不显示在网页中。
3、Ajax等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”到的导航及正文内容放到Ajax中。尽量少使用使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。