二、目录列表(分类目录)
分类目录现在比起以前简单了不少,但是我们在做网站的时候,也要经常注意其细微的变化,这也是一个漫长而漫长的过程。
搜索引擎的典型代表是百度搜索。它的出现让搜索引擎给我们的网页总是一个新的网页,让我们找到更多的新的内容。随着百度的步伐,我们的搜索引擎也加快了搜索引擎的更新速度,我们的网页信息包含了更多的新内容。
从实际层面上来看,分类目录相对于目录的扩展更加频繁。当用户对某一个主题有疑问的时候,他们会想到他们的相关知识。
我们在做这些分类目录的时候,尽量使用同一个主题或者类似的二级目录。这样的内容可以缩短连接路径,提高蜘蛛的爬行效率,减少不必要的不必要的麻烦。
当然,搜索引擎有自己的爬行路线,爬行任何一个分支时,都要从起始的URL(关键词)开始爬行。如果中途出现断然情况,它就会很快送入错误的节点,蜘蛛也会感到困惑。你还可以用一些文本来编写内容,这样蜘蛛就可以在有限的时间内爬得更远。
4、机器人协议的深度不能太深。
蜘蛛在爬行网站时,通常会标记他们想要访问的页面的第一层的链接,这通常称为“机器人协议”。
如果设置在这个层面上,蜘蛛就会绕过上级的URL(网站的一级目录),不需要深入的索引,但是蜘蛛却可以绕过下级的URL,直接从下级的URL访问。
实际上,蜘蛛无法从主页爬行,但从整个网站获取信息的路径很长,网站访问量会非常少。同时,蜘蛛也无法通过主页爬行,这很容易就陷入了死循环。