了解网站结构

在开始进入上述的第三道关卡,搜索引擎会开始面临另外一个难题,那就是网站结构。网站结构包括了网站目录结构、URL网址结构、网页标记结构、网页外部档案配置、网页链接结构等等。透过这些结构就形成了你的网站,并且这些结构会影响搜索引擎的抓取。

为什么网站结构会影响搜索引擎抓取呢?举个最极端的例子就是错误的转址设定,可能形成无限循环,搜索引擎就会因为错误而放弃抓取。另外搜索引擎也可能因为过多层的目录而放弃抓取,或是过分庞大的内部CSS设定而影响抓取。

大抵可以再把网站结构再细分为网站信息结构(Information Architecture)与语意表不结构(Semantic Annotation Structure),前者会影响搜索引擎的访问路径与访问困难度,后者会影响搜索引擎的理解程度与理解困难度。

服务器的健康状态以及相关设定

SEO就是希望搜索引擎可以好好的处理网站数据,但是搜索引擎在尚未开始接触你的网站之前,会先碰到第一道关卡,那就是服务器,第二道关卡是你的网站配置文件案.htaccess与 robots.txt,第二道关卡才到网站页面。

当然以网络模型的细节来说,这三道关卡并不是循序的,也就是不是第一道关卡接着第二道关卡,然后才到第三道关卡,而是可能交错如①—②—①—③— ①—②—③—①—①—②—③等等可能组合。为了容易解释并且比较容易理解,我们可以从此下功夫。