构建最佳网站结构
为了让搜索爬虫能够抓取您的网站,您还需要考虑您网站的信息架构(IA)。一个精心设计的网站结构不仅为用户提供了良好的体验,也为搜索引擎提供了许多好处。
明确组织和分类的重要性流量
搜索引擎在理解网站方面面临许多技术挑战。这是因为爬虫不能像人类那样识别网页,这对访问和索引设置了许多限制。一个组织良好且结构合理的网站可以帮助您克服这些问题。搜索http增加并搜索可用性。

网站信息架构的两个主要原则是可用性(使网站易于使用)和信息架构(创建结构化和有组织的内容结构)。
Richard Saul Wurman 是信息架构的早期支持者之一,他对信息架构的定义是:
1) 能够管理数据的内部模式并阐明复杂性的人。
2)创建信息结构或图表的人,以便其他人可以找到解释适合他们的信息的方法。
3) 21 世纪的新兴职业主要解决这个时代对信息组织、人类理解和科学的清晰度的需求。可用性和搜索适应性
搜索引擎尝试根据质量对相关网页进行重新排序,如果真人这样做,可用性和用户体验将在页面排名中发挥重要作用。假设您的搜索引擎是一台机器,并且您无法根据此指标参数轻松隔离网页,您将需要调用另一个替代指标来完成该过程。最常见的替代指标是网站的获取链接(如图),设计良好的网站更容易获得链接。

自1990 年代后期Google 推出以来,搜索引擎已投入大量精力分析网页链接结构的各个方面,并且能够从链接中成功推断出信任、质量、可信度和权威性。如果你从表面深入分析为什么网站之间存在链接以及它们是如何创建的,你会发现这些链接实际上是人为创建的。它可能由几个人制作)。
搜索引擎假定高质量的链接指向高质量的内容,高质量的内容和积极的用户体验会比糟糕的用户体验为您提供更多的链接。其实这个理论还是不错的,现代搜索引擎可以成功地将一个高质量且非常有用的网站放在搜索请求的顶部。隐喻
看一看标准文件柜的配置方式。我有一个单独的文件柜,文件柜中有一个文件夹,一个文件夹中有一个文件夹,一个文件夹中有一个文件,一个文件中有一个文档 。cn/标记)
只有一个文档副本存储在特定位置,并且有一个非常清晰的导航路径来获取文件。

要查找客户的2015 年1 月发票(Amalgamated GloveSpat),请进入文件柜,打开名为Customer Account 的文件框,找到Amalgamated GloveSpat 文件夹,找到发票文件,然后搜索文档。直到您找到2015 年1 月的发票(同样,这是文档中唯一的项目,我在其他任何地方都找不到)。