搜索引擎如何使用链接
搜索引擎主要通过链接查找页面,并将链接视为对这些页面的投票。但是,一旦获得信息,您如何使用它?一起来看看吧。
带索引
搜索引擎必须决定将哪些页面包含在其索引库中。网络爬虫(跟踪链接)是查找网页的一种方式(另一种是使用爬行速度/频率)。
搜索引擎蜘蛛每天都会抓取部分互联网。这个任务并不简单,先决定从哪里开始,到哪里去。谷歌已经公开表示,它将开始按照PR 值的相反顺序进行爬行。换句话说,它会抓取PR 值为10 的网站。这是一个PR 值为9 等的网站。 PR值高的网站应该比其他网站走得更深。 Bing 搜索引擎可能已经开始抓取最重要的网站。
这是有道理的。因为网站上最重要的变化是搜索引擎首先寻找什么。另外,当一个非常重要的网站第一次被定向到一个新资源时,搜索引擎往往会给这个链接很高的可信度,这个新链接(投票)应该尽快被纳入算法。 Google 已经发布了Caffeine 并更新了其基础架构,以显着提高抓取能力和速度,但在抓取优先级队列中获得更高的排名仍然是一个问题。
班级
链接在排名中起着重要作用。例如,如果两个网站的页面内容与给定主题具有相同的相关性,则它可能是两个购物网站。
搜索引擎需要一种方法来确定哪个网站是#1、Amazon 或JoesShoppingSite。这里链接有效。林克拥有决定性的一票。亚马逊排名高于JoesShopping 网站,因为如果更多网站、更重要的网站链接到亚马逊,亚马逊应该更重要。