网站seo优化需要了解搜索用户的意图并提供相关且新鲜的内容
当今的商业搜索引擎主要依赖于信息检索(IR) 技术。该技术自20 世纪中叶以来一直存在,当时搜索系统已在图书馆、研究中心和政府实验室基地实施。在搜索系统开发的早期阶段,IR 科学家认为搜索功能主要由两个重要部分组成:相关性和重要性(本章前面已定义)。为了衡量这些因素,搜索引擎执行文档分析(包括文档中概念的语义分析)和链接(或引用)分析。
文档分析和语义连接
在文档分析中,搜索引擎会检查出现在文档关键区域的标题、元数据、标题标签和文本正文中的搜索词(——)。您还希望根据文档分析自动衡量文档和其他元素的价值。
我们还关注语义连接,因为仅通过文档分析来判断对搜索引擎来说仍然不够。语义连接是指单词之间的正常连接。例如,当您看到aloha 一词时,您可能会想到夏威夷,但绝不会想到佛罗里达。搜索引擎积极创建自己的词典和词典,以帮助确定相关术语和主题。通过简单地扫描庞大的网络内容数据库,您可以使用模糊集理论和某些特定方程来连接术语,并开始像人类一样理解网页和网站。
专业的SEO从业者不需要使用语义连通性测量工具来优化他们的网站,但对于想要获得所有好处的高级从业者来说,使用语义和测量方法将有助于下一部分。
测量要查找的关键字词组。
衡量主题页面上应该覆盖的关键词。
衡量其他网站和高排名页面之间的文本关系。
查找提供“相关”主题链接的页面。
虽然技术性很强,但SEO 专家只需要了解一些原则即可获得有价值的信息。 IR 世界中有数百个技术术语,它们很难理解,但SEO 初学者可以将它们分解并更好地理解它们。
IR领域常见的搜索类型主要分为以下几类:
近似搜索
粗略搜索使用一系列搜索短语来查找相关文档。例如,当搜索“SweetGerman mustard”时,您只指定一个近似搜索。除了引用之外,搜索词的相关性对于搜索引擎来说仍然很重要,但是当前显示的文档不能完全匹配搜索短语的顺序,就像甜芥末德语一样。
模糊逻辑
模糊逻辑是不区分对错的逻辑。作为一般示例,评估某一天是否晴天(包括50% 多云的日子?)。在搜索中,模糊逻辑通常用于拼写错误。
布尔搜索
这是使用布尔搜索词AND、OR 和NOT 的搜索。这种类型的逻辑用于扩展或限制在搜索中找到的文档信息。
重量这个词很难理解。例如,橙子和香蕉都是水果,但并不是所有的橙子和香蕉都是圆形的。对于人类来说,这是直觉知识。
语义连接是机器理解这个概念和其他类似概念的关键。可以收集和分析互联网上大量与人类有关的知识,作为系统指标,人为地创建人类设置的各种联系信息。通过以这种方式扫描索引中的数千个香蕉和橙子,我们知道圆圈和香蕉的相关性不是很好,但橙子和圆圈确实相关并且机器知道橙子是圆形的。而且香蕉不是圆的。
这里使用了模糊逻辑。模糊集理论允许计算机通过测量术语一起出现的频率和场景来确定术语之间的联系。
例如,搜索引擎将识别公园游览通常包括可能是游览一部分的野生动物目击事件。
在Google 上搜索“zootrips”(公园游览)以查看此示例。返回的搜索结果中的粗体文本在以下段落中用斜体表示。在索引中,Google 将“相关”字词加粗,并确定哪些字词出现得更频繁(一起显示、在同一页面上或相似字词)。
搜索公司已经在这些技术上投资了好几年。 2013 年9 月,谷歌悄悄地向全世界宣布,它已经重写了引擎,并将其命名为“蜂鸟”。这种重写大大提高了识别事物之间联系的能力。
例如,使用谷歌的语音搜索(点击搜索框右侧的麦克风按钮)询问“TomBrady 是谁?”联盟的新英格兰爱国者队四分卫。”
以下是Google 以不同方式搜索Tom Brady 的结果:例如,
他有一份工作:四分卫,美式足球(明显不同于美国和加拿大以外的国家的足球)
他的球队:新英格兰爱国者队。
新英格兰爱国者联盟:国家橄榄球联盟。
当前的搜索比2012 年复杂得多。你可以走得更远。比如你用语音搜索功能问“他老婆是谁?”,这个问题也有答案(见如图2-22)。
您没有在第二个查询条目中提及Tom Brady 的名字。谷歌记得谈话。 “他的”代表汤姆布雷迪。您可以继续问诸如“您有孩子吗?”之类的问题。谷歌对此也有答案。
从SEO 的角度来看,您可以看到这种用途允许搜索引擎识别Internet 上的单词和主题之间的联系。随着语义链接成为搜索引擎算法的重要组成部分,您可以专注于网站和页面上的主题和链接。未来,搜索引擎应该能够根据主题和想法识别您网站上的不当内容、链接和页面。
词权重表示特定搜索词对特定查询的重要性。目的是赋予某些特定术语更多的权重,以产生良好的搜索结果。例如,在选择结果时,查询中出现的单词的权重很小,因为它几乎出现在所有英文文档中。它没有什么特别之处,它对文档选择也没有真正的帮助。
IR 模型(搜索引擎)使用模糊集理论(Lotfi Zadeh 博士于1969 年创建的模糊逻辑的一个分支)来发现两个词之间的语义联系。与使用字典和字典来确定两个单词是否相互关联相比,IR 系统可以使用庞大的内容数据库来解析单词之间的关系。
虽然过程看起来很复杂,但基本思想很简单。搜索引擎必须依赖机器逻辑(真/假、真/非等)。机器逻辑比人类有很多优势,但它的思维方式与人类不同。