搜索引擎如何理解Cookie 和会话ID
搜索引擎会像浏览器一样关闭它而不检查cookie 或会话ID,但与浏览器不接受cookie 的访问者不同,爬虫可以在希望传递cookie 的网站管理员的帮助下访问隐藏的内容。许多网页要求您启用cookie 或会话,但对于允许访问内容的搜索引擎程序有特殊规则。这是一种技术掩盖,但搜索引擎允许某种掩盖,通常在第一次点击时免费。
搜索引擎可能偶尔会访问cookie/会话限制页面,但使用cookie 和会话ID 生成的大多数内容、链接和页面都受到限制。它可以以适合人们和搜索引擎的方式工作。
为什么要使用cookie 或会话ID 限制搜索引擎访问?
使用cookie 或会话ID 进行搜索引擎控制的策略数不胜数,其中一些关键策略是:权限控制链接过程时显示多个面包屑
网站访问者通常有多种方式来浏览或访问内容。您的网站可能会提供多种路径来访问您的内容(日期、主题、标签、关系、评级等)。最好专注于优化结构。这非常重要,因为多个排序顺序被标记为重复内容。
为防止搜索引擎将具有相同内容的多个页面编入索引,我们可以使用cookie 来要求用户访问我们页面的不同排序版本。另一种解决方案(不是很安全)是使用rel='canonical' 链接元素,以便搜索引擎的可选排序顺序实际上与原始页面具有相同的内容。防止某些内容被搜索引擎索引
您可以向搜索引擎显示部分页面内容,而仅向访问者显示其他部分内容。这可能包括广告、仅限登录的信息、链接或富媒体内容。同样,它非常适合向非cookie 用户显示通用版本,并向使用cookie 的访问者显示更深入的信息。用户可以访问所有内容(例如Facebook 和LinkedIn 网站)。允许访问需要登录的页面
从内容摘要的角度来看,这通常是网站内容的任何页面或部分,并且可能会限制搜索引擎访问网站上的此类内容。这可以使用cookie 或会话轻松实现,也有助于网站获得一些可能性。搜索流量会切换到“注册用户”状态。例如,如果要限制某些内容,可以创建一个带有简短摘要的页面,允许访问者在注册后继续阅读,然后允许用户从同一网址继续阅读内容。使用cookie 或会话来避免内容重复的最常见用途之一是防止爬虫抓取使用相同内容的多个页面,并允许访问者查看他们喜欢的页面。以Moz为例,登录用户可以在博客首页看到整个博客目录,但搜索引擎和非登录用户只能看到摘要,防止内容被列在多个页面(博客首页和特定帖子页面) ),同时为会员提供更丰富的用户体验。