生成xml网站地图注意事项
谷歌搜索,雅虎!并且Bing(最初是MSN 搜索,然后是实时搜索)支持将URL 附加到站点地图文件的调用,因此不能保证URL 会被抓取或编入索引,但它可能会强制搜索引擎查找和索引其中的一些。它被注意到
该程序是对搜索引擎基于链接的传统爬行的补充而非替代。站点地图的主要优点是:
对于某些搜索引擎通过定期抓取获得的页面,搜索引擎使用您提供的元数据来改进我们抓取我们网站的方式,例如上次修改内容的时间和频率(上次修改日期)。页面修订(修订频率)和其他元数据
对于您不知道的网页,搜索引擎会使用您提供的额外网址来增加它们的抓取范围。
搜索引擎将此用于某些可能具有多个副本的URL。站点地图的爬行/嵌入优势还可以产生其他积极影响,例如增加内部链接的排名或宽度。
在Google Search Console 中注册站点地图可以帮助您更好地了解您的网站是否遇到索引编制、抓取或内容重复问题。
正如谷歌反垃圾邮件团队前负责人马特卡茨(Matt Cutts) 解释的那样:假设您的网站有三个页面A、B 和C。页面A 和B 是通过定期抓取链接找到的。然后创建一个包含以下列表的站点地图:页面B 和C,现在我们有机会(但不一定)抓取页面C,我们不会放弃页面A,因为我们没有在站点地图中列出页面A。站点地图中的未知页面可以保证页面抓取,但如果您之前由于某种原因从未见过页面C 的链接,或者如果您知道页面C 并且页面URL 包含太多参数,或者您的网站因任何原因而被拒绝其他原因,拿到地图后,就可以爬取C[1]页了。
您可以使用以下工具创建站点地图:您可以安装一个简单的脚本来自动生成和提交您的站点地图。站点地图生成器可以根据URL 列表、用户访问日志或具有与URL 对应的静态文件的目录路径生成这些站点地图。这里有一些 SourceForge.net 的Google-sitemap_gen。
站点地图臂
G站点爬虫
简单的文字
您可以向Google 提供一个简单的文本文件,每行只有一个URL。但是,如果您的网站有文本站点地图文件,我们建议使用站点地图协议使用站点地图生成器从文本文件生成站点地图。
站点聚合内容摘要
Google 接受RSS 2.0 和Atom 1.0 摘要。摘要只能提供与最新URL 相关的信息。确定要包含在站点地图文件中的内容
在生成站点地图文件的过程中,您需要注意几种情况,以确保您的站点有多个URL 指向相同的内容。您可以使用站点地图文件向搜索引擎显示更适合特定页面的URL,因为站点地图文件中指定的URL 具有“唯一”基本(规范)版本的URL 更适合特定页面的URL。内容。