WonderCSS

如何创建Google网站地图Sitemap.xml

很多人都这样说:百度(baidu)搜索引擎亲和 html 格式的网站地图,而谷歌(google)搜索引擎亲和 xml 格式的网站地图,但html和xml的格式区别到底在哪里应该很多 SEOer 都不知道。简单的说,究其格式初衷 XML 被设计用来传输和存储数据,而 HTML 被设计用来显示数据。

由此我们就大致了解到 Google 的 XML 格式的网站地图并非是给普通用户看的,而是当成一个“表格文档”提交给 google 的纯数据文档。

在制作 Sitemap.xml 之前我们要了解 XML 的一个特性,那就是它具有自我描述性的语法,也就是说 XML 的语法只有逻辑性没有统一性。换句话说我们对 XML 只能学习其使用规则,而没有像 HTML 中 <div> 这类具体语法细则。

好了,我们用最简单的方法来了解下 XML 语法规则:

  • XML 文档必须有根元素
  • XML 文档必须有关闭标签
  • XML 标签对大小写敏感
  • XML 元素必须被正确的嵌套
  • XML 属性必须加引号

了解了大致的语法规则后我们就需要知道 Google 规定的几个“语法字段”了,因为出于 XML 语法具有自我描述的自由性,你必须保证你提交的文档能够和 Google 匹配。

看看实例:


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://www.wondercss.com/about/</loc>
        <lastmod>2013-02-17</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
</urlset>

快速了解 Google Sitemap 中 XML标签 的含义

  • urlset:相对于以下5个标签的父标签
  • url:相对于以下4个标签的父标签
  • loc:页面永久链接地址
  • lastmod:页面最后修改时间
  • changefreq:页面内容更新频率
  • priority:相对于其他页面的优先权

<url>

这是具体某一个链接的定义入口,你所希望展示在SiteMap文件中的每一个链接都要用<url></url>包含在里面,这是必须的。

<loc>

<loc>描述出具体的链接地址,这里需要注意的是链接地址中的一些特殊字符必须转换为XML(HTML)定义的转义字符。

<lastmod>

<lastmod>是用来指定该链接的最后更新时间,这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行比较,如果时间一样就会跳过不再索引。注意这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:

  • 年:YYYY(2005)
  • 年和月:YYYY-MM(2005-06)
  • 年月日:YYYY-MM-DD(2005-06-04)
  • 年月日小时分钟:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
  • 年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)

这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了。

<changefreq>

用这个标签告诉Google此链接可能会出现的更新频率,比如首页肯定就要用always(经常),而对于很久前的链接或者不再更新内容的链接就可以用yearly(每年)。这里可以用来描述的单词共这几个:”always”, “hourly”, “daily”, “weekly”, “monthly”, “yearly”,具体含义我就不用解释了吧,光看单词的意思就明白了。

<priority>

<priority>是用来指定此链接相对于其他链接的优先权比值,此值定于0.0 – 1.0之间。

By 于湛 发布于 2013.04.23 2,465 次浏览

如何创建Google网站地图Sitemap.xml》上有1条评论

  1. Pingback引用通告: XML正在进入WEB开发者的工作中 | WonderCSS

发表评论

电子邮件地址不会被公开。 必填项已用*标注