解析HTML页的元标记 (327)
16:07 , 引用(0) Via 本站原创
如果你能写好和维持准确的元标记(例如,描述性标题和为搜索机器人提供的信息),Google就可以更准确地爬行、索引并在搜索结果中显示你的网站。元标记为各种各样的客户端(例如浏览器和搜索引擎)提供信息。请记住,每一个客户端可能只解析对该客户端有用的元标记,而忽略了其他元标记(虽然它们有其他用处)。
下面是Google如何解析以下HTML页的元标记:
<!DOCTYPE …><head>
<title>传统瑞士奶酪火锅食谱<title> Google使用此标记,网站管理员应非常注意它的准确性
<meta name="description" c> Google使用此标记,我们的搜索结果会显示它
<meta name="revisit-after" c> Google不使用此标记,其他主要搜索引擎也不使用
<META name="verify-v1" c /> 可选,Google网络管理员工具用到此标记
<meta name="GoogleBot" c> 可选
<meta …>
<meta …>
</head>
<meta name="description" c>
此标记提供了对当前页面一个简短描述。在很多情况下该描述会作为页面摘要(snippet)显示在Google的搜索结果中。详情请参阅我们的博客文章“使用更好的元描述来改善页面摘要”以及帮助中心的文章“如何更改网站的标题和描述”。虽然描述元标记是可选的,并且不会影响到您的排名,一个好的描述可以产生一个更好的页面摘要,这反过来又可以帮助提高我们的搜索结果质量和你的网页的访问者数量。
<title>页面标题</title>
从技术上讲,标题标记并不是一个元标记,它经常与"description"标记一起使用。此标记的内容(即标题)一般显示在搜索结果中(当然,当用户使用浏览器来浏览网页或察看书签时也能看到页面标题)。我们的博客文章"针对访问者,还是针对搜索引擎?"尤其是"充分利用网页标题"中有关于标题标记的更多信息。
<meta name="robots" c>
<meta name="googlebot" c>
这些元标记控制搜索引擎如何抓取和索引页。 "robots"元标记指定的规则适用于所有搜索引擎,"googlebot"元标记指定的规则只适用于Google。Google可以理解以下值(当指定多个值时,用逗号将它们分开) :
noindex: 防止网页被索引(见"使用元标记拦截或删除网页")
nofollow: 不要通过当前页的链接来寻找并抓取新的网页(也见"使用元标记拦截或删除网页")
nosnippet: 在搜索结果中显示当前页时,不要显示页面摘要(见"防止显示或删除页面摘要")
noodp: 在为本页产生标题或页面摘要时,不要使用开放式目录项目(又名dmoz.org)中的文本(见"如何更改网站的标题和描述?")
noarchive: 在显示本网页于搜索结果中时,不要显示一个"网页快照"链接(见"防止显示或删除缓存的网页")
unavailable_after:[日期]:在指定的日期和时间后从搜索结果中删除这个网页(见"机器人排除协议:现在更灵活")
当你完全省略此标记或当你指定c时,默认规则是"index, follow"。"使用robots元标记"中有关于"robots"元标记的更多信息。作为一个说明,你现在也可以在你的页面首部通过"X-Robots-标签"HTTP头指令来指定这一信息。这特别有用,尤其是当你想微调抓取和索引诸如PDF、图片或其他类型的非HTML文件时。
内文分页: [1] [2]
订阅该源 