<meta name="robots">
robots は <meta> 要素の name 属性の値で(多くの場合「ロボットタグ」と呼ばれます)、ウェブクローラーがページに対して行うクロールおよびインデックス作成の動作を定義します。
指定した場合、 <meta> 要素の content 属性に、1 つ以上のルールをカンマで区切ったリストとして、クローラーに対する指示を定義します。
例えば、ページを検索結果のインデックスから除外することをクローラーに指示するには、noindex 値を使用することができます。
<meta name="robots" content="noindex" />
メモ: 協力的なロボットだけがこのルールに従います。 クローラーは、ヘッダーやメタ要素を読み込むために、リソースにアクセスする必要があります(X-Robots-Tag: robots.txt との相互作用を参照してください)。 クローラーによる帯域幅の消費を防止したい場合は、リソースのクロールを完全にブロックする制限的な robots.txt ファイルの方が、インデックス作成ルールよりも効果的です。
使用上のメモ
<meta name="robots"> 要素には、次の追加属性を指定することができます。
content-
content属性は定義する必要があります。この属性の値は、協力的な検索エンジンロボットのインデックス作成およびクロール動作を設定します。 カンマで区切られたリストとして、次のキーワードを 1 つ以上受け入れます。index-
ロボットがページをインデックスに登録することを許可します。これは既定の動作です。 主要なクローラーすべてで使用されます。
noindex-
ロボットにページをインデックスに登録しないようにリクエストします。 主要なクローラーすべてで使用されます。
follow-
ロボットがページ上のリンクをたどることを許可します。これは既定の動作です。 主要なクローラーすべてで使用されます。
nofollow-
ロボットに対して、ページ上のリンクをたどらないようリクエストします。 主要なクローラーすべてで使用されます。
all-
index, followと同等です。 使用されるもの: Google. none-
noindex, nofollowと同等です。 使用されるもの: Google. noarchive-
検索エンジンにこのページの内容をキャッシュしないよう要求します。 使用されるもの: Google, Yahoo, Bing.
nosnippetnoimageindex-
このページをインデックスされた画像の参照ページとして表示しないよう要求します。 使用されるもの: Google.
nocache-
noarchiveと同等です。 使用されるもの: Bing.
解説
robots メタ値を設定するにあたって、いくつかの重要な注意事項があります。
- これらのルールに従うのは、協力的なロボットのみです。電子メールアドレスの収集者などの悪意のある行為者がディレクティブを無視することを防ぐことはできません。
<meta>タグで定義されている場合でも、ロボットはこれらのルールを読み込むためにページにアクセスする必要があります。帯域幅を節約するには、代わりに robots.txt ファイル を使用することを検討してください。<meta name="robots">タグとrobots.txtは異なる役割を果たします。robots.txtはクロールを制御し、robotsメタタグはインデックス作成やそれ以外の動作に影響を与えます。robots.txtによってブロックされたページは、それ以外のソースからリンクされている場合、インデックスに登録される場合があります。noindexディレクティブは、ロボットがページを再訪問した後にのみ効果があります。そのため、robots.txtがこれを妨げないようにしてください。- 値によっては互いに排他的なものがあります。例えば
indexとnoindex、followとnofollowなどです。競合する値が使用された場合、動作は未定義になります。 - Google、Yahoo、Bing など一部のクローラーロボットでは、 HTTP ヘッダーの
X-Robots-Tagで提供された同じ値に対応しているものがあります。これにより、 PDF や画像などの HTML 以外の文書でもこれらの規則を使用することができます。
例
>robots キーワードの使用
次の例では、nofollow を使用して、クローラーがページ上のリンクをフォローしないように要求し、noindex を使用して、そのページをインデックスから除外するように要求しています。
<meta name="robots" content="nofollow, noindex" />
仕様書
これはどの標準仕様にも属しませんが、検索ボット、ウェブクローラー、および類似のユーザーエージェントと通信するための事実上の標準手段です。
ブラウザーの互換性
この機能はクローラーが監視することを意図しているため、「ブラウザー」の互換性は適用されません。
関連情報
- HTTP の
X-Robots-Tagヘッダー - robots.txt の構成ガイド
- 用語集の robots.txt
- 用語集の 検索エンジン
- RFC 9309: Robots Exclusion Protocol
- WHATWG Wiki MetaExtensions page
- Using the robots meta tag (developers.google.com)