Search ConsoleのURL検査でライブテストを行うと、「特定の条件が満たされている場合にのみ、URL はインデックスに登録されます」と表示されます。
どのような条件を満たすとインデックスされるのでしょうか?
この記事では、特定の条件が何なのか詳しくお伝えします。
ライブテストとは
ライブテストとは、プロパティ内のURLをGoogleでインデックス登録できるかどうか確認するためのテストです。
ライブテストの結果が「URL は Google に登録できます」とある場合、インデックス登録をリクエストできますが、すべてのURLがインデックスされるわけではありません。
特定の条件を満たすURLがインデックスされることになります。
特定の条件とは
特定の条件は、次のものが考えられます。
これらの条件を満たしていれば、ほとんどケースでインデックスされます。
- robots.txtでクロールをブロックしていない
- noindexがついていない
- 重複していない
- ページの品質が高い
- リダイレクトしていない
- 404/410が返っていない
- 削除リクエストをしていない
- 手動による対策が行われていない
- ウェブマスター向けガイドラインに準拠している
- 構造化データのガイドラインに準拠している
robots.txtでクロールをブロックしていない
クロールをブロックしていると、当然インデックスはされません。
ライブテストを行っても「URL は Google に登録できません」と表示され、その下に「robots.txt によりブロックされました」と表示されます。
インデックスしたいのであれば、必ずGooglebotがクロールできるようにしてください。
robots.txtを設置する際の注意点をお伝えします。
- robots.txtはルート直下に設置する・・・https://example.com/robots.txt
- robots.txtを設置する:HTTPステータスコード200を返す
- robots.txtを設置しない:HTTPステータスコード404を返す
- robots.txtのステータスコードが500番台だとインデックスされない
noindexがついていない
noindexがついていると、「URL は Google に登録できません」と表示されインデックスされません。言うまでもなく、特定の条件を満たすことはできません。
公式 noindex を使用してコンテンツをインデックスから除外する
重複していない
インデックスに登録された別ページと重複しているとインデックスされません。
必ず正規URLを指定します。
ページの品質が高い
品質の高い記事を作成するには、以下のページをご覧ください。
リダイレクトしていない
リダイレクトしていると、リダイレクト先のページが正規URLとなります。リダイレクト元はインデックスされませんのでご注意ください。
404/410が返っていない
HTTPステータスコード 404はページが見つからなかったことを指し、410はページが削除されたことを指します。404/410が返っていると、そのページはインデックスから削除されます。
削除リクエストをしていない
削除リクエストをしていると、検索結果に表示されません。
手動による対策が行われていない
手動による対策があるとインデックスされません。Search Consoleに通知が来るので見逃さないでください。
万が一、手動による対策が行われたのであれば、再審査リクエストを提出します。
Check! 再審査リクエストの書き方
ウェブマスター向けガイドラインに準拠している
ヘルプページに詳しく載っているので確認してください。
構造化データのガイドラインに準拠している
こちらもガイドラインの詳細については、ヘルプ記事をご覧ください。
ナレッジ