ウェブサイトを運営するうえで、検索エンジンに自分のサイトのコンテンツを正しく理解してもらうことは非常に重要です。特に新しいウェブサイトや更新頻度の高いウェブサイト、大規模かつ階層が複雑なウェブサイトでは、検索エンジンに効率的にページをクロール・インデックスしてもらうための工夫が欠かせません。ここで役立つのがXMLサイトマップです。
XMLサイトマップとは、サイト内の重要なページURLをまとめて検索エンジンに伝えるためのファイルです。Googleサーチコンソールを利用すれば、このXMLサイトマップを容易に登録・管理でき、サイトの検索パフォーマンスを向上させることができます。本記事では、初心者の方でも理解しやすいように、XMLサイトマップの基礎知識から具体的な登録方法、運用時のポイントなどを徹底的に解説していきます。
目次
XMLサイトマップとは何か
XMLサイトマップとは、ウェブサイト内に存在するページのURLと、そのページの最終更新日時や更新頻度などのメタデータを記載したファイルのことです。検索エンジンにとっては、ウェブサイトのコンテンツを効率よくクロールし、インデックスするための「地図」のような役割を果たします。
検索エンジンは通常、内部リンクや被リンクなどをたどりながらウェブサイトを発見していきますが、サイトの構造が複雑だったり、新しく公開したページに被リンクがなかったりすると、クロールの優先度が下がってしまう可能性があります。XMLサイトマップを活用することで、検索エンジンに「ここに大切なページがあります」としっかり伝えることができるため、インデックスのカバレッジを向上させやすくなります。
HTMLサイトマップとの違い
サイトマップには大きく分けてHTMLサイトマップとXMLサイトマップの2種類があります。HTMLサイトマップは主にユーザー向けに、サイト内でのページの構造をわかりやすく示すために作成されたものです。サイトのコンテンツを探しやすくする目的が強く、訪問者が目的のページへスムーズに移動できる手助けをします。
一方で、XMLサイトマップは検索エンジン向けのサイトマップです。ページのURLや最終更新日などの情報を検索エンジンに効率よく伝えることで、インデックスの精度を高める役割を持っています。HTMLサイトマップとXMLサイトマップを両方用意しているサイトも多く、それぞれ役割が異なる点を理解して使い分けると良いでしょう。
XMLサイトマップの最新動向
検索エンジンの技術は日々進歩しており、それに伴いXMLサイトマップの役割や運用方法にも変化が起こっています。たとえばGoogleでは、サイトマップの更新を通知するために用いられていた「サイトマップpingエンドポイント」のサポートを終了しました。今後は、サイトマップ内のタグで最終更新日時を正確に示すことが重要になっています。このタグを更新しておくと、Googleがサイトマップの更新を効率的に理解し、ページの変更を素早くインデックスに反映する可能性が高まります。
さらに、Googleサーチコンソールの動画インデックスレポートにおいて、インプレッションデータやサイトマップフィルターが追加されるなど、動画コンテンツのSEO対策に役立つ機能も強化されています。今後、動画を活用する機会が増えているサイトにとっては、サイトマップをしっかり整備することがますます重要となるでしょう。
Googleサーチコンソールを活用したXMLサイトマップの登録方法
Googleサーチコンソールは、Googleが無料で提供しているウェブサイトのパフォーマンス管理ツールです。サイトの検索順位やクリック数などの状況をレポートとして確認でき、さらにXMLサイトマップを登録したり、エラーをチェックしたりといった管理機能も備えています。ここでは、Googleサーチコンソールを使ってXMLサイトマップを登録する手順を詳しく解説します。
Googleサーチコンソールにログインする
まずはGoogleサーチコンソールにアクセスし、Googleアカウントでログインします。対象となるウェブサイトのプロパティをまだ設定していない場合は、プロパティを追加し、サイト所有権を確認する必要があります。所有権の確認方法はHTMLファイルをアップロードするやり方や、DNSレコードを編集するやり方など複数あるので、自分に合った方法を選びましょう。
サイトマップの登録画面へ移動する
ログイン後、左側のサイドバーにある「インデックス」をクリックし、その中にある「サイトマップ」を選択します。すると「新しいサイトマップを追加」という入力フィールドが表示されます。ここにサイトマップのURLを入力して「送信」をクリックします。
もし、Googleサーチコンソールのプロパティが「ドメインプロパティ」になっている場合は、サイトマップの完全なURLを入力する必要があります。たとえば、httpsで始まるかどうかといったプロトコルを間違えないよう、正確に入力してください。
サイトマップの送信に成功すると、送信済みサイトマップの一覧に表示されます。Googleはその後、定期的にサイトマップをクロールして更新状況を確認してくれます。サイトが大きなアップデートを行った際は、改めてサイトマップを再送信しておくと、変更を早く認識してもらえる可能性があります。
robots.txtへの記載も忘れない
GoogleにXMLサイトマップの存在を伝える方法は主に2つあります。ひとつはGoogleサーチコンソールからのサイトマップ登録。もうひとつはrobots.txtファイルに記載する方法です。両方やっておくことで、検索エンジンが確実にサイトマップを発見しやすくなるのでおすすめです。
robots.txtファイルはウェブサイトのルートディレクトリに配置されており、クローラーに対して「どのページをクロールしてほしい(またはしてほしくない)のか」を指示するファイルです。そこに以下のような記述をするだけで、サイトマップのURLをアピールできます。たとえば
Sitemap: https://example.com/sitemap.xml
のように記載することで、クローラーがサイトマップの場所を認識しやすくなります。
複数サイトのサイトマップをまとめて登録する
もし複数のウェブサイトを同時に管理している場合、クロスサブミット機能を活用すると、1つのXMLサイトマップファイルに複数サイトのURLを記載し、それぞれのサイトで共有する形で登録することが可能です。ただし、クロスサブミットを行うためには、すべてのサイトで所有権が確認されている必要があります。オーナー確認ができていないサイトが含まれていると、クロスサブミットは機能しないので注意が必要です。
XMLサイトマップの管理ポイント
XMLサイトマップは一度登録すれば終わりというわけではなく、常に最新の状態を保つことが大切です。サイト内のページが削除されたり、URLが変更されたり、新しいコンテンツが追加された場合には、速やかにサイトマップを修正しましょう。特に最終更新日時やURLは、正確に維持しておく必要があります。
インデックスカバレッジレポートの活用
Googleサーチコンソールには「インデックスカバレッジレポート」という機能があります。これによって、インデックスされているページとインデックスされていないページの状況を把握することができ、「インデックスに登録済みですが、サイトマップに送信されていません」というようなメッセージが出ることもあります。サイトマップで正しくページを登録しているか、何かエラーが出ていないかをチェックすることで、サイトマップの管理をスムーズに行うことができます。
サイトマップをセクションごとに分割する
サイトの規模が大きい場合や、ブログ記事と商品ページなどコンテンツの種類が明確に異なる場合は、サイトマップをセクションごとに分割して管理するのがおすすめです。たとえば以下のように「サイトマップインデックスファイル(index.xml)」を用意し、その中に各セクションのサイトマップファイルへのリンクをまとめます。
Index.xml
products-index.xml
product.xml
product1.xml
blog-index.xml
blog.xml
blog-1.xml
some-directory-index.xml
directory.xml
directory-1.xml
こうした階層的な管理を行うことで、検索エンジンのクローラーに対しても「商品のサイトマップはこれ」「ブログのサイトマップはこれ」とわかりやすく指示ができます。同時に、自分自身がサイトマップを管理する際にもどのファイルが何を表しているか明確になり、更新のミスや漏れを防ぎやすくなります。
RSS/Atomフィードとの併用
サイト全体を包括的にカバーするXMLサイトマップと、最新の更新情報を伝えるRSSフィード(またはAtomフィード)を併用するというテクニックもおすすめです。たとえばブログなどの更新頻度が高いコンテンツを持つサイトであれば、RSSフィードによって「新しい記事が投稿されました」という情報を素早く検索エンジンに通知できる可能性があります。その上でXMLサイトマップで全体の構造を定期的に更新しておけば、古いページも含めた包括的なサイト状況を伝えられるというメリットがあります。
XMLサイトマップのSEO効果
XMLサイトマップの有無は直接的な検索ランキング要因ではないとされています。Googleの関係者が、XMLサイトマップがないことでランキングが下がるわけではないと公言しているほどです。しかし、XMLサイトマップが正しく機能していると、クローラーがサイト内のページを効率的に発見・インデックスできるため、結果的に検索パフォーマンスの改善に繋がるケースは多く見られます。
特に以下のような場合にXMLサイトマップは効果的です。
- 新規に立ち上げたばかりのウェブサイトやページ
- 外部からの被リンクが少ないページ
- 大規模で階層が深いサイト
こうした条件を満たすサイトほど、XMLサイトマップがクローラー誘導に役立つでしょう。たとえば「商品の一覧ページが数万ページある」といった場合でも、サイトマップをしっかり整備すれば、検索エンジンに対して「ここにこういう商品ページがあります」と体系立てて提示できます。また、重要ページを優先的にクロールしてもらうように調整することも可能です。
具体的なSEO効果
– 内部リンクがほとんどないページでもクローラーに見つけてもらいやすくなる – 大規模サイトで「優先的にクロールしてほしいページ」を伝えやすい – 画像や動画など特別なコンテンツへのクロールを促せる
なお、XMLサイトマップを作成しているだけでSEOが劇的に向上するわけではありません。コンテンツの質や被リンクの獲得、ユーザーのニーズを満たすサイト構造など、総合的なSEO対策の一環として活用することが大切です。
大規模ウェブサイトや特殊サイトにおける事例
商品ページが大量に存在するECサイト、ニュースサイト、動画を中心にしたメディアなど、サイトの構造やコンテンツが特殊な場合には、専用の拡張サイトマップを利用できます。たとえば「動画サイトマップ」には動画のタイトルや説明文、サムネイルURLなどを記載できますし、「画像サイトマップ」なら画像URLやキャプション情報を詳細に記載できます。こうした拡張機能を使用することで、検索エンジンが画像や動画の内容をより正確に把握し、検索結果のリッチスニペットとして表示される機会も増える可能性があります。
また、大規模サイトにおいてはサイトマップを分割し、インデックスファイルを活用する方法が一般的です。サイトマップ1ファイルあたりに含められるURL数やファイルサイズには上限があるため、膨大なURLを一つのサイトマップに詰め込むのではなく、セクション別にサイトマップを作ることで、クロール効率の向上や管理コストの削減を図れます。
XMLサイトマップ作成時のベストプラクティス
XMLサイトマップを作成し、運用していくうえで押さえておきたいポイントを以下にまとめます。これらを守ることでクローラーがスムーズにサイトマップを解釈し、不要なエラーを回避できるでしょう。
インデックスさせたいページのみ含める
noindexタグを設定しているページや、重複ページの正規化(カノニカル設定)によってインデックスしてほしくないページは、サイトマップには含めないようにしましょう。不要なページが含まれていると、クローラーのリソースが無駄になってしまう可能性があります。
ステータスコードが200 OKのページのみ含める
リダイレクトページや404エラーページは、サイトマップに含めないのが基本です。クローラーがエラーURLばかりを読み取ると、サイト全体の評価に悪影響を与える可能性もあります。
robots.txtファイルから参照する
前述の通り、Googleサーチコンソールへの登録とあわせてrobots.txtファイルにもサイトマップのURLを記載することで、クローラーの発見率がより高まります。
1つのサイトマップに50,000URLを超えないようにする
Googleの仕様で1ファイルに含められるURL上限は50,000URL、またはファイルサイズが非圧縮で50MBを上限としています。それを超える場合にはサイトマップを複数に分割し、サイトマップインデックスファイルでまとめましょう。
重要なページを優先的にリストアップする
検索エンジンにクロールの優先度を示す「priority」属性は現在ではあまり効力がないとされていますが、それでもサイトマップ上位に重要なページを配置しておくと、クローラーに見つけてもらいやすくなる可能性があります。
更新頻度の高いページを含める
頻繁に情報を更新するページは、クローラーがより高頻度で訪れるため、SEO上も有利になる傾向があります。更新頻度が高いページを中心にサイトマップを整備しておきましょう。
画像や動画を含むページもリストに入れる
画像検索や動画検索で流入を増やしたい場合、対象ページの情報を正しく記載したサイトマップを用意しておくと有利です。特に動画やニュースなどは拡張サイトマップが用意されているので検討してみてください。
カノニカルURLを正しく使用する
重複するコンテンツが複数のURLにまたがる場合は、正規のURL(カノニカル)を設定し、そのカノニカルURLだけをサイトマップに含めると整理しやすくなります。
サイトマップを最新の状態に保つ
サイト運営を続けている以上、ページの追加や削除、更新は日常的に発生します。これらに合わせてサイトマップの内容も更新し、クローラーに古い情報を伝えないように注意しましょう。タグを正確に更新するのも大事なポイントです。
サイトマップインデックスファイルの活用
複数のサイトマップファイルを使用するときは、必ずインデックスファイルを使ってまとめましょう。クローラーがどのサイトマップファイルを見ればいいのか一目でわかるようになります。
URLの書き方とプロトコルを統一する
各ページのURLはタグで記述し、プロトコル(httpまたはhttps)は混在させないようにしましょう。URLはhttps://example.com/ のようにフルで書く必要があります。
サイトの種類
サイトの種類 | サイトマップ |
---|---|
ECサイト | XMLサイトマップ(ページタイプ別に分割) + 画像サイトマップ、必要に応じて動画サイトマップ |
ブログ | RSSフィード |
ニュースサイト | GoogleニュースサイトマップまたはRSSフィード(必要に応じてmRSS) + XMLサイトマップ(記事、カテゴリ別に分割) + 画像サイトマップ、必要に応じて動画サイトマップ |
ウェブディレクトリ | XMLサイトマップ(ページタイプ別に分割) + RSSフィード(最新情報用、カテゴリ別に分割) |
掲示板・ソーシャルサイト | XMLサイトマップ(ページタイプ別に分割) + RSSフィード(最新投稿・更新情報用、カテゴリ別に分割) |
多言語ウェブサイト | XMLサイトマップ(代替言語サイトマップまたはモバイルサイトマップ拡張機能を使用) |
百科事典 | XMLサイトマップ(画像・動画拡張機能を使用) + RSSフィード(新着記事用) |
アグリゲーター | XMLサイトマップ(画像・動画拡張機能を使用) + RSSフィード(最新情報用、カテゴリ別に分割) |
XMLサイトマップの更新頻度とタグの現状
昔はタグを使用して「このページはどのくらいの頻度で更新されるか」を検索エンジンに伝えていましたが、現在Googleはこのタグをほとんど無視しています。そのため、更新頻度をアピールしたい場合はタグを正確に書き換え、実際にコンテンツを更新し続けることが重要です。更新頻度の高いサイトなら、その頻度に合わせてサイトマップも更新すれば、クローラーがよく巡回してくれる可能性が高まります。
Googleサーチコンソール以外の管理ツール
WordPressのプラグインや、サイトマップ生成ツール、他のSEOサービスなどでもXMLサイトマップを管理できます。WordPressを使っているのであれば、Yoast SEOやAll in One SEO Packなどのプラグインが自動でサイトマップを生成してくれるため、初心者でも導入が簡単です。ただし、エラーが出たときにどのように修正すればいいかを知るために、Googleサーチコンソールのレポートは積極的に活用しましょう。
ツール名 | 説明 | プラットフォーム | 価格 |
---|---|---|---|
XML-Sitemaps.com | 最大500ページまでのウェブサイトのサイトマップを無料で作成できるオンラインツール。29 PHPスクリプトをサーバーにインストールしてサイトマップを作成することも可能。32 | Web | 無料(最大500ページまで)、有料プランあり |
Yoast SEO | WordPress用のSEOプラグイン。XMLサイトマップの作成機能も備えている。30 | WordPress | 無料プランあり、有料プランあり |
Rank Math | WordPress用のSEOプラグイン。XMLサイトマップの作成機能も備えている。30 | WordPress | 無料プランあり、有料プランあり |
XML Sitemap Generator for Google | WordPress用のXMLサイトマップ作成プラグイン。WooCommerceにも対応。33 | WordPress | 無料 |
Slickplan | 視覚的なサイトマップを作成できるツール。XMLサイトマップのエクスポートも可能。30 | Web | 有料 |
Octopus.do | 視覚的なサイトマップを作成できるツール。XMLサイトマップのエクスポートも可能。30 | Web | 無料プランあり、有料プランあり |
Screaming Frog | SEO専門家向けのウェブサイトクローラー。XMLサイトマップの作成機能も備えている。30 | デスクトップ | 無料プランあり、有料プランあり |
Inspyder Sitemap Creator | XMLサイトマップ作成ツール。29 | デスクトップ | 有料 |
Sitemap Writer Pro | XMLサイトマップ作成ツール。29 | デスクトップ | 有料 |
WriteMaps | 視覚的なサイトマップを作成できるツール。XMLサイトマップのエクスポートも可能。29 | Web | 有料 |
WonderWebWare | XMLサイトマップ作成ツール。29 | デスクトップ | 有料 |
PRO Sitemaps | XMLサイトマップの管理サービス。34 | Web | 有料 |
よくある質問とエラー対処
XMLサイトマップのファイルサイズ上限
1つのサイトマップのファイルサイズは非圧縮で50MB、URL数は50,000件が上限です。これを超える場合は分割し、サイトマップインデックスファイルを利用する必要があります。
XMLサイトマップの配置場所
基本的にはウェブサイトのルートディレクトリに置くのが最もわかりやすいです。WordPressであれば、プラグインが自動生成する場合もあるため、その場合はプラグインの仕様に従ってください。
含めるべきURLと含めない方が良いURL
インデックスさせたいページのURLだけを含めます。重複ページやリダイレクト先ページ、404エラーのページなどは除外しましょう。間違って登録しているとエラーの原因にもなります。
XMLサイトマップの更新頻度
サイトの更新頻度が高いほど、サイトマップも頻繁に更新するのがおすすめです。ただし、コンテンツがほとんど変化しない場合は、無理に更新する必要はありません。クローラーへの「更新されていない」という誤ったシグナルを防ぐためにも、実際の更新があったときだけを変更するのが理想です。
サイトマップエラーが発生した場合の対処
Googleサーチコンソールの「サイトマップ」レポートをチェックして、エラー内容を確認しましょう。典型的なエラーとしては、XML宣言が不正、URLが間違っている、ファイルのエンコーディングが不正などが挙げられます。たとえば、W3 Total Cacheなどのキャッシュプラグインを使用している場合、設定によってはサイトマップがHTMLとして出力されることがあるので注意が必要です。
もしGoogleにサイトマップがまったく認識されないなら、以下の原因が考えられます。
- robots.txtファイルでサイトマップをブロックしている
- サイトに手動対策(ペナルティ)がかかっている
- サイトマップURLが間違っている
- サーバーエラーやクロール需要の不足
これらを一つひとつ確認し、正しく修正したうえで再度送信すれば問題なくサイトマップを読み込んでもらえるはずです。
まとめ
XMLサイトマップは、ウェブサイト全体の構造を検索エンジンに効率よく伝えるための有力な手段です。近年の検索エンジンは高度化しており、サイトマップがなくてもある程度のページはクロールできるかもしれません。しかし、大規模なウェブサイトや更新頻度の高いブログなどではサイトマップを用意しておくことで、クローラーがページを発見しやすくなり、インデックスのカバレッジと正確性が高まる大きなメリットがあります。
さらに、動画や画像といった特殊なコンテンツを扱う場合でも、それぞれに対応した拡張サイトマップを用意することで、検索エンジンに詳細な情報を渡すことが可能です。サイトマップがSEOランキングを直接左右するわけではありませんが、ページの発見とインデックスの効率化は間接的に検索順位向上につながる大きな要素となります。
とはいえ、XMLサイトマップはあくまでSEO対策の一部です。良質なコンテンツを作る、ユーザーが使いやすいサイト構造を整える、被リンクを獲得するなど、総合的なSEO施策と組み合わせてこそ最大限の効果を得られます。日々のサイト運営のなかで、サイトマップの更新や管理が後回しになりがちですが、定期的にチェックしてトラブルを防ぎながら、継続的に運用していきましょう。
以上がXMLサイトマップの概要と、Googleサーチコンソールを用いた登録や管理方法、エラー対処などについての解説です。初心者の方でも理解しやすいようにできるだけ詳しく紹介しました。ウェブサイトの成長や状況に応じてサイトマップを適切に活用し、検索エンジンへのインデックスを促進することで、より良い検索パフォーマンスを目指してください。
大阪のホームページ制作会社TREVOでは、ホームページ制作に関する情報を掲載しています。最短2日で仮サイトを公開するサービスやSEO対策に特化したホームページ制作、オリジナルホームページデザイン、ライティング、リスティング広告、WEBマーケティングなどのサービスをご紹介しています。
関連の記事
- TREVOWP
- 板浪雅樹