レンタルサーバーを借りてホームページを公開する場合に、まず最初に確認しておきたいwwwの有無や、CMSを利用していて重複するページが発生してしまう場合のURL正規化の手順について説明します。
www有無を統一する
まずブラウザの新規ウィンドウを2つ立ち上げ、以下のようにURLにwwwがある場合と、無い場合でサイトにアクセスして、ブラウザのURL欄を確認してみてください。
https://example.com
https://www.example.com
両方のページにアクセスすることができ、URLの表示がwww有りと無しの2つに別れている場合はSEO対策が必須となります。
どちらかのURLでアクセスできない場合は、アクセスを取りこぼしている可能性があるので、転送の設定が必要です。
どちらでアクセスしても、片方に転送されている場合は、対応の必要がありません。
例えば上記の場合、両方のURLでブラウザのURL欄の表示が違うので統一されていません。
htaccessの書き方
統一するためにはhtaccessに転送する設定を追加します。下記のURLを自分のサイトに書き換えてコピペで大丈夫です。どちらに統一するか迷うかもしれませんが、お好みで決めても特に大きな違いはありません。
www無しに統一する場合
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www\.example\.com$
RewriteRule ^(.*)$ https://example.com/$1 [R=301,L]
www有りに統一する場合
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www\.example\.com$
RewriteRule ^(.*)$ https://example.com/$1 [R=301,L]
重複ページの見つけ方
そもそも一人でサイトを管理しているならば、同じページの内容をアップすることはないかと思いますが、同一URL内での重複コンテンツはsite:コマンドでインデックスされているページを確認するか、サーチコンソールの「HTMLの改善」から探すことができます。
CMSによっては自動生成されたパラメータ付きのURLがインデックスされていたりするので注意が必要です。
また、重複ページとは別の話になりますが、ブログはカテゴリ一覧に記事の全文が表示されていると、重複コンテンツとして見られる可能性があるので、一覧のページは記事の抜粋だけを表示するようにして、「続きを読む」などのリンクで全文が表示されるような構成にするのが良いです。
重複ページのURL正規化
ドメインがひとつに統一されたら、次はページのURLを確認し、必要であれば整理するための修正が必要となります。
単純に同じ内容のページを複数投稿しているような場合には、ページを削除すれば重複は回避できますが、ほぼ同じ内容でどうしても別のURLで公開しなければならない場合には、検索エンジンにメインのページのURLを知らせる設定を行わなければなりません。
ほとんどのサイトでは対応の必要はなく、「PCとスマホでURLが分かれている」「URLパラメータでページの一部を変えている」など、対応が必要なケースは限られています。
head内のHTML記述で正規化する
検索エンジンに正規のURLを知らせるには、下記のタグを使用します。CMSを利用している場合は、動的に統一したURLを生成しなければならないので、少し難しいかもしれません。
<link rel="canonical" href="https://example.com/">
サーチコンソールで設定する
動的にページを生成している場合、URLの構造によってはサーチコンソールの「クロール>URLパラメータ」から、クローラーを制御することで重複ページのインデックスを回避することができます。
古いコンテンツを検索結果から削除する
重複したページを削除して、しばらくたってもGoogleの検索結果から消えない場合は、下記のページ(要ログイン)から削除リクエストを送ることができます。サーチコンソールのアカウントをお持ちで、所有権の確認が済んでいるページしか申請することはできません。