サイトをいい感じにカスタマイズしていくためのテクニック方法をわかりやすく解説。
HTTPS化させたサイトがある日突然検索結果から消滅。
ブラウザのブックマークからは表示されても、Googleの検索結果からすべて消えてしまった。そんな恐ろしいことが起きてしまいました。
ついうっかりのミスで発生した事態ですが、対策をしっかりすれば3週間程度で検索結果に復活した事例です。
あれ!?Googleの検索結果に出ていない。
ちょっと前に無料のSSLにしてみたものの、放置していたサイトを見ようとして気づいたのですが、キーワードを入れても出てこない状態に。趣味系のサイトなので、月間のアクセス数も500程度。広告も貼っていないし、アブないコンテンツでもない。
特定の1ページだけでなく、サイト内に存在していた約20~30ページがすべて検索結果から弾かれてしまっている様子。これはおかしいということで、すぐに原因の調査にとりかかりました。
レンタルサーバー自体には問題はなかったので、やはりコンテンツの中身かキーワードかリンクの集中か、などといろいろ考えつつ、要因となりそうなものを排除していきます。
コンテンツにアダルトや残虐系のものはないし、画像フォルダ内にも怪しい画像は含まれていない。キーワードも羅列したものでもなく、むしろあまりSEOに特化していないもの。被リンクを見ても特に増えてもいない。
そのサイトについての変化は、少し前に実施したHTTPS化。このあたりに問題がありそうだ。で、ふと開いた.htaccess内の記述に問題がありました。
基本的なことなのですが、独自ドメインを取得した場合には、例えばseotech.clickで取得した場合には、
www.seotech.click
seotech.click
の2種類が取得と同時に発生します。。
いわゆるwwwのありとなしの問題です。URLの正規化とも言いますが、このどちらかに統一させることは、サイト作成の初歩とも言えます。当然URLの正規化のためにwwwなしの記述をしていた該当サイトでしたが、HTTPS化の作業の際にこのwwwなしに統一する記述をコメントアウトしてしまったようです。
.htaccessファイル内にコメントを書きたい時には、# をつけて記述します。どうも何かの勘違いから#コメントアウトしてしまっていて、設定が反映されていなかった模様。
#RewriteEngine on
#RewriteCond %{HTTP_HOST} ^seotech(例)\.click$
単純なミスでした。
この段階でwwwありとなしの同一コンテンツが2ページ存在する状態になっていました。
wwwありとなしの.htaccess内の記述をミスした上で、HTTPS化してしまったら。
ご存じのとおりHTTPS化すると、http:// と https:// の2つのURLが存在するようになります。
この時点で何も対策をしていないと、トップページだけで
http://seotech.click/index.html
http://www.seotech.click/index.html
https://seotech.click/index.html
https://www.seotech.click/index.html
の4ページも存在してしまうことに。
コンテンツのページが同じ内容で4ページもサイト内に存在するサイトは、当然のことながら極めて不自然なサイトと判断されます。
Googleの基本的な特徴として、同じ内容のページを検索結果に複数表示させることはない、ことがありますので、この点から見ても不自然なサイトと判断されてキッチリ排除されてしまった模様です。
HTTPS化した時点で、レンタルサーバー側のhttpからの転送設定をONにしていたので安心していたのですが、機能していなかったのかはっきりしていません。.htaccessファイルに記述しておけばよかったと後悔。
ここからは対策した手順です。まずは、.htaccessでwwwのありとなしを無しに統一。
次に、httpとhttpsの重複対策として、httpsへ統一。URLをしっかり1つに絞っておくことは大変重要です。
この際の.htaccessの記述は、301リダイレクトで書くこと。
RewriteRule ^(.*)$ https://seotech.click/$1 [R=301,L]
というように、R=301のリダイレクトをつけておく方が良いようです。
.htaccessの書き方は、専門に解説されているページがいくつもありますのでそちらをご覧いただくとして、ここでは転送時の301リダイレクトのみ説明します。
301リダイレクトでは、それまで存在していたページの評価がほぼ引き継がれるので、通常のコンテンツであれば、ドメインの引っ越しやページの移転などは301で記述しておく方が良いみたいです。
今回の場合は、HTTPS化する以前のページも存在していたので、すべて301リダイレクト処理をしました。重複コンテンツで存在したページの評価も引き継いでしまうのは効果が気になりましたが、結果としては元通りとなっています。
さて、その後3週間程度経過してみると、Googleの検索結果に元通り表示されていました。検索順位としては特に上がったわけでも下がったわけでもなく完全な元通りの状態です。
しかし、1ヶ月以上も検索結果から出なくなるとは、思いもしませんでした。Googleの巡回は時々回ってきていたので、細かい変化を見逃さずにチェックしているのはさすがGoogleといったところか。いや、今回はミスがあったので自業自得ではありますが、コンテンツの重複は恐ろしいなと実感しています。
ここからは、今後の対策として。
Googleが進めるAMPプロジェクト、いわゆるスマートフォンで見た時の検索結果からの高速表示化に対応して、AMPページをいくつも作っている方は多いのではないでしょうか。このページ自体、AMPに対応した記述をしています。(seotech内では、AMPに関してのいくつかテストを実施しているのですが、これはまた後日別に書く予定です。)
AMPのページを作成する際には、既存のページとの重複対策が必須となります。wwwの有無、https化後の重複対策に加えて、AMPと既存ページの重複も対策が必要です。さらにコンテンツのデザインによって複数のバージョンが存在するなら、さらに対策が。終わりなき対策が続きますね。
まずは、きっちりとコンテンツの重複対策で
<link rel="canonical" href="http://xxx.xxx/">
記述を加えておくことから。
ご覧いただいているこのページは、AMP版しか存在しないので問題ありませんが、既存のHTMLページと共存させる時にはかなり苦労が増えてしまいます。
どこからがGoogleの検索結果から弾かれてしまうのかは分かりません。ある程度の基準としては、今回起きてしまったような、同一コンテンツページが4つ存在する場合には、Googleから弾かれてしまう、いわゆるペナルティ的な扱いを受けてしまう可能性が高くなると考えてよいような気がします。
もっとも、企業サイトで色違いのみで同一商品のページが複数存在する、などの場合もあるわけでして、こうしたサイトは実際に弾かれているかというとそうでもなく、判断の難しいところでもあります。
一応念のための対策として、同コンテンツの重複には転送する方法やcannonical記述を加えるなどを行っておく方がよいのではないかと思います。
重複コンテンツを排除=順位アップというのは難しいと思われます。
また、重複コンテンツ=1位になれない というわけでもありません。
seotech内のページで SEOは被リンク本数が10本以内で決まる!!貼り方を変えれば5位以内 というページは、ニッチなキーワード「被リンク」「本数」「貼り方」で1位になっています。このページだけでなく、seotech内のページは設定したキーワードで5位以内に入っていることがかなりあるのですが、すべて重複コンテンツが存在しています。
今ご覧いただいているページ https://seotech.click/ には、https://www.seotech.click/ のページも存在しています。.htaccessの記述をしていないので当然なのですが、同一コンテンツページが2つあっても検索上位の表示は十分可能なわけです。
重複コンテンツの解消は、対策として行っておくべきことではありますが、あまり神経質になりすぎるのもよくありません。
SEOで対策するべきは、まずはコンテンツとキーワード。次の被リンクの順です。さすがに4ページも重複した場合は冒頭で書いた通り問題ですが、2ページぐらいなら放置していても問題なさそうです。
以上、重複コンテンツについて興味のある方の参考になれば幸いです。
ちなみのこのページは、3月7日に公開したものが、AMPで書いたこともあってかなり速くインデックスされました。AMPに興味のある方は、【AMPのSEO効果で検索1位!!】シンプルなHTMLの書き方のまとめ のページも参考になるかもしれません。
■このページをご覧になった方がよく見ている記事
【1ページ3MBが目安!!】WEBサイトの容量を軽量化で超SEO効果
【2秒で離脱!?】WEBページの3秒ルールがさらに短縮で高速化が最重要に
■更新履歴
2018/3/7 記事を公開しました。