富山のホームページ製作会社・グリーク スタッフブログ - ブログ -
  1. グリークトップ
  2. 箸休め
  3. ブログ

googleからページを完全に削除する方法のまとめ

1

こんにちわ。

プログラマの湊です。

 

ホームページを作っているとたまに

「●○のブログを消したんだけど、まだページが見られている」

「ページを更新したのに、昔の情報が見られている」

といったお問い合わせをいただくことがあります。

 

googleなど検索エンジンがキャッシュを持っていることが一番多い原因となります。

 

検索エンジンの仕組み

googleなどのロボット検索型は世界中のサイトを巡回しており、Webページを保存(インデックスするといいます)して、

それぞれのURLやページデータといったサイト情報をサーバーに保持いたします。

一般的には数週間~1ヶ月ごとに再度ページを巡回し、最新の情報に更新をかけるのですが、

その期間、たとえ自社サーバーからデータを消したとしても、キャッシュが残ってしまい上記のような問題が起こってしまいます。

※逆を言えば、ロボットが巡回しない限り、検索結果には作ったページが表示されません。

 

検索結果からページを削除する方法

自分のサーバーのhtmlを削除する

まずはオリジナルのHTMLを削除しましょう。

googleにページを削除したことを教える

googleが提供しているウェブマスターツールの「ページの削除依頼」ツールを使います。

削除したい該当のURLを入力して送信することで、ページが削除されます。(実際に削除されるのは、通常数週間~1ヶ月程度はかかります)

screen

 

410ステータスエラーでページがなくなったことを教える

ページが無くなった際に、無くなったURLで410エラーステータスコードを送ります。

よく301リダイレクトでトップページに飛ばすやり方がありますが、これはあまりよくないらしいです。

参考:http://www.suzukikenichi.com/blog/you-should-not-301-redirect-all-non-existed-pages-to-home-page/

 

参考サイトを見ると下記の3パターンがあるらしいです。

  1. 対応するページを新規に作成し、301リダイレクトする。
  2. Not Foundページへ301リダイレクト
  3. 404または410エラーを返してページがなくなったことを伝える。

phpで対応する場合は下記のように対応致します。

 


 header("HTTP/1.1 410 Gone");
 header("Location: http://www.example.com/");
 exit;

 

 

なかなか目には見えない細かな対応ですが、SEOにも深くかかわってくるので、

しっかり対応していきましょう。

 

 

 

 

この記事を書いたスタッフ