略称の「PuSH(プッシュ)」というとかなりピンと来るんじゃないかと思います。
PubSubHubbubと書いて「パブサブハブバブ」と読みます。そのまんまですね。
舌を噛みそうな名前とは裏腹に効力は極めて高く、Googleも推奨しているんだとか。
機能は基本的にたった1つですが、これが大量の副次的な恩恵をもたらしてくれます。
検索エンジンのクローラを自分のサイトに”呼べる”サービス
PubSubHubbub、長いので「PuSH」と呼称しますが、このサービスはHub(ハブ)と呼ばれるサーバーに自身のウェブサイトを登録することで利用できます。
このHubは、登録されたウェブサイトに対し定期的に更新を確認する役割を持ちます。
それだけでなく、こちらからHubに対し更新を知らせることもできます。
そしてHubがウェブサイトの更新を検知すると、Hubはただちに検索エンジンにそのことを伝えます。
つまり検索エンジン向けのプッシュ通知みたいなもので、これを使うと記事を投稿した瞬間に検索エンジンにインデックスさせることが可能になります。
「記事出来たからインデックスしに来て」と、こちらからクローラーを呼ぶことができるサービスというわけです。
普通ならクローラが定期巡回に来るのを待つ必要があるため、公開されてからインデックスされる(=検索結果に出てくるようになる)までにタイムラグが発生します。
これがほぼゼロになります。
RSSリーダーからのリクエストも代理で処理してくれる
PuSHが持つデータは「更新情報」です。これを求めるのは検索エンジンだけではありません、RSSリーダーもそうです。
多くのサイトが自分でRSSを配信していると思いますが、規模が膨らんだりコンテンツ量が増えた結果購読者が増加すると、全てのRSSリーダーから「更新ある?」と問合わせが来た時に結構な負荷になる可能性があります。
特にRSSリーダーは一定間隔で「更新ある?」を繰り返し確認するので、影響は大きいかもしれません。
そこで、ブログやサイトのコンテンツを配信する「ウェブサーバー」とクライアントとなる「RSSリーダー」とのやり取りの間にPuSHのサーバー(Hub)を割り込ませます。
するとRSSリーダーの「更新ある?」確認(リクエスト)はPuSHで処理されます。
更新情報をウェブサーバーから直接配信するんじゃなくて、PuSHに持たせておいて必要に応じてPuSHから配信させるような感じです。
このあたりの説明はこちらに詳しく載っています。
実はこのサイト「テクノロジー観測所」もPuSHプラグインをインストールしてから数日経つのですが、確かに記事を書いて「公開」ボタンを押した次の瞬間にはもうfeedlyに新しいフィードが登録されていることを確認しています。
セキュリティ対策としても有効になる理由
公開した記事が即座に検索エンジンにインデックスされると、いわゆる「パクリページ」への対策になります。
スクレイピングなどの手法を使う悪質なユーザー(bot)によって自分のウェブコンテンツがソースコード丸ごと無断でコピーされ、そのユーザーのサイトなどで公開されたとします。
万が一クローリングのタイミングがずれてコピーコンテンツのほうが先にインデックスされてしまうと、オリジナルであるはずのこちら側がペナルティを受ける可能性もあります。
その結果コピーコンテンツのほうが検索順位が高いなんてことになったら目も当てられません。
こうしたトラブルを防ぐ意味でも、投稿した記事を即座にインデックスできるPuSHは有効です。
WordPressならプラグインを入れるだけ
直接ダウンロードする場合はこちら。
インストールして有効化すると、ダッシュボードメニューの「設定」の中に「WebSub/PubSubHubbub」が追加されます。
設定項目はハブの登録だけ。もちろんデフォルトで登録されているので基本的にはいじる必要がありません。
とっても簡単なプラグインです。
コメント