PHPからGoogle Play Storeの情報をスクレイピングする方法

こんにちは!ぐち(@bloguchi)です。

どうも仕事に忙殺されている感が否めない最近ですが久しぶりにWebスクレイピングを行ったのでそちらの技術メモです。

スクレイピングとは

スクレイピングとはWebサイトをタグ解析して必要な情報を取得することを言います。

公開元のサイト構成が変わると、それに合わせて修正しないといけないので付け焼き刃感はありますが、専用のAPIなどが公開されていない場合に活用することができます。

phpQuery

Google code archiveにて公開されています。こちらからどうぞ。

使い方はめちゃくちゃ簡単です。下記のようにURLへアクセスするだけスクレイピングが可能です。

<?php
require_once('phpQuery-onefile.php');
$html = file_get_contents('https://www.google.co.jp/';);
$doc = phpQuery::newDocument($html);
echo $doc["title"]->text();

Google Play Store

では、Google Play Stroreからどのように情報を取得するかといいますと、上記のURL部分をhttps://play.google.com/store/apps/details?id=【パッケージ名】&hl=jaに変更するだけです!笑

説明するようなことでもなかったかもしれませんが、まぁこういう感じです。もちろんtitle以外にもclass指定したり、idで取得したり色々なことができます。

では今回はこの辺で。