ITツール

【無料配布】大量のウェブページのMETA情報を一気に取得するGoogleスプレッドシート

google-importxml

ウェブディレクターとして活動していると、しばしば数十ページにもおよぶウェブページのMETA情報を確認しなければならない。これが結構な手間なのだ。

そんな手間をなくして、極力楽をしようというのが今回の趣旨。

Googleスプレッドシートに、「IMPORTXML」という関数を入力すると、ウェブサイトのあらゆる情報を引っ張ってきてくれる。

title、description、h1、keyword、og title、twitter card など、取得できる情報は多岐にわたる。

私が作ったテンプレートを使用すれば、ページのURLを一括で貼り付けるだけで、すべてのページのMETA情報を一網打尽にできる。

google-importxml_1

【Googleスプレッドシート】META取得テンプレート

まずは細かい理屈を抜きで、私が作ったテンプレートをご紹介する。

以下のリンクからアクセスすることができるので、ご自身で使うときはシートをコピーして使って欲しい。

使い方は簡単。A列に、META情報を知りたいページの URLを貼り付けるだけだ。テキストエディタか何かで、調べたいURLを大量にコピーして、それをペーストするだけでいい。

google-importxml

そうすれば後は、自動的にページを解析して、META情報をスプレッドシートに記入してくれる。

難点:Loadingが長引くことも

難点があるとすれば、読み込みが長くなるときがあることか。いつまで経っても「Loading...」が止まらず、時間がかかってしまうことがある。

関数を軽量化するために「ARRAYFORMULA」という関数も試したが、どうやら今回のケースでは適用できないらしい。

そのほかにはキャッシュを削除したりする方法もあるらしいが、根本的な解決にはならなかった。大人しくゆっくり待つしかないらしい。

逆に「こうすれば解決しますよ」という方法をご存知の方がいたら、ぜひTwitterまで一言リプライを飛ばしてもらえると嬉しい。

関数「IMPORTXML」とは

今回使ったのは「IMPORTXML」という関数だ。

その名の通り「XML」を「IMPORT(読み込む)」という意味の関数で、ウェブサイト上のあらゆるデータを引っ張ってくることができる。

引っ張ってこられるデータはさまざまで、代表的なものだと以下のものが挙げられる。

title =IMPORTXML(A1,"//title")
meta description =IMPORTXML(A1,"//meta[@name='description']/@content")
meta keywords =IMPORTXML(A1,"//meta[@name='keywords']/@content")
H1 =IMPORTXML(A1,"//h1")
meta og:title =IMPORTXML(A1,"//meta[@property='og:title']/@content")
meta og:description =IMPORTXML(A1,"//meta[@property='og:description']/@content")
meta og:type =IMPORTXML(A1,"//meta[@property='og:type']/@content")
meta og:url =IMPORTXML(A1,"//meta[@property='og:url']/@content")
meta og:image =IMPORTXML(A1,"//meta[@property='og:image']/@content")
meta fb:app_id =IMPORTXML(A1,"//meta[@property='fb:app_id']/@content")
meta twitter:card =IMPORTXML(A1,"//meta[@name='twitter:card']/@content")
meta twitter:site =IMPORTXML(A1,"//meta[@name='twitter:site']/@content")
meta twitter:creator =IMPORTXML(A1,"//meta[@name='twitter:creator']/@content")
meta og:site_name =IMPORTXML(A1,"//meta[@property='og:site_name']/@content")
canonical URL =IMPORTXML(A1,"//meta[@property='og:site_name']/@content")

これらの関数は、そのままコピペで使ってもらって構わない。「A1」となっている部分に、読み込みたいページのURLの入っているセルを指定してくれればOK。

開いているタブのURLを一気に取得する方法

今回のテンプレートを活用するにあたって、知っておくと便利なChrome拡張機能をご紹介。

「Copy All Urls」を使うと、Chromeでいま開いているタブのURLを一括でコピーできる。

copy-all-urls_2

調べたいページをとりあえずブワーっと開いて、それを一気にコピー。そのURLをスプレッドシートにペーストすれば、META情報をまとめて取得できる。

あとがき

有料ツールでも同様のサービスはあるが、工夫すれば無料でもさまざまな情報をバッと手に入れることができるものだ。困ったら、諦めるのではなく、まずキチンと調べてみるのが大切やね。

  • この記事を書いた人

ばんか

Webディレクターとしてサラリーマンをやりつつ、個人でブログや執筆活動をするパラレルキャリアを実施中。 ITツールを日常で活かす方法を広く伝え歩くことをミッションとした「ITツールエバンジェリスト」です。AllAboutやYahooクリエイターズプログラムでも活動中。

-ITツール
-, , ,