スプレッドシートのIMPORTHTML関数とは?

Googleスプレッドシートの「IMPORTHTML関数」とは何かご存知でしょうか?IMPORTHTML関数とは、Webページにある表・リストの内容を抽出することができる関数です。Googleスプレッドシート専用の関数なので、Excelでは使用することはできません。
Webページ内の表をコピーする際に、範囲をドラッグしてコピーといった操作をすると必要のない文字列をコピーしてしまう・表をシートに貼り付けた後に整形する必要があるなどの手間がかかりますよね。そこで、IMPORTHTML関数を使用することで表の必要なデータのみを取得することができますよ。この記事では、スプレッドシートのIMPORTHTML関数の使い方をご紹介していきます。
スプレッドシートのIMPORTHTML関数の使い方
IMPORTHTML関数の数式
それでは、スプレッドシートのIMPORTHTML関数の使い方を説明していきます。IMPORTHTML関数の数式は「=IMPORTHTML(URL, クエリ, 指数)」です。第1引数のURLに"(ダブルクォーテーション)で囲んだURLを入力するか、URLが入力されているセルの指定を行います。
第2引数の「クエリ」は抽出する表・リストを指定します。表なら「table」で<table>タグの内容を抽出・リストなら「list」と入力することで<ol>タグや<ul>タグの内容を抽出することができます。
第3引数の「指数」でWebページ上にある表・リストのうち何個目の表・リストを取得するのかを選択します。注意点としては、HTMLのソースコードの順序で指定する点が挙げられます。もし指定した指数がWebページ上の順序通りのものでなかった場合は、ソースコードを確認します。Google Chromeの場合は対象のWebページを開いた状態で、「Ctrlキー+Uキー」の同時押しからソースコードの確認をしてみましょう。
IMPORTHTML関数で表を抽出する

