スプレッドシートのIMPORTHTML関数の使い方!

スプレッドシートのIMPORTHTML関数の使い方!

Googleスプレッドシートを使用していて、Webサイトから表・リストの内容を抽出したいというケースもありますよね。ここで役に立つのが、IMPORTHTML関数です。この記事では、スプレッドシートのIMPORTHTML関数の使い方をご紹介しています。


目次[非表示]

  1. スプレッドシートのIMPORTHTML関数とは?
  2. スプレッドシートのIMPORTHTML関数の使い方

スプレッドシートのIMPORTHTML関数とは?

Googleスプレッドシートの「IMPORTHTML関数」とは何かご存知でしょうか?IMPORTHTML関数とは、Webページにある表・リストの内容を抽出することができる関数です。Googleスプレッドシート専用の関数なので、Excelでは使用することはできません。

Webページ内の表をコピーする際に、範囲をドラッグしてコピーといった操作をすると必要のない文字列をコピーしてしまう・表をシートに貼り付けた後に整形する必要があるなどの手間がかかりますよね。そこで、IMPORTHTML関数を使用することで表の必要なデータのみを取得することができますよ。この記事では、スプレッドシートのIMPORTHTML関数の使い方をご紹介していきます。

スプレッドシートのIMPORTHTML関数の使い方

IMPORTHTML関数の数式

それでは、スプレッドシートのIMPORTHTML関数の使い方を説明していきます。IMPORTHTML関数の数式は「=IMPORTHTML(URL, クエリ, 指数)」です。第1引数のURLに"(ダブルクォーテーション)で囲んだURLを入力するか、URLが入力されているセルの指定を行います。

第2引数の「クエリ」は抽出する表・リストを指定します。表なら「table」で<table>タグの内容を抽出・リストなら「list」と入力することで<ol>タグや<ul>タグの内容を抽出することができます。

第3引数の「指数」でWebページ上にある表・リストのうち何個目の表・リストを取得するのかを選択します。注意点としては、HTMLのソースコードの順序で指定する点が挙げられます。もし指定した指数がWebページ上の順序通りのものでなかった場合は、ソースコードを確認します。Google Chromeの場合は対象のWebページを開いた状態で、「Ctrlキー+Uキー」の同時押しからソースコードの確認をしてみましょう。

IMPORTHTML関数で表を抽出する

「=IMPORTHTML("https://horaro.org/rtaij/rtaijw2022","table",1)」と入力
それでは、実際にWebサイトの表を抜き出してみましょう。画像の例では「=IMPORTHTML("https://horaro.org/rtaij/rtaijw2022","table",1)」と入力することで某イベントサイトのタイムスケジュール表を抽出しています。
Webページから表を抽出できた
これで、IMPORTHTML関数を使用してWebページから表を抽出することができました。Webページからコピー&ペーストでデータをコピーしようとすると余計なデータが含まれてしまいますが、IMPORTHTML関数ならこのように表の必要なデータのみを抽出することができますよ。

関連記事