Googleスプレッドシートで特定の文字を抽出したい
Googleスプレッドシートの表で様々なデータを管理していて、一つの文字列に色々な文字が入っている時に文字列の中から特定の文字を抽出したいと思ったことはありませんか?例えばアドレス帳から名前だけを抽出したい・メールアドレスだけを抽出したいというシーンもありますよね。
この場合は、特定の関数を使用することで特定の文字だけを抽出することができますよ。この記事では、Googleスプレッドシートで特定の文字を抽出する方法をご紹介していきます。
Googleスプレッドシートで特定の文字を抽出する方法
REGEXEXTRACT関数の使い方
特定の文字を抽出したい場合に便利な関数が「REGEXEXTRACT関数」です。REGEXEXTRACT構文は下記の通りとなります。
- =REGEXEXTRACT(テキスト, 正規表現)
「テキスト」部分はセルを参照させるか、”(ダブルクォーテーション)で対象の文字列を囲んで指定しましょう。
- =REGEXEXTRACT(A1, 正規表現)
- =REGEXEXTRACT("指定したい文字列", 正規表現)
「正規表現」は、検索する文字列を表す正規表現を”(ダブルクォーテーション)で囲んで指定する必要があります。正規表現とは、文字列のパターンを記号の組み合わせにより表現する方法です。Googleスプレッドシートにおいては「RE2構文」をサポートしており、指定した正規表現と一致する文字列がテキスト部分から抽出されるのです。正規表現の一部を下記に記します。
- .:任意の一文字
- //a/@href:0回以上の繰り返し
- +:1回以上の繰り返し
- ?:0回・1回の出現
- {n,m}:n回以上、m回以下の繰り返し
- ^●●:先頭に「●●」のある文字列
- ●●$:末尾に「●●」のある文字列
- [●]:「●」に一致する文字列、複数指定可能