OCRとは?

OCR(Optical Character Reader)とは、文字を読み取って解析し、電子テキスト化する仕組みのことをいいます。
手書きの文字も認識して電子テキスト化することができるため、手書き書類をパソコンに取り込む際の作業効率化なのに大変役立つでしょう。
また、文書だけでなく画像から文字を読み取ることもできたり、高性能なOCRだと歪んだ文字も認識して抽出することも可能です。
ここではインターネット環境さえあれば使えるオンラインOCRサービスを紹介しています。
オンラインでOCRが出来るサービス3選
早速オンラインで使えるOCRサービスを見ていきましょう。
OCRサービスの紹介にあたって、実際に使ってみた結果を掲載しています。

Free Online OCR
画像やPDFをWordドキュメントなどに変換することができるサービス。
一度テキストファイル化したあとにWordなどのドキュメントに貼り付けるのではなく、直接Wordドキュメント化することができるので、かなり使い勝手の良いサービスです。
ドキュメントファイルだけでなく、エクセルファイルにも変換することができるのでリスト化された資料の取り込みにも重宝します。
無料で利用することができ使い方もとても簡単です。
まずはFree Online OCR公式サイトにアクセスしましょう。

次に、スキャンしたいファイルをアップロードします。
ファイル選択画面では複数ファイル選択することができますが、一度に変換できるのは1ファイルまでなので注意してください。

デフォルトではENGLISH(英語)になっているので、変換元ファイルが日本語で書かれている場合は選択できる言語の中からJAPANESEを見つけ出して切り替えるようにしましょう。
ちなみにですが、日本語(JAPANESE)を選択してもアルファベット文字はしっかり認識されるので、何か理由がない限りは日本語にしておくのがおすすめです。

デフォルトではWord形式になっていますが、テキスト形式・エクセル形式も選択可能です。
![[コンバート]をクリックしてファイルを解析](http://cdn2.aprico-media.com/production/imgs/images/000/044/700/original.png?1575822239)
それぞれの設定が完了したら[コンバート]をクリックしてファイルの解析を始めます。

一番最初に提示したサンプルドキュメントの内容と比べてみるとしっかりOCRによるスキャンが成功していることがわかりますね。

lightPDF
次におすすめなのがlightPDF。
ドキュメント内の画像配置やテキストの位置(中央揃えなど)を維持したままドキュメント化することが可能です。
無料版の場合、テキストファイルにしか出力することができませんが有料プラン(月額182円~)に加入することで、画像とテキストの両方を含むPDFファイルのOCRスキャンが行えるようになります。
使い方はFree Online OCRよりもカンタンです。
まずはlightPDF公式サイトにアクセスしましょう。

ファイル追加ボタンを押してダイアログからアップロードすることも可能です。

無料版の場合、出力はテキスト形式しか選択できないので、注意してください。
最後に[変換]ボタンを押すとOCRスキャンが開始され、完了するとスキャン結果ファイルのダウンロードボタンが表示されます。

無料版でこの精度ですから十分でしょう。
Convertio
様々なファイル変換ができるConvertioですが、実はOCRスキャンサービスも提供しています。
PDFドキュメントやPNG・JPEG・BMP・TIFFなどの画像ファイルもスキャン可能で、撮影した写真の文字起こしにも大変便利でしょう。
使用する場合はまずは公式サイトにアクセスしてください。
![[ファイルを選ぶ]ボタンを押してファイルを選択するか、ドラッグアンドドロップでファイルをアップロード](http://cdn2.aprico-media.com/production/imgs/images/000/044/706/original.png?1575822254)
Dropbox・Google Driveと連携することで、各ストレージ内のファイルもスキャンできるようになるので、必要なら連携すると良いでしょう。


Converioでは文章内で使われているすべての言語を選択する必要があります。「こんにちわ。Hello」という文章解析したいのであれば日本語と英語の両方を選択しないといけないので気をつけてください。
変換するファイルのアップロードをし終わったら[認識]をクリックしてOCRスキャンを開始してください。
![[認識中]が[終了済み]に変わりダウンロードボタンが表示される](http://cdn2.aprico-media.com/production/imgs/images/000/044/709/original.png?1575822259)

文字認識間違いもまったくなかったので、かなり優秀なOCRスキャンサービスと言えるでしょう。
PDFファイルや画像ファイルをドキュメント化したい場合はぜひ使ってみてくださいね。