書籍「いちばんやさしいGoogleビジネスプロフィールの教本」

Googleドライブに保存した画像のテキストは、OCRで文字起こしができることをご存知ですか?

Google

今日のエントリーは、Googleドライブに保存した画像のテキストをOCRで文字起こしする方法を紹介します。

Googleドライブに保存した画像はOCRで文字起こしできる

Googleドライブに保存した画像はOCRで文字起こしできる

紙データを見ながら文字起こしをするには面倒ですよね?

そんなときはGoogleドライブを使えば解決します。

例えば、紙で作成されたビジネス書類の写真をGoogleドライブへアップすれば、画像内のテキストをOCRで文字起こしができるので、簡単にデータ化できます。

すごく便利な機能なのですが、結構知らないユーザーもいますので、やり方を紹介します。

GoogleドライブのOCRを使うメリット

GoogleドライブのOCRの文字認識率は高いので (個人的な感覚では98%以上の精度)、次のようなメリットがあります。

  • 紙の文書のデータ化が簡単にできる
  • 画像の中から文字を抽出できる
  • 手書きの文書もデータ化できる

これは使ってみたくなりませんか?

Googleドライブにアップできるファイル形式は?

JPEG、PNG、GIF、PDFがアップロードできます。

公式のヘルプページに詳しく載っています。

  • 形式: .JPEG、.PNG、GIF、PDF(複数ページのドキュメント)の各ファイル。
  • ファイルサイズ: ファイルは 2 MB 以下にします。
  • 解像度: テキストの高さは 10 ピクセル以上にします。
  • 向き: ドキュメントは正しい向きにします。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードします。
  • 言語: Google ドライブではドキュメントの言語は検出されません。
  • フォントと文字セット: 最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用します。
  • 画質: 明るさが均一でコントラストがはっきりしたシャープな画像が最適です。

参考 PDF や写真のファイルをテキストに変換する

Googleドライブに保存した画像のテキストをOCRで文字起こしする手順

Googleドライブに保存した画像のテキストをOCRで文字起こしする手順を紹介します。

  1. GoogleドライブにOCRで文字起こしする画像を保存する
  2. 「Googleドキュメント」で開く
  3. 「Googleドキュメント」で文字起こしされたテキストが表示される

1. GoogleドライブにOCRで文字起こしする画像を保存する

GoogleドライブにOCRで文字起こしする画像を保存してください。

GoogleドライブにOCRで文字起こしする画像を保存する

2. 「Googleドキュメント」で開く

OCRで文字起こしする画像を「Googleドキュメント」で開きます。
右クリックして「アプリを開く」→「Googleドキュメント」を選択すればOKです。

OCRで文字起こしする画像を「Googleドキュメント」で開く

3. 「Googleドキュメント」で文字起こしされたテキストが表示される

少し待っていれば、「Googleドキュメント」で文字起こしされたテキストが表示されます。

実際にGoogleドライブで文字起こしをしてみる

いくつかの画像を用意しましたので、実際にGoogleドライブで文字起こしをしていきます。
僕がやってみた感じでは、Googleドライブの文字認識率は98%以上の精度でした。

横書きの文書

よくあるビジネス文書を文字起こししてみました。

Googleドライブで横書きの文書を文字起こしする

精度や文字起こしの結果は?

ほぼ100%の精度でデータ化できました。文字起こしの結果も見てみましょう。

Googleドライブで横書きの文書を文字起こしの結果

パンプレット

パンフレットのテキストを文字起こしをします。
先日、Googleに遊びに行ったときにもらったGoogleマイビジネスのパンフレットを使って、文字起こしをしてみます。

パンフレットのテキストを文字起こし

 

精度や文字起こしの結果は?

こちらも精度は100%近いです。文字起こしの結果も見てみます。

Googleドライブでパンプレットの文書を文字起こしの結果

書籍 (縦書き)

書籍を文字起こししてみます。
書籍は縦書きのものが多く、今回の書籍は縦書きです。

Googleドライブで書籍 (縦書き)の文書を文字起こしする

精度や文字起こしの結果は?

書籍の精度も100%でした。文字起こしの結果も見てみます。

Googleドライブで書籍 (縦書き)の文書を文字起こしの結果

表のテキスト

表のテキストの場合は、自動でスプレッドシートのような表になるかも、という期待をしていましたが、文字起こしできるのはテキストだけでした。残念。

今回は請求書の画像です。

Googleドライブで表のテキストの文書を文字起こしする

精度や文字起こしの結果は?

書籍の精度は95%くらいでした。小さな文字はうまく認識していないです。文字起こしの結果も見てみます。

手書きの文書は?

手書きの文書も文字起こしをしてみました。

Googleドライブで手書きの文書を文字起こしする

精度や文字起こしの結果は?

手書きの文書も精度が高く99%くらい。文字起こしの結果も見てみます。

Googleドライブで手書きの文書を文字起こしの結果

さいごに

以上、Googleドライブに保存した画像のテキストをOCRで文字起こしする方法を紹介しました。

GoogleドライブのOCRは制度が高いので、98%くらいの文字認識率と思っていただければと思います。
Googleドライブを使えば、画像の中の文字だけでなく、紙の文書や手書きの文書も写真を撮れば文字起こしが可能です。

便利な機能なので、ぜひ使ってみてください。