テストおよびレビューされた5つの無料オンラインOCRサービス

テキストに変換したいPDFドキュメント(PDF document)または画像がありますか?最近、誰かが私にメールでドキュメントを送ってくれました。私はそれを編集して修正して送り返す必要がありました。その人はデジタルコピーを見つけることができなかったので、私はそのすべてのテキストをデジタル形式にするという任務を負いました。

何時間もかけてすべてを入力し直す方法がなかったので、最終的にドキュメントの高品質な写真を撮り、一連のオンラインOCRサービスを調べて、どれが最適かを確認しました。結果。

この記事では、無料のOCR用のお気に入りのサイトをいくつか紹介します。これらのサイトのほとんどは基本的な無料サービスを提供しており、より大きな画像、複数ページのPDF(PDF)ドキュメント、さまざまな入力言語などの追加機能が必要な場合は、有料のオプションが用意されていることに注意してください。

これらのサービスのほとんどは、元のドキュメントのフォーマットと一致しないことを事前に知っておくこともお勧めします。これらは主にテキストを抽出するためのものであり、それだけです。すべてを特定のレイアウトまたは形式にする必要がある場合は、 (layout or format)OCRからすべてのテキストを取得したら、手動で行う必要があります。

さらに、テキストを取得するための最良の結果は、200〜400DPIの解像度(DPI resolution)のドキュメントから得られます。DPI画像(DPI image)が低い場合、結果はそれほど良くありません。

最後に、私(t work)がテストしたサイトの中には、機能しなかったものがたくさんありました。Googleで無料のオンラインOCRを使用すると、多数のサイトが表示されますが、上位10件の結果に含まれるサイトのいくつかは変換を完了していません。タイムアウトするものもあれば、エラーが発生するものもあり、「変換」ページでスタックするものもあるので、これらのサイトについては言及しませんでした。

各サイトについて、2つのドキュメントをテストして、出力がどの程度良好になるかを確認しました。私のテストでは、iPhone 5Sを使用して両方のドキュメントの写真を撮り、それらをWebサイトに直接アップロードして変換しました。

私がテストに使用した画像がどのように見えるかを確認したい場合は、ここにそれらを添付しました:Test1Test2。これらは、電話から取得した画像のフル解像度バージョンではないことに注意してください。サイトにアップロードするときにフル解像度の画像を使用しました。(resolution image)

OnlineOCR

OnlineOCR.netは、私のテストで非常に良い結果をもたらした、クリーンでシンプルなサイトです。私が気に入っている主な点は、あちこちに大量の広告がないことです。これは通常、この種のニッチなサービス(niche service)サイトに当てはまります。

無料のオンラインOCR

開始するには、ファイルを選択し、アップロードが完了するまで待ちます。(file and wait till)このサイトの最大アップロードサイズは100MBです。無料アカウントに登録すると、アップロードサイズの拡大、複数ページのPDF(PDFs)、さまざまな入力言語、1時間あたりのコンバージョン数の増加など、いくつかの追加機能を利用できます。

次に、入力言語(input language)を選択してから、出力形式(output format)を選択します。WordExcel、またはプレーンテキスト(Plain Text)から選択できます。[(Click)変換(Convert)]ボタンをクリックすると、ボックスの下部にダウンロードリンク(download link)とともにテキストが表示されます。

OCR出力

テキストだけが必要な場合は、ボックスからコピーして貼り付けるだけです。(copy and paste)ただし、元のドキュメントのレイアウトを維持するという驚くほど優れた機能を備えているため、 Wordドキュメント(Word document)をダウンロードすることをお勧めします。

たとえば、2回目のテストでWordドキュメント(Word document)を開いたとき、画像のように、ドキュメントに3列のテーブルが含まれていることに驚きました。

オンラインOCR出力

すべてのサイトの中で、これは群を抜いて最高でした。多くの変換を行う必要がある場合は、登録する価値があります。

完全を期すために、各サービスによって作成された出力ファイルにもリンクして、結果を自分で確認できるようにします。OnlineOCRの結果は次のとおりです:Test1DocおよびTest2Doc(Test1 Doc and Test2 Doc)

これらのWord文書をコンピューターで開くと、インターネット(Internet and editing)からのものであり、編集が無効になっていることを示すメッセージがWordに表示されることに注意してください。(Word)Wordは(Word doesn)インターネット(Internet)からのドキュメントを信頼せず、ドキュメントを表示するだけの場合は編集を有効にする必要がないため、これはまったく問題ありません。

i2OCR

かなり良い結果をもたらした別のサイトはi2OCRでし(i2OCR)た。プロセスは非常に似ています。言語とファイルを選択してから、[テキストの抽出(Extract Text)]を押します。

i2ocr

このサイトは少し時間がかかるので、ここで1、2分待つ必要があります。また、手順2(Step 2)では、プレビューで画像が正しい向きで表示されていることを確認してください。表示されていない場合は、出力として大量のジブリッシュが表示されます。どういうわけか、私のiPhoneからの画像は私のコンピューターでは縦向きモード(portrait mode)で表示されていましたが、このサイトにアップロードしたときは横向きでした。

i2ocr出力

写真編集アプリで画像を手動で開き、90度回転させてから、縦向きに回転させてから、もう一度保存する必要がありました。完了したら、下にスクロールすると、(Once)ダウンロードボタン(download button)とともにテキストのプレビューが表示されます。

このサイトは、最初のテストの出力ではかなりうまくいきましたが、列レイアウト(column layout)を使用した2番目のテストではうまくいきませんでした。i2OCRの結果は次のとおりです:Test1DocおよびTest2Doc(Test1 Doc and Test2 Doc)

FreeOCR

Free-OCR.comは画像を取得し、(Free-OCR.com)プレーンテキスト(plain text)に変換します。Word形式(Word format)にエクスポートするオプションはありません。ファイルを選択し、言語を選択して、[開始(Start)]をクリックします。

サイトは高速で、かなり迅速に出力を取得できます。リンクをクリックするだけで、(Just click)テキストファイル(text file)をコンピュータにダウンロードできます。

freeocr

以下で説明するNewOCR(NewOCR)と同様に、このサイトはドキュメント内のすべてのTを大文字にします。なぜそうなるのかわかりませんが、奇妙な理由で、このサイトとNewOCR(site and NewOCR)の両方がこれを行いました。それを変更することは大したことではありませんが、それはあなたが本当にする必要がない退屈なプロセスです。

FreeOCRの結果は次のとおりです:Test1DocおよびTest2Doc(Test1 Doc and Test2 Doc)

ABBYY FineReader Online

FineReader Onlineを使用するには、アカウントに登録する必要があります。これにより、最大10ページのOCRを15日間無料で試用できます。数ページに対して1回限りのOCR(OCR)を実行するだけでよい場合は、このサービスを使用できます。登録後、確認メールの(confirmation email)確認リンク(verify link)をクリックしてください(Make)

ファインリーダーオンライン

上部にある[認識]をクリックし、[(Recognize)アップロード(Upload)]をクリックしてファイルを選択します。言語と出力形式を選択し、下部にある[認識(Recognize)]をクリックします。このサイトのインターフェースはすっきりしていて、広告もありません。

私のテストでは、このサイトは最初のテストドキュメント(test document)からテキストを取得できましたが、 Wordドキュメント(Word doc)を開いたときは絶対に巨大だったので、もう一度やり直して、出力形式(output format)としてプレーンテキスト(Plain Text)を選択しました。

列を使用した2番目のテストでは、Word文書(Word document)が空であり、テキストも見つかりませんでした。そこで何が起こったのかはわかりませんが、単純な段落以外は処理できないようです。FineReaderの結果は次のとおりです:Test1DocおよびTest2Doc。

NewOCR

次のサイトであるNewOCR.comは問題ありませんでしたが、最初のサイトほど良くはありませんでした。まず、広告がありますが、ありがたいことに1トンではありません。最初にファイルを選択してから、[プレビュー(Preview)]ボタンをクリックします。

画像をアップロード

次に、画像を回転させて、テキストをスキャンする領域を調整できます。これは、スキャナーが接続されたコンピューターでスキャンプロセス(scanning process)がどのように機能するかとほとんど同じです。

OCR画像

ドキュメントに複数の列がある場合は、 [ページレイアウト分析( Page layout analysis)]ボタンをオンにすると、テキストが列に分割されます。OCRボタンを(OCR button)クリックし(Click)、完了するまで数秒待ってから、ページが更新されたら一番下までスクロールします。

最初のテストでは、すべてのテキストが正しく取得されましたが、何らかの理由で、ドキュメント内のすべてのTが大文字になっています。なぜそうなるのか分かりませんが、そうしました。ページ分析(page analysis)を有効にした2番目のテストでは、ほとんどのテキストが取得されましたが、レイアウトは完全にオフでした。

NewOCRの結果は次のとおりです:Test1DocおよびTest2Doc。

結論

ご覧のとおり、残念ながら、無料ではほとんどの場合、あまり良い結果が得られません。最初に言及したサイトは、すべてのテキストを認識するのに優れた機能を果たしただけでなく、元のドキュメントの形式を維持することができたため、群を抜いて最高です。

ただし、テキストだけが必要な場合は、上記のほとんどのWebサイトでそれを実行できるはずです。ご不明な点がございましたら、お気軽にコメントください。楽しみ!



About the author

こんにちは潜在的な雇用主!私は、この分野で 7 年以上の経験を持つ、経験豊富なソフトウェア エンジニアです。私は、Windows 7 アプリケーションの設計と開発の方法を知っており、プロフィールにさまざまなクールな Web サイトの推奨事項があります。私のスキルと経験は、優れたプロジェクト管理スキル、プログラミング知識、および Web 開発経験を備えた有能な人材を探している企業に最適です。



Related posts