スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
このエントリーをはてなブックマークに追加

スキャナー使ってみた~OCRで読み取る

スキャナー買いました!

この機種です。

Canon フラッドベッドスキャナー CanoScan LiDE210 A4対応 CISセンサー 4800dpi RGB3色LED搭載 USBバスパワー対応
Canon フラッドベッドスキャナー CanoScan LiDE210 A4対応 CISセンサー 4800dpi RGB3色LED搭載 USBバスパワー対応


目的は3つ。
①書籍や手書きのノートをOCRで読み取って、
 テキスト化する
②手書きのマインドマップをPCに保存する
③「自炊」というのをやってみる

まず、①についての結果をお知らせします。


私は、本からの抜書きをたくさんするのですが、
量が多いと、手書きにしろPC入力にしろ、かなり大変です。

スキャンして、テキストデータにできたら嬉しいのです。

また、「手書きの抜書きノート」が既にたくさんあるので、
それをテキストデータ化して、加工できたらというのが希望です。


さて、まず本をスキャンしてみました。
ゲーテの詩です。

016_20110508111933.jpg

それを、OCRで読み取ると、

018_20110508111932.jpg 

すごいです!90%以上の認識率でした。
この詩はまるごと写そうと思っていたので、とてもありがたいです。

次は新聞記事です。佐々木俊尚さんの書評です。
これは普通のスキャン。

020_20110508111958.jpg


OCRで読み取ると、

021_20110508111958.jpg 

本に比べると認識率は落ちてしまいした。
70~80%といったところです。でも、まあまあです。



そして、いよいよ手書きの抜書きノートです。
公開するのは、かなり恥ずかしいのですが・・・

017_20110508111932.jpg


OCRで読み取ると、




全滅・・・
019_20110508111931.jpg


さすがに、力が抜けてしまいました。

やはり、手書きのノートはテキスト化するのは無理なようです。
字の上手な方なら、大丈夫かもしれませんが・・・


次に、
PDFにしたものをEvernoteに入れて、文字検索してみました。

新聞記事は文字検索ができました。
「佐々木俊尚」と、「強い言葉」で検索してみましたが、
どちらもばっちりです。

手書きのノートのPDFはというと、こちらも全滅。
全く検索に引っ掛かりませんでした。

残念です・・・


ところで、このスキャナですが、大変軽くて、縦置きもできる
すぐれものです。
使わないときは、PCの横のファイルたてに立てています。
机周りのスペースが狭いので、スキャンする時は、
膝の上にのせています。



このスキャナーのせいで(おかげで?)、Evernoteはプレミアム会員に
アップグレードしました。

次回は、
②手書きのマインドマップをPCに保存する
③「自炊」というのをやってみる

について、結果をお知らせします。

このエントリーをはてなブックマークに追加

コメント

コメントの投稿

管理者にだけ表示を許可する

トラックバック


この記事にトラックバックする(FC2ブログユーザー)

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。