読者です 読者をやめる 読者になる 読者になる

長谷川家

現代社会が生み出したモンスター

Google の OCR (Optical character recognition) 等について

下のスクリーンショットは本を一枚一枚ひきちぎり、スキャンし、ChainLP で漂白したもの。

Play ブックスならアップロードしたPDF もしくは ePub ファイルを1000冊まで管理できる。

f:id:hasegawaryouta2016:20160214134153p:plain

OCR機能の検証をしてみよう。

文字に起こしたいファイルをGoogle Driveにアップロードし、

Google ドキュメントのアプリで開くだけだ。

f:id:hasegawaryouta2016:20160214134703p:plain

OCRの精度をみていこう。

今回スキャンしたファイルの質が悪かったからか、

文字認識の精度にブレがでたが誤差の範囲だろう。

アメリカ語の方が文字認識の精度が高いに違いない。

アップロードファイル

f:id:hasegawaryouta2016:20160214135138j:plain

衛気町の人形キャラリー〈夜見のたそがれの、うっろなる群き麗の〉の、相変わらず撃 めいた灰魔さの中で、鳴はどこかぎこちなく微笑する。テいだしたものの多少ためらいがあっ て、というふうにも見えた。

「誰にも云わないって約束してくれるなら、聞かせてあげる」

「もう一人のサカキ、って:]

「サカキバラ、じゃないよ。サカキ・テルヤっていうのが、その人の名前」 「サカキ」は「賢木」、「テルャ」は「晃也」と書くのだという。ーシ也。初めて耳にす る名前だった。

「八月のクラス合宿の前にわたし、一週間ほど後見山を離れたでしょ」 「ああ:うん。家族で海の別荘、行ったんだよね」

「そのときに会ったの」

「賢木晃也、と?」

「っていうか、彼の幽霊と」

「へ?」

思わずまた首を傾げてしまった。

「幽霊って:ええと、その」 「賢木さんはね、この春に亡くなったの。死んじゃったの。だから夏にわたしが会ったのは、

 

ヘルプを見ると解像度が高く画質が良いほど精度が良いらしい。

support.google.com

次のサンプルを変換してみよう。

くたばれオタク! と呪詛が込められた文章だ。

これをどうしてもテキストに起こしたい。

 グーグルドキュメントのアプリで開く。

f:id:hasegawaryouta2016:20160214142724p:plain

 文字変換されず……。

f:id:hasegawaryouta2016:20160214142952p:plain

OCRを使うには色々と条件がいるようだ。

スマホで写真をとってOCRを使ってみよう。

Google Driveのアプリからスキャンを選ぶ。

f:id:hasegawaryouta2016:20160214150042j:plain

 

するつもりのあの枯草と海草だ。とんど眠れはしなかった。次々にシ 魔労にもかかわらず、いたずらに眼が汗えて眠れなかったのだ。こんな無人島で、どうして

生命をつないで行くことができよう、だとすればどんなみじめな死に方をしなければならな いか、などと頭では考えてみても、もう張りも力もなく、くったりとなってしまって、立ち 上る気力は出なかった。やっと洞穴からkmい出す元気を取り戻した時には、もうシ っていた。我輩はしばらく岩の間を歩き廻った。空には雲ひとつなく、ギラギラ照りっける

あたり

太陽は顔を向けることできなかった。その時だった、突然四辺が暗くなった、『。 ruさえ

|-やらそれはただの雲に遮られた時の暗さではない。我輩は振り返って見た、とこれはまた我 |-輩と太陽との間を、なにかとほうもなく巨大な不透明体がずんずん島の方に向って進んで来 るではないか。高さは二マイルばかりかと思えた。そして六、七分間というものは、すっか り太陽を隠してしまったのだ。だが山の薩などに立った時とはちがって、空気シー なる模様はないし、空もいっこう暗くなる景色はない。やがて我輩の頭の上まで来たのを見 ると、やらそれは固体物らしいのだ、し。そのシ 受けてシいている。我輩は海岸から二百ャ『 がてこの魔大な物体は徐々に下降して、ついには我輩の眼の先一マイルとは離れないところ に、しかも我輩とほとんど水平の高さにまで近づいて来た。懐中望遠鏡を取り出して見ると 傾斜になったらしいその側面を、無数の人間が昇降するその姿さえはっきり見えるではない か。ただ彼らがなにをしているのか、それはついにわからなかったが。

Ɛ ©.