トップへ
0

COLUMN

超がつくほど、めんどくさがりのズボラさんへ その1(画像からの文字起こしは回避したい)

  • DESIGN
  • WEB
  • PAPER
  • SUE
2018
09/26

超がつくほど、めんどくさがりのズボラさんへ、暫定第一回目。あたしの一存でシリーズ化決定。WEBや印刷業界において、資料が来てから、「うわ、これ有料レベルだ・・・」とおもうこと。案外あると思うんです。今回、テーマとして掲げたのが「画像からの文字起こし」。これは、まじ有料レベル。今回はそれを回避できる便利な方法をご紹介します!

めんどくさがり故に時短を求める

 

どうも。SUEです。
あたしはとてつもなく面倒くさがりでズボラです。
面倒くさがりなので、なるべく手間のかからない方法を日々研究しています。
正直に言ってしまえば、手間がかかること自体が嫌いなのではなく、工数に予算が見合わなくなることが嫌いです。

 

 

案件ごとに様々なクライアントさんがいるので、
もちろんかなりアナログな方法で指示・修正が飛んでくることがあります。
そんな中、暫定第一回目のテーマに掲げた

文字起こし。
これ、同業の方であれば、かなり憂鬱な作業ではないでしょうか・・・。
まぁ、テキストの長さにもよるので一概には言えませんが・・・
有料レベルちゃうかな・・・

と思うこともしばしば・・・

今回はテキスト起こしの面倒をなんとか脱出する術を見出していきたいと思います!

 

そもそもなぜ有料レベルだと思うのか?
1・テキストデータを流し込むより圧倒的に時間がかかる。

文字を見ながら打つ。単純に面倒で時間がかかります。
テキストデータを頂いている場合は任意の箇所にコピペ。体裁を整えるだけ。
一瞬ですね。
しかし!画像からの文字起こしの場合、
あっちを見てこっちを見て・・・あってるか確認。
あっちを見てこっちを見て・・・あってるか確認。

 

めんどくさい。

 
「よろしくお願いいたします」と打つのに、
あたしは「YOROSHIKUONEGAIITASIMASU」この24文字分キーボードを叩かなくてはならないわけです。

 

2・打ち間違いのリスクを回避したい

文字の変換ミスで全く違う意味になってしまったり、誤字脱字のオンパレードになってしまったり。
すくなくはありません。「確認」という作業にかなり時間がかかります。

すでに、クライアントが確認して確認して確認したテキストであっても
こちらに来たときに画像となってしまっているともう一度、確認と確認と確認が必要なわけです。

 

また、あきらかに

 

「打ち間違い」はこちらのミス。

 
たとえテキストが画像データで来たからといっても言い訳にはなりませんね。
WEBならまだしも、印刷物の場合はTHE END。
墓場行きです。補償問題にもなりかねません。
できればそのリクスは避けたいと言うのがあります。

上記のような理由であたしは文字起こしが
W杯のときだけサッカーファンになるパリピぐらい
とてもとてもとてもとても嫌いです。

 

このご時世、ARとかVRとかあるからなんとかなるだろ・・・

ケータイでポケモンが捕まえられるこのご時世。
文字ぐらい認識しろよ・・・と思い調べてみました。






あった!

 

 

どうやらこの技術は「光学文字認識(OCR)」というらしい。

光学文字認識(こうがくもじにんしき、Optical character recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)を文字コードの列に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することで機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。

うぃきぺでぃあ

 

あるやん、やっぱ。

 

よくよく調べてみると

Googleドキュメントを利用してこのOCRとやらを体感できる

らしい。
早速やってみました。

 

 

実際に使ってみる

青空文庫から独断と偏見でフランツ・カフカの「変身」の冒頭を。

 

 
この文字数・・・もし打てって言われたら、もう心が折れそう。
とりあえずはじめてみます。

まずgoogleドライブを開き

 

 

 

該当のファイルをアップロードする。
(デスクトップからドラッグ&ドロップでOKです)

 

 

アップロードした該当の画像を右クリック→アプリで開く→Googleドキュメント を選択

Googleドキュメントが立ち上がり、ものの10秒ほど待つ

 
テキストデータの完成

 

 

上部は先程アップロードした画像ですが・・・下部はテキストデータになっています。

 

君は神か。神なのか

 

 

一点、気になっていたのがルビの部分。

 

 

こちらも検索かけて調べてみましたが

文字列には組み込まれていないよう・・・

 


すげぇ・・・

 

 

どこまでできるか、勇者Googleドキュメント

まずは手始め。

 

縦書き

さっきの手順でドライブで見てみると・・・

 

 

おおおお~いけたぁ~

 

 

ルビの部分もクリア。
検証しましたが、若干、半角スペースがところどころ入っているものの、
十分実用レベル。

 

 

茶色い紙でちょっと裏写りしてる

さぁどうか・・・

 

おおおおおおお~
いけた~~~~

 

 

ルビもクリア。

 

 

画像を斜めに歪めてみました。

これは・・・

 

ああああ・・・これはちょっときつい。

 

 
ちゃんとしているように見えますが、ところどころ違う漢字になっています。
やはり、文字の形がいびつになると難しいようですね・・・

 

 

イラストが入っている

図形を間に入れても・・・

 

大丈夫!

 

 

図形に加え、マーカー・背景に座布団付き

 

これはどうだろう・・・

 

いけるんですね、わかりました。

 

 

簡単な表

すみません、なめてました、勇者Google

 

 

左右分割

これはちょっとハードル高いと思うんだけどな・・・

勇者さんごめんなさい。

 

 

 

テキストの画像

もうこれが来たら発狂するレベルでやりたくない

 

 

勇者よ、あたしをお妃にして下さい。

 

 
ここまででわかったのは、文字が鮮明であればかなりの確率でテキストが抜き出せるということ。

 

 

荒い画像にしてみた

先程のものに比べ、ぼやけて、ノイズが入ってしまってます。

 


これ行けたらほんとすぎょい
あああ、やはりここまで来るとちょっと怪しいですね・・・

 


ひらがなはかなりの精度がありますが、漢字、特に画数の多いものはきびしい・・・
要検証の上で使用する必要があります。

 

 

ラスボス

かなり不鮮明な手書き。
走り書き、クセ字、などいろんな漢字で書いてみました。


さすがに難しいですねw

 

 
文字と認識されているところもありますが、これであれば手打ちのほうが早く、正確そうです。

 

最後に

さて、いかがでしたでしょうか?

 

とてつもなく面倒な文字起こし。
Googleドライブ&ドキュメントであなたのズボラライフに光を!

 

それではまた!

OTHER COLUMN