スポンサーサイト

--.--.-- --:--|スポンサー広告
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

DVDのグラフィック字幕(Sub字幕)を読取革命でOCRしてSRT字幕にする。 前半:字幕の抜き出しからOCRまで

2015.02.16 18:49|PC
  DVDのグラフィック字幕(Subファイル)をテキスト字幕(SRTファイル)にするには、SubRipを使用して、OCRで読取る必要がありました。しかし、このOCR作業は退屈な作業であり、苦労の割には精度も低く、2度とやりたくない作業となっています。ちなみにBlu-rayのグラフィック字幕(Supファイル)の場合は、このブログでも既に取り上げましたが、リッピングすることなく映像と一緒に閲覧可能だし、適切なソフトで動画にMux可能である。

  DVDの字幕は開発されてから時間もかなり経過しており、そろそろ歴史の化石として取り残されようとしています。しかしながら、DVDの字幕は手に入るが、Blu-rayあるいはハイビジョンのAVCHDまたは動画ファイルはあるが、字幕が手元に無い場合は、DVDの字幕を加工して使わざるを得ません。

  このような状況下におかれた時、読取革命のようなOCRソフトでグラフィック字幕をテキストに変換できないか、という疑問であり、課題でもあります。今回、種々の便利ソフトをネットで探索した結果、何とか実用に耐える方法が見つかったので紹介してみます。


1.DVDSubEditを使用して、DVD字幕の色調を変える

  DVDの字幕はSubRipというソフトで抜き出してみると下のようなグラフィック文字です。


01.jpg


  このような字体では、OCRしてもまともにテキストへは変換できません。そこで、このようなグラフィック文字の字体を変えたり、バックグラウンドをOCRに適切な白地にしてくれるソフトがDVDSubEditです。このソフトはネットでフリーウェアとしてダウンロードできます。

  早速DVDSubEditを立ち上げ、DVDのVobファイルを読み込んでみよう。下図のような画面になります。


02.jpg



  真ん中の右側の赤で囲んだ箇所の「Use IFO CLUT」を「Use automatic CLUT」に変更すると、下の画面になります。

03.jpg


  この画面の中で、CLUT(クラットと読む)とは、カラー・パレットのこと。また、記号は次の意味です。
          b’:background(背景)
          p’:pattern (模様)
          e1’:emphasis 1(強調1)
          e2’:emphasis 2(強調2)

  4個のCLUTを使って、backgroundを白地、文字を黒に調整します。このブログの場合は、b'とe1'を白、p'とe2'を黒に選択すれば、白地に黒のグラフィック文字になりました。この状態のまま、左上の「file」から「Save Subpics of all Selected SUPs as Bitmaps」をクリックすると、保存先を聞かれます。Saveすれば数百個のbmpファイルがフォルダへ保存されます。


04.jpg


  保存されたbmpファイルの字体は次のようになっています。


05.jpg




2.OCRソフト読取革命15によるグラフィック文字のOCR

  次にbmpファイルをOCRします。OCRソフトは、読取革命15の体験版を使ってみました。性能が良ければ購入したいと思います。

  ソフトと立ち上げ、「かんたんモード」を選び、「入力」をクリックすると、下の画面になります。

06.jpg


  「画像ファイル」をクリックし、bmpファイル群が入ったフォルダを選択、フォルダ内のファイル全部を選択して開きます。すると自動的に全部のbmpファイルが読み込まれ、OCRする部分も自動的にセットアップしてくれます。読み込み完了画面が下の画面です。


07.jpg



  次に、上部にある「認識」をクリックすれば自動的に全部のbmpファイルをOCRしてくれます。OCR完了画面が下の画面です。右側にOCRして生成したテキストが示されています。


<

08.jpg

 

 




  読取革命15の認識正解率は、通常のグラフィック文字で98%以上、斜体文字で50%くらいの感じです。斜体文字でなければ実用に十分に耐え得ます。

  OCRを終えると、次のステップとして少々面倒な、時間タイミングと字幕文字の結合作業が待っています。字幕が1行であれば結構簡単なのですが、字幕は次の例のように最大3行になります。


10.jpg



  このような字幕の行数のデータを含んだOCRデータの保存方法は、Excelのcsvファイルへの保存です。上の図のように、字幕間には空白行が入っています。

  以上、前半のDVDから字幕情報をリッピングし、OCRまでの作業を説明しました。後半は、OCRしたテキスト情報を時間タイミング情報と結合させて、テキスト字幕であるSRTファイルに仕立てる作業を説明したいと思います。



スポンサーサイト

コメント:

非公開コメント

10 | 2017/11 | 12
-
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 - -
カレンダー

<
>
- - - - - - -
- - 1 2 3 45
6 7 8 9 10 1112
13 14 15 16 17 1819
20 21 22 23 24 2526
27 28 29 30 - - -

全記事

Designed by 石津 花

プロフィール

洋ネコのまるちゃん

Author:洋ネコのまるちゃん
FC2ブログへようこそ!

最新記事

最新コメント

月別アーカイブ

最新トラックバック

カテゴリ

メールフォーム

名前:
メール:
件名:
本文:

検索フォーム

RSSリンクの表示

リンク

ブロとも申請フォーム

この人とブロともになる

QRコード

QR

アクセス

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。