The Elder Scrolls: Arena の日本語化 - 4(フォント修正 - 1)
前回
PCOTでの認識を試した結果、一部読み取りがうまくいかない部分もあるが、内容は十分把握できる精度であった。
うまく読み取れない部分はフォント変更を試みたが、下手にいじると認識が悪くなってしまう事もわかった。
また、テキストデータがあるものもわかったので、テキストデータを利用する方法もやっていくことにした。
rrryutaro.hatenablog.com
今回
テキストデータが見つからない部分で、認識がうまくいかない部分を少しずつ改善していく。
次の画面は質問形式でのキャラクター作成の際に表示される説明文。
この画面に使われるフォントを本気で使える形に修正したい。
まずとにかく気になるのは、a
とo
の違い。
人間の目で見ても判断しづらいが、右側が太いのがa
で左側が太いのがo
となっている。
これを Arena Suite に付属されているフォントエディターで修正する。(Arena Suite は Arena:Files - The Unofficial Elder Scrolls Pages (UESP) より入手可能)
修正するフォントはFONT_A.DAT
となる。
前回やっていたような修正と同じだが、a
はこれの方が良いと思う。
変更した結果がこの通り。
a
がちゃんと認識されるようになった。翻訳にも変化がみられるが、見比べると一長一短があるような気が・・・
次に気になる'
部分を変更してみる。次のように修正した。
しかしまだちゃんと読み取れず。さらに下に1ドット分増やして試してみる。
たったのこれだけの違いで、今度はちゃんと読み取ることが出来るようになった!
実際の文字は'
の所を‘
と認識されているが、これはもう問題なし。
続いてdetermine
のm
がn
となっている所や、roll
のr
がc
となっている部分。
これは他は読み取れているのと、翻訳内容はおかしくもないので、一旦置いておく。
ただ、keys
のk
がH
となっているは気になる。
k
自体の見た目も少し違和感があるので、試しに太さを無くして少し表現を変えてみた所、しっかり読み取れるようになった。
ただ、全体の文字のバランスからすると人間の目からの違和感がすごいので、幅を1ドット増やして太さを戻した所、まさかの'
の読み取りがおかしくなってしまった。
その部分については基本変化が無いはずなのに、k
の幅が1ドット増えた分少しだけ文章としての文字の位置はズレたためと思われる。
この辺はTesseractの癖みたいなものなのか。これがあるので、フォントを下手に変えるとこの画面の文章は良くても、他で認識が悪くなることも考えられる。
一応画像補正も試してみたが'
部分はうまく読み取り出来ず。ただroll
の部分は読み取れているので、先に画像補正をしっかりしてからの方がよさそう。
k
は見た目の違和感はあるがOCRの認識は良くなるので、補足したものにして他の画面も確認して行こうと思う。
場合によっては今一度トレーニングデータを作ってみる手もあるかもしれない。
Arenaのフォントでトレーニングするのではなくて、基本のフォントを変える形で試してみれば変わって来るかも。
ただ、知っている方法は数年前の手段で、今のデフォルトの言語データが色々と調整されているものだとすると、意味が無いのかもしれない。
次回
PCOTの設定を二値化を加えた状態をデフォルトにして、k
を細くしたFONT_A.DAT
のデータにて他の画面の確認を進めたい。