竜太のテクニカルメモ

物理やへっぽこなゲーム作りについて易しく解説するよ

ユニティちゃんライセンス

このブログはユニティちゃんライセンス条項の元に提供されています

文章データから草書体文書を生成する技術

ども,竜太です,どーも.

今回は文章のデータから草書体で書かれた文章を生成する技術をご紹介します.

行書で書かれた文章は簡単に生成できる

与えられた文章データがあるとき,行書で書かれたその文章を機械で生成することは簡単にできます. 何故なら,文字一つ一つが途切れているから,別々の漢字としてデータ的に保存しておいて, 後で組み合わせて使えば,立派な行書の文章ができるからです. このため,この技術は年賀状印刷などの分野でとっくに使われています. それでは草書体の場合はどうでしょうか?

草書体の文章生成は難しい

草書体の場合文字と文字がつながっています. しかもどの文字とどの文字がつながるかでつながり方に変化が現れます. 英語でしたらそれでもたった26文字しかないから全部の組み合わせを用意することも何とかなるかもしれませんが, 優に千を超える文字がある日本語ではこれは不可能に近い対応量です. このため,従来草書体の文章を機械で生成することは不可能でした.

ディープラーニングで草書体の文章を学習させる

そこでディープラーニングで草書体の文章を学習させるとこの学習結果を使って草書体の任意の文章を生成することができるようになります. ディープラーニングはフォントで組んだ文章とそのオリジナルの草書体データのペアで行います. すると,例えば文章で『申します』などと入力すると,『申』,『し』,『ま』,『す』の文字がペアのデータから得られ, 後はこれらの文字のつながりが,ディープラーニングによって決定されます. これにより,任意の文章データからその文章の草書体で書かれた文章が生成できるようになる訳です.

機械で生成された草書体の手紙が書ける!

これにより,草書体で書かれた味わい深い手紙が機械によって自動生成できるようになります. 未来のワープロソフトの誕生です.

ここまで読んでくださって有難うございます. 何か間違い等ございましたら,ご報告いただけると幸いです^^


物理学ランキング


宇宙開発ランキング


量子力学ランキング

にほんブログ村 科学ブログ 科学情報へ
にほんブログ村

にほんブログ村 科学ブログ 最先端科学・最新科学へ