ネコ耳エディタ

[PR]

×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
Mabinogi で「ネコ耳エディタ」常駐モードをテストする

N-gram辞書をいろいろ作って試し中。あと、baiduから作った辞書はうまく動いていないことが発覚。N-gramのエラーらしい。
まあ、本家Juliusのディクテーションキット用辞書を使ったほうが音声認識率は高いので、一旦放置。
今回は、遊びも兼ねた調査。オンラインゲーム「マビノギ」で、「ネコ耳エディタ」の常駐モードが使用できるか試してみた。

マビノギがパソコンに入っていなかったので、早速インストール。
２５歳のマイキャラを１０歳へ転生。

結論。使用できる。実用的かどうかはわからないが。
以下、スナップショット。テキストはすべて音声入力によるもの。

以上。キャラ名は秘密。
他のゲームでの調査は割愛。最近のゲームは、よくわからんのです。

追記
バグ修正で「ネコ耳エディタ」はVer 1.11 Ver 1.12となりました。

http://

[0回]
PR
ネコ耳エディタ　Julius辞書の作成（その５）

前回までで、3-gram辞書を作成したが、音声認識の精度はイマイチだった。
おなじ文章を読み上げた場合、本家のディクテーションキットの辞書を使用した場合と比べると、体感的にだが、認識精度は本家の方が数段上と言わざるを得ない。
逆に言えば、N-gramの辞書によって認識精度が変化する、と考えられる。

ということは、個人の必要な語彙ごとにまとめたN-gramを作成することも考えられる。
例えば、
・分野と使用頻度を分けた語彙（約６万まで）を用意する。
・語彙は品詞ごとに分けておく。
・個人の必要な語彙のグループを選ぶ。
・語彙をもとにN-gram辞書を作成する。

※なお、Juliusは現在のところ、語彙を約６万以上にすると動作が不安定になるなど、あまりいいことはないし、同じ発音の語彙が増えすぎても認識精度が下がる可能性が高い。

（語彙のグループ例）
基本語彙（名詞・動詞・形容詞・助詞など）レベル１
基本語彙（名詞・動詞・形容詞・助詞など）レベル２
基本語彙（名詞・動詞・形容詞・助詞など）レベル３

追加動詞レベル１
追加形容詞レベル１

２０１３年追加名詞レベル１
・・・
※とくに名詞は入れ替えが必要となる率は高いだろう。

語彙をもとにN-gram辞書を作成するとき、品詞ごとに、たとえば、「名詞」＋「助詞」のN-gram辞書をperlスクリプトなどで自動作成してもよいだろう。
「私」＋「は」
「私」＋「が」
「私」＋「の」
「私」＋「と」
・・・

「形容詞」＋「名詞」なども考えられる。

この考えの先に、N-gramに品詞を加えるという手法もあるが、特許がからんでくる可能性があるため、特許が切れるまで（現在の日本の法律では２０年！）勝手に使えない・・・。というようなことが起こるので、プログラムの世界ではGPLライセンスやコピーレフトというものも出来てる。

音声認識用の辞書について話を戻すが、使用目的によっては、辞書を切り替えることで、認識精度が上げられる余地があるかもしれない、とも考えられる。
ここで言う使用目的とは、
・医療分野での電子カルテ（医師・看護師・薬剤師・その他の技師）や調剤録（薬局）への入力
・工場や特定の職場における業務日報のコンピュータ入力など、それほど多くの言い回し・語彙を必要としない分野
などがとりあえずはあげられるだろう。
加えて、これら業務では、外部ネットワークにデータが漏れないような環境をつくる必要もある。

さて、本題。
「Baiduブログ・掲示板時間軸コーパス」で語彙辞書とN-gram辞書を作成したが、精度はイマイチだった。
2-gramで同様のN-gram辞書を作成すると2-gramの数は3-gramの時と比べてかなり増加する。
そこで、同様の手順でb201001.2gmでN-gram辞書を作成してみた。（b201001_2gram.bingram）

うむ。3-gramで作成したときとさほど変わらない認識率の悪さ。Juliusのログを見ると、N-gramに辞書に登録されていない語彙（未知語として扱われる）もたくさんあるな、という結果。
使える辞書を作るのは難しそうだ・・・。

http://

[0回]
ネコ耳エディタ　Julius辞書の作成（その４）

Julius語彙辞書（dicファイル）作成

mecab で作成したもととなる辞書を「表記語彙」と「よみかた」のみのcsvファイルにする
b201001_class.csv -> b201001hyokiyomi.csv

hyokiyomicsv2dic.pl(拙作のperlのスクリプト、実行可能にしておく)を使用し、辞書ファイルを作成する。
b201001hyokiyomi.csv -> b201001.dic

b201001.dicはshift_jisコード、改行はLF(UNIX)に変換しておく。
b201001_sjis.dic が、windows上でjuliusに使用される。

b201001.dic -> b201001_sjis.dic

ネコ耳エディタから、「b201001_sjis.dic」と「b201001.bingram」を設定。
エラーを吐いたら、juliusのログを見て修正する。

実行テストしてみる。動く、動くぞ・・・。
しかし、音声認識の成功率はイマイチ。n-gramのデータが足りないのかもねぇ。
本家のディクテーションキットの認識率の良さに驚き。ふぅ・・・。

以上、「Baiduブログ・掲示板時間軸コーパス」をサンプルとして用いた
julius用n-gram辞書の作成手順です。

辞書の作成環境はUbuntu 13.10 (Xfce)。ネコ耳エディタの実行環境はWindowsXP。
なお、ネコ耳エディタはWindows7でも動きます。

http://

[0回]
ネコ耳エディタ　Julius辞書の作成（その３）

Julius用のn-gram 辞書（bingram）を作成する。

b201001.vocaを語彙リストとして使用する。

「2010-01.3gm」と「b201001.voca」から
拙作「ngfreq2idngram」を使用してpalmkit用のidngramを作る。逆順コーパスのidngram も同時に作っておく
「2010-01.3gm」はeuc-jpに変換しておく。

各idngramは、「3grambin.out」、「3grambin_rev.out」として出力する

./ngfreq2idngram -vocab b201001.voca -n 3 2010-01.3gm 3grambin.out
./ngfreq2idngram -vocab b201001.voca -n 3 -rev_ngram 2010-01.3gm 3grambin_rev.out
で出力できる。

palmkitの「idngram2lm」を使用してarpa形式のファイルを作成する
b201001arpa.arpa(forward)
b201001_rev_arpa.arpa(backward)

上記２ファイルより、juliusのmkbingramを使用して、b201001.bingramを作成する。

http://

[0回]
ネコ耳エディタ　Julius辞書の作成（その２）

「Baiduブログ・掲示板時間軸コーパス」からpalmkitで用いる語彙辞書（語彙リスト）を作成する。

手順
半角文字、記号などをリストから削除する。
2010_01.1gm -> 1gram_list.txt

頻度（数字）を消す。
1gram_list.csvはeuc-jpで保存する
1gram_list.txt ->1gram_list.csv

mecab で品詞や読みのデータを追加する
1gram_list.csv -> 1gram_mecab.txt

EOS など不要なものを取り除く
sakuraエディタなら「編集」→「整形」の機能を使う
1gram_mecab.txt -> 1gram_mecab_seikei.txt

加工しやすいように、csvで保存
LibreOffice Calc などを使用する
1gram_mecab_seikei.txt -> 1gram_class_source.csv

読みがながついているもののみをピックアップし、n-gramを作成するための辞書の元とする
1gram_class_source.csv -> b201001_class.csv

n-gramを作成するための語彙リストを作る
b201001_class.csv -> b201001_base_voca.csv

単語が重複したものは、削除しておく
<s>および</s>を追加しておく（文境界マーク）。
未知語トークン<UNK>は追加しない。

b201001_base.voca -> b201001.voca

b201001.vocaを語彙リストとして使用する。
また、b201001_class.csvもJulius辞書作成時に使用する。

http://

[0回]