忍者ブログ

音声認識・音声入力Windows用フリーソフト「ネコ耳エディタ」ブログ

音声認識(音声入力)するフリーソフトの「ネコの耳も借りたいエディタ」(ネコ耳エディタ)です。他のアプリへの入力も可能です。Juliuslibを同封のDLLで使用しています。 「ネコの耳も借りたいエディタ配布所」のホームページからダウンロードしてください。 コメントなどがありましたらお気軽にどうぞ。 リンク歓迎です。

ネコ耳エディタ Julius辞書の作成(その1)

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

コメント

ただいまコメントを受けつけておりません。

ネコ耳エディタ Julius辞書の作成(その1)

○ネコ耳エディタ用辞書の作成計画
 
ネコ耳エディタはJuliusエンジンを用いている。よって、Juliusの辞書作成の手順に従う。
今回の目標となる辞書は2つ作成する。vocab(語彙)辞書と、n-gram辞書。
サンプルとして「Baiduブログ・掲示板時間軸コーパス」からダウンロードしてきたn-gram(n-gramと頻度のリストとなっている)を使用する。
 
手順は以下。
・palmkit用の語彙辞書の作成
・arpa形式のn-gram作成
・Julius用のn-gramバイナリ辞書の作成
・Julius用の語彙辞書の作成
 
 
○arpa形式のn-gram作成に使用するツール
 
使用するツールは「palmkit」。さらに追加の自作コマンド「ngfreq2idngram」を使用する。語彙ファイルおよび、n-gramと頻度のリストファイルから、palmkit用のidngramを出力できる。
 
「ngfreq2idngram.c」を作成するときに「text2idngram.c」を参考にしたが、理解できなかったので解読ついでに書き換えている。
自分が解読できるように書き換えただけで、機能追加などは一切行っていない。
 
(ソースはこちら。ご自由にどうぞ。)
ngfreq2idngram.c
text2idngram.c(解読用に書き換えたもの)
 
「ngfreq2idngram.c」をコンパイルするにはpalmkit のsrcフォルダに突っ込んで、makefileを書き換える。


※ソースを間違えてアップしていたので修正(11/13)さらに修正(11/15)

忍者Admax

忍者AdMax

拍手[0回]

PR

コメント

プロフィール

HN:
アナうさぎ
性別:
非公開

P R

まとめ

最新トラックバック

コガネモチ