忍者ブログ

音声認識・音声入力Windows用フリーソフト「ネコ耳エディタ」ブログ

音声認識(音声入力)するフリーソフトの「ネコの耳も借りたいエディタ」(ネコ耳エディタ)です。他のアプリへの入力も可能です。Juliuslibを同封のDLLで使用しています。 「ネコの耳も借りたいエディタ配布所」のホームページからダウンロードしてください。 コメントなどがありましたらお気軽にどうぞ。 リンク歓迎です。

ネコ耳エディタ Julius辞書の作成(その4)

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

コメント

ただいまコメントを受けつけておりません。

ネコ耳エディタ Julius辞書の作成(その4)

Julius語彙辞書(dicファイル)作成


mecab で作成したもととなる辞書を「表記語彙」と「よみかた」のみのcsvファイルにする
b201001_class.csv -> b201001hyokiyomi.csv


  hyokiyomicsv2dic.pl(拙作のperlのスクリプト、実行可能にしておく)を使用し、辞書ファイルを作成する。
b201001hyokiyomi.csv -> b201001.dic


b201001.dicはshift_jisコード、改行はLF(UNIX)に変換しておく。
b201001_sjis.dic が、windows上でjuliusに使用される。

b201001.dic -> b201001_sjis.dic


ネコ耳エディタから、「b201001_sjis.dic」と「b201001.bingram」を設定。
エラーを吐いたら、juliusのログを見て修正する。


実行テストしてみる。動く、動くぞ・・・。
しかし、音声認識の成功率はイマイチ。n-gramのデータが足りないのかもねぇ。
本家のディクテーションキットの認識率の良さに驚き。ふぅ・・・。

以上、「Baiduブログ・掲示板時間軸コーパス」をサンプルとして用いた
julius用n-gram辞書の作成手順です。

辞書の作成環境はUbuntu 13.10 (Xfce)。ネコ耳エディタの実行環境はWindowsXP。
なお、ネコ耳エディタはWindows7でも動きます。


忍者AdMax

拍手[0回]

PR

コメント

プロフィール

HN:
アナうさぎ
性別:
非公開

P R

まとめ

最新トラックバック

コガネモチ