忍者ブログ

音声認識・音声入力Windows用フリーソフト「ネコ耳エディタ」ブログ

音声認識(音声入力)するフリーソフトの「ネコの耳も借りたいエディタ」(ネコ耳エディタ)です。他のアプリへの入力も可能です。Juliuslibを同封のDLLで使用しています。 「ネコの耳も借りたいエディタ配布所」のホームページからダウンロードしてください。 コメントなどがありましたらお気軽にどうぞ。 リンク歓迎です。

単語N-gram

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

コメント

ただいまコメントを受けつけておりません。

単語N-gram

○単語N-gram

統計言語モデルのひとつ。「ある文字列の中で、N個の単語の組み合わせがどの程度出現するのか」を調査する言語モデルのこと。
文字列解析(音声認識)においては、直前の(N-1)個の単語を見て次の単語を予測する。

例)
「大人の」
という文字列から単語N-gramを用いた予測は以下のようになる。

3-gramなら・・・
「大人」「の」までを見て、次にくる単語を統計から予測する。

予測される単語は
「大人の『マナー』」
「大人の『都合』」
「大人の『事情』」
・・・などが統計から選び出されてくるだろう。

2-gramなら・・・
「大人」までをみて予測する。

なお、データの規模が大きくなると、データサイズが巨大になってしまう。これを避けるため、一定の頻度以下のものを切り捨てる「枝刈り」を行いデータサイズを縮小する方法が用いられる。

また、前向きN-gramは頭から単語を見る、後ろ向きN-gramは末尾から単語を見る、ということ。
忍者Admax

忍者AdMax

拍手[0回]

PR

コメント

プロフィール

HN:
アナうさぎ
性別:
非公開

P R

まとめ

最新トラックバック

コガネモチ