辞書機能

辞書機能を使うと、固有名詞や専門用語の認識精度を向上させたり、 よく誤認識される読み方を正しい単語に自動修正できます。


辞書機能とは

音声認識は一般的な言葉は正確に認識しますが、以下のような言葉は誤認識されやすいです。

  • 社名や製品名(例: Surasura → スラスラ)
  • 人名(例: 田中太郎 → 田中タロウ)
  • 専門用語(例: Kubernetes → クバネティス)
  • 略語(例: API → エーピーアイ)

辞書機能では、正しい表記の単語読み方パターン(最大3つ)を 登録することで、認識精度の向上と自動修正を同時に実現します。


仕組み

登録した単語は以下の3つの場面で活用されます。

  1. 音声認識のヒント: 登録した単語をWhisperに語彙ヒントとして渡し、認識精度を向上
  2. テキスト整形時の修正: AIが辞書を参照し、読み方パターンで認識された場合は正しい単語に修正
  3. 最終置換処理: 読み方パターンがテキストに残っている場合、正しい単語に自動置換

:

  • 登録: 単語「Surasura」、読み方「スラスラ」「すらすら」
  • 話した内容: 「スラスラを起動して」
  • 出力: 「Surasuraを起動して」

辞書の登録方法

辞書設定画面
辞書設定画面

設定画面の「辞書機能」タブから、「+ 単語を追加」ボタンをクリックすると登録ダイアログが開きます。

  1. 「+ 単語を追加」をクリック
  2. 「単語(正しい表記)」に正しい表記を入力(例: Surasura)
  3. 必要に応じて「読み方パターン」を入力(例: スラスラ)
  4. 「追加」をクリック

読み方パターンは任意です。単語だけを登録しても認識ヒントとして機能します。 読み方パターンを追加すると、誤認識された場合の自動修正が有効になります。


活用例

ビジネス用途

単語読み方パターン
社名・製品名カタカナ表記、ひらがな表記など
貴社御社

技術用途

単語読み方パターン
Kubernetesクバネティス, クーベネティス
Reactリアクト
TypeScriptタイプスクリプト

日常用途

単語読み方パターン
友人の名前、地名、店名誤認識されやすい表記

Tips

効果的な登録のコツ

  1. 頻出する言葉を優先: よく使う言葉から登録
  2. 読み方パターンを活用: カタカナ・ひらがな両方を登録すると効果的
  3. 表記ゆれを統一: 正しい表記を単語に、バリエーションを読み方に登録

注意点

  • 登録は最大500件までです
  • 読み方パターンは1つの単語につき最大3つまで
  • 読み方パターンによる置換は完全一致で動作します