辞書機能

辞書機能を使うと、固有名詞や専門用語の認識精度を向上させたり、 よく誤認識される読み方を正しい単語に自動修正できます。


辞書機能とは

音声認識は一般的な言葉は正確に認識しますが、以下のような言葉は誤認識されやすいです。

  • 社名や製品名(例: Surasura → スラスラ)
  • 人名(例: 田中太郎 → 田中タロウ)
  • 専門用語(例: Kubernetes → クバネティス)
  • 略語(例: API → エーピーアイ)

辞書機能では、正しい表記の単語読み方パターン(最大3つ)を 登録することで、認識精度の向上と自動修正を同時に実現します。


仕組み

登録した単語は以下の3つの場面で活用されます。

  1. 音声認識のヒント: 登録した単語をWhisperに語彙ヒントとして渡し、認識精度を向上
  2. テキスト整形時の修正: AIが辞書を参照し、読み方パターンで認識された場合は正しい単語に修正
  3. 最終置換処理: 読み方パターンがテキストに残っている場合、正しい単語に自動置換

:

  • 登録: 単語「Surasura」、読み方「スラスラ」「すらすら」
  • 話した内容: 「スラスラを起動して」
  • 出力: 「Surasuraを起動して」

辞書の登録方法

辞書設定画面
辞書設定画面

設定画面の「辞書機能」タブから、「+ 単語を追加」ボタンをクリックすると登録ダイアログが開きます。

  1. 「+ 単語を追加」をクリック
  2. 「単語(正しい表記)」に正しい表記を入力(例: Surasura)
  3. 必要に応じて「読み方パターン」を入力(例: スラスラ)
  4. 「追加」をクリック

読み方パターンは任意です。単語だけを登録しても認識ヒントとして機能します。 読み方パターンを追加すると、誤認識された場合の自動修正が有効になります。


活用例

ビジネス用途

単語読み方パターン
社名・製品名カタカナ表記、ひらがな表記など
貴社御社

技術用途

単語読み方パターン
Kubernetesクバネティス, クーベネティス
Reactリアクト
TypeScriptタイプスクリプト

日常用途

単語読み方パターン
友人の名前、地名、店名誤認識されやすい表記

インポート・エクスポート

辞書データをCSVファイルとしてエクスポート(書き出し)したり、 CSVファイルからインポート(読み込み)できます。 チーム内で同じ辞書を共有したい場合に便利です。

チームで辞書を共有する

  1. 1人が辞書を登録し、「エクスポート」ボタンからCSVファイルとして保存
  2. CSVファイルをチームメンバーに共有(Slack、メール、共有フォルダなど)
  3. メンバーが「インポート」ボタンからCSVファイルを読み込み

インポート時、既に登録済みの単語は自動的にスキップされるため、 既存の辞書データが上書きされる心配はありません。

CSVファイルの形式

CSVファイルは以下の形式です。Excel等のスプレッドシートでも編集できます。

wordreading1reading2reading3
Surasuraスラスラすらすら
Kubernetesクバネティスクーベネティス

Tips

効果的な登録のコツ

  1. 頻出する言葉を優先: よく使う言葉から登録
  2. 読み方パターンを活用: カタカナ・ひらがな両方を登録すると効果的
  3. 表記ゆれを統一: 正しい表記を単語に、バリエーションを読み方に登録

注意点

  • 登録は最大500件までです
  • 読み方パターンは1つの単語につき最大3つまで
  • 読み方パターンによる置換は完全一致で動作します