なぜ文字起こしに同じ内容が繰り返し出力されるのですか?

Wavenoteで使用している自動音声認識(ASR)システム「Whisper AI」の現時点での制限により、文字起こしに繰り返しの出力が発生することがあります。これは「Whisperハルシネーション(Whisper Hallucination)」と呼ばれる現象に起因しています[1]。

この問題はAI技術の進化とともに将来的に改善される見込みですが、現時点ではWavenote製品側のシステム問題ではなく、即時の修正は難しい状況です。ただし、将来的なアップデートで徐々に改善されることが期待されています。現在できる対策:以下の工夫によって、Whisperハルシネーションの発生をある程度抑えることができます:

  • 録音言語を1言語に限定する
  • 音楽(着信音など)の録音を避ける
  • ノイズの多い環境での録音を減らす
[1]Whisperハルシネーションとは?Whisperハルシネーションとは、音楽や環境音(例:着信音、雑音)などの背景音が影響して、文字起こし結果に単語の繰り返しなどの誤認識が生じる現象です。

この記事は役に立ちましたか。

0 人中 0 人がこの記事を気に入っています

ヘルプが必要ですか?メッセージをお送りください