Zoom と Teams の両方には、会議参加者が有効化できる魅力的な機能があります クローズドキャプションこのツールは、発言内容を自動的にライブ文字起こしすることで、セッションのフォローに役立つ貴重な視覚的支援をユーザーに提供します。
Teams と Zoom の両方は、音声認識アルゴリズムを自動で使用し、リアルタイムで音声を書き起こします。これらは完全に自動化されており、ミーティングホストの準備はほとんど必要ありません。
Zoomの字幕の精度はどのくらいですか?
Zoom'の自動クローズドキャプションは約 80% の精度.
Teamsの字幕はどれくらい正確ですか?
ユーザーはライブキャプションを有効にできます Microsoft Teams の会議中に、ビデオフィードのすぐ下に表示されます。調査によると、これらのキャプションは 85%〜90% の精度。
標準的な音声認識エンジンが失敗する場所
両方のプラットフォームは、発言内容の理解を助けるために十分な字幕品質を提供できます。ただし、ほとんどの自動音声認識システムは、話者が一般的でない単語やフレーズを使用すると失敗します。例えば、特徴的なブランド名や、別の綴りがあるあまり一般的でない名前などです。.
AI 搭載の音声認識エンジンは本質的に予測的です。用語が標準辞書に載っておらず、非公式な会話で頻繁に使用されていない場合、エンジンはセッションでそれらを予測しません。.
おすすめ記事
Netflixの加入者の80%が定期的に字幕を使用していることをご存知ですか?
エンジン最適化が品質を向上させる方法
より高度なAI搭載の字幕システムは、たとえば Interprefy Captions、重要で珍しい単語やフレーズを含めるようにカスタマイズでき、通常のエンジンが見落とすことがあります。
これは、セッションにとって重要なキーワードを含めるようにシステムをカスタマイズすることで実現されます。.
これらの用語を事前にシステムに入力することで、システムはそれらの存在を認識し、検出でき、セッション中に出現した際に正確に文字起こしします。.
以下は、音声認識システムが頻繁に見逃す用語の例です:
- 人々の名前、スピーカー、組織内の重要人物、または分野の名前
- 技術、製品、またはサービスの名前
- ブランド名
- 頭字語と略語
- 技術的表現や専門用語、業界用語などの一般的でない用語
字幕品質比較
Let's テストエンジンをすぐに試しましょう。Teams、Zoom、Interprefy で同じ発言に対する自動字幕を使用し、3つの方法を並べて比較します。.
"Bravocado."という会社を想像してください。Bravocadoは、全社タウンホールミーティングを開催し、新しいCEOであるAleks Ritchieを紹介し、最新製品FRT 420を発表する予定です。.
以下は、MS Teams、Zoom、Interprefyのオープニングコメントの文字起こしです。.
|
元のスクリプト こんにちは、Bravocadoタウンホールへようこそ。1分後に、私た’は新しいCEOのAleks Richieに会い、そして私た'はFRT 420の今後の製品発売についてお知らせします。. |
以下は、イベントに関連する重要な用語ですが、AIエンジンでは通常識別されません:
- ブラボカド
- Aleks Richie
- FRT 420
それでは、同じ発話文が正確に使用されている会議中に各プラットフォームに表示される字幕を確認しましょう。.
Microsoft Teams の字幕出力
Microsoft Teamsが最初の目的地です。上記の同じ言葉は、Microsoft Teamsの会議に参加し、自動字幕オプションをオンにした状態で、はっきりと声に出して話されました。.
これは結果です:

ご覧のとおり、Microsoft'のエンジンは理解を得るのに十分な品質を提供しましたが、3つの重要なキーワードを見逃しました。.
| 元の用語 | Teams の出力 | |
| ブラボカド | → | 虚勢 |
| Aleks Richie | → | Alex Ritchie |
| FRT-420 | → | FT-420 |
Zoom の字幕出力
それでは、Zoom の字幕機能を探ってみましょう。同じ手順で、Zoom ミーティングに参加し、Zoom の字幕をオンにし、言葉をはっきりと大声で話しました。.
これは結果です:

Zoom の結果は Teams と少し異なります。句読点や文の構造がやや不正確で、Zoom はいくつかの重要な用語も誤認識しました。.
| 元の用語 | Zoom出力 | |
| ブラボカド | → | ブラヴォアド |
| Aleks Richie | → | Alex. Ritchie |
| FRT-420 | → | Frt. 420 |
エンジン最適化によるInterprefy字幕出力
Zoom と Teams が通常の学習データに基づいて自動的に生の出力を提供するのに対し、Interprefy は音声認識エンジンを最適化することでさらに一歩進んでいます。これは、セッションに固有で極めて関連性の高いキーワードをシステムに組み込むことで実現されます。.
これは結果でした:
ご覧のとおり、エンジンが最適化された後、Interprefy's キャプションシステムによって3つの重要な用語が正確にキャプチャされました。.
要約

標準的なAIエンジンは、話されている内容の全体的な感覚を得るのに役立つ字幕を提供できます。実験では、システムが特定の用語に特別な注意を払うよう装備されていない場合、探していた3つの主要な単語すべてを見逃すことが示されました。.
"good enough" が十分であれば、ZoomやTeamsの字幕は、ユーザーに基本的な理解を助けるツールを提供する有力なオプションとなり得ます。ただし、イベントの文脈や関連性に応じて、重要なフレーズをほぼ確実に誤綴りするシステムを採用することはリスクが高い選択となります。.
Interprefy Captions のような専門的なキャプションシステムは、標準を超えて精度を向上させるのに役立ちます。そして最大の利点は、Zoom ウェビナー、Teams ミーティング、または any other meeting platform you're using に追加できることで、どこでもキャプション体験を次のレベルに引き上げられることです。.



ダウンロードリンクをもっと表示



