この記事をインタープリファイドのポッドキャストにアップロードし、現在お好みのポッドキャストディレクトリで利用可能です。.
以下のポッドキャストを聴いてダウンロードしてください:
以下でダウンロード可能:
音質は一日中私たちに付き添うものです。朝ラジオをつけることから、夜遅くに新しいテレビシリーズを一気見することまで、良い音は私たちがしばしば当たり前だと思ってしまうものです。それは'通常、悪い音を見つけるのはかなり簡単ですが、良い音質は実際にはかなり複雑な問題です。良い例として、ビニール愛好家と他のオーディオ愛好家の間で、どのフォーマットが優れた音質を提供するかについての十年にわたる議論があります:CDかビニールか。.
In remote interpreting, being able to both receive and send quality audio is key. To ensure information is accurately processed and secure an enjoyable audio experience while protecting people's hearing.
音声を最優先するプラットフォームとして、私たちは常に新しい方法を模索しています スピーカーの行動に影響を与える、さらに、優れた音質を確保する革新的なオーディオソリューションを実装しています。よく議論されるテーマであるサウンド圧縮は、正しく適用すれば音声体験にプラスの影響を与えることができます。
私たちは、Interprefyのオーディオエンジニア兼シニアプロダクトマネージャー、リチャード・シラーと音声圧縮とは何か、RSIでどのように使用されているか、そして音質に何が影響するかを理解するために座談しました。
ドーラ様、再びお話しできて大変嬉しく思います。私のInterprefyでの役職はシニアプロダクトマネージャーです。製品の方向性と詳細を担当しております。また、音響エンジニアとしての訓練も受けております。もともとは、世界’最大の放送スピーチラジオ組織であるBBCワールドサービスで勤務しておりました。その経験により、明瞭さと一貫性に対して執着するようになりました。.
一貫性は大規模にラジオを機能させる鍵であり、明快さは私たちが提供した本質そのものでした。また、音楽録音やテレビでも勤務した経験があります。プロデューサー、ディレクター、プレゼンター、脚本家など、当該分野の多くの職務を経験しております。.
音声において「コンプレッション」と呼ばれるものは、全く異なる2つの概念があります。もともとは、回路(または現在ではアルゴリズム)で音量を自動的に制御するダイナミックコンプレッションがありました。これは主に、最も静かな音から最も大きな音までのダイナミックレンジ — 音量差を縮小するために使用されます。その後、ビットレート削減が登場し、保存または転送が必要なオーディオデータ量を減らすシステムとなりました。.
動的圧縮とビットレート削減は、適切に、あるいは不適切に使用できます。.
どちらでもありません。ほとんどすべてのものと同様に、これら二つの手法はうまく使用することも、悪く使用することも可能です。悪く使用すれば、決して良いとは言えませんが、いずれの圧縮形式にも本質的に悪いとする根拠は何もありません。.
ダイナミック・コンプレッションは、本質的に音量レベルを監視し、音声が大きすぎるときにボリュームノブを下げる装置を持つことに似ています。その後、音声が静かになると再びボリュームを上げます。これにより、ユーザーは大音量と小音量の両方のパッセージを同等に聞き取ることができます。本質的に、音量コントロールを下げる人間と変わりありません – そして、ダイナミック・コンプレッションは音量を減少させることに関するものであることを強調します。そのため、この名称が付けられました。.
ダイナミック・コンプレッションは音を小さくし、これはしばしば好ましくありません。そのため、事前設定されたボリュームコントロールで再び音量を上げます。コンプレッションは信号のレベルを均一化するため、2つの選択肢があります。音量を小さくして聞き取りやすくするか、音量を大きくして注目を集めるかです。ここで一旦議論から離れ、重要な点を述べさせていただきます。音が大きすぎると感じたら、音量を下げてください。常にご自身のリスニングレベルをコントロールしましょう。.
レベルだけが誤っているわけではなく、コンプレッサーの時間定数と呼ばれる要素も重要です。最後に、比率があります。この比率は過度に攻撃的に設定されがちで、これが圧縮により音声が聞き取りにくくなる最も一般的な原因です。.
最も煩わしいアプリケーションの一つは、旧式の消費者機器や一部のPCで使用されるアルゴリズムにおいて、設計が不十分な自動ゲインコントロール(AGC)回路です。AGCやノイズゲートは、ノートパソコンやその他のデバイスでデフォルトでオンになることが多く、ダイナミクスは私たちの日常に常に存在しています。設定が不適切な圧縮は、破裂音やサ行音を切り取ってしまい、音声の理解を困難にします。この現象は、特に文の最初の単語の冒頭にある硬い子音が鈍く聞こえることで認識できます。さらに、設定が不適切なAGCの別の兆候として、大きな音から静かな音へと続く際、静かな音の終わりは聞こえるものの、始まりが聞き取りにくくなることがあります。.
そこには’多くの共通点がありますが、各ケースで何が良いかを慎重に理解する必要があります。人々は音響処理されたスタジオで作られたクラシック音楽の録音から得た数値をスピーチに適用します。ある意味ではスピーチはオーケストラよりも容易ですが、ある意味では’それは難しいです。.
例えば、帯域幅の上位部は、楽器に比べて音声に対してそれほど重要ではありません。打楽器の中には、帯域幅が最重要であると主張できるものもあり、一方で音声においては滑らかさが支配すべきだという有力な議論があります。これが、録音エンジニアが人物用に別のマイクを使用し、スネアドラムやシンバル用とは異なるマイクを選択する理由です。.
一部の方々が、18kHzから20kHzの周波数が音声にとって重要だと主張されても、実際にはそうではないことは承知しています。一般的に、音声用に録音エンジニアが使用する最高級かつ最も高価なマイクロフォンは、これらの周波数に対して特に優れているわけではなく、必要とされていないのです。.
これは単なる偶然ではありません。たとえば、森の中で数メートル離れた人物の口元が直接耳に向いている状態で聞いていたとします(そして、20kHzまで聞き取れるほど若いとします)。その後、話者を見るために顔を向け、話者が横向きになると、20kHzの成分はほとんど聞こえなくなるか、かなり減少します。これらの非常に高い周波数は自然界でうまく保存されず、したがって私たちにとって重要ではありません。もしそれらが存在したら、生命は不可能になるでしょう。.
明瞭さの実現は、人々が表現するほど単純ではなく、より繊細な要素が伴います。.
ここでの課題は、二番手でも十分であるかのように聞こえてしまう可能性があることですが、実際には明瞭さを実現することは人々が表現する以上に繊細です。同等条件で比較すると、音声においては15kHzの帯域幅が10kHzより優れており、さらに6kHzよりも優れています。.
しかし、10kHzまでのフラット(スムーズ)な応答は、15kHzの不均一な応答よりも理解しやすくなります。同様に、6kHzの帯域幅で動的に過度に圧縮されていない音声は、圧縮が酷い15kHzの帯域幅よりも理解しやすくなります。.
これが意味するのは、周波数特性を保つことが重要であることはもちろん、他の要素も同様に重要であり、どれも単独で完璧にすることはできないということです。特に、スケールが上がるにつれてリターンが大幅に減少するという点が問題となります。そのため、私たちが高域に執着する傾向は、理解しやすく説明しやすいからであり、価値チェーンにおける実際の位置を反映しているわけではありません。.
15kHz以上の帯域幅は、優れたパフォーマンスを実現する包括的なプログラムの一部である必要がありますが、文字通りの意味では、優れた、容易な理解に不可欠でもなく、保証もされません。.
いいえ。一般的な運用においてダイナミックレンジ圧縮は必要ありません。とはいえ、全く使用しないわけではありません。現在、ラボで非常に魅力的な圧縮機能を適用した製品を開発中です。これはリスナー、すなわち観客、代表者、通訳者を対象に設計されています。各自が希望すればオンに、希望しなければオフにすることができます。.
適切な場所で適切な方法で技術を適用することから卓越性が生まれます。’は、各ステップでのチューニング、完璧の追求、そしてシステム全体に小さな漸進的変化を適用することを意味します。.
はい。ドーラ様、全くその通りです。そして、私はそれを解消することに非常に情熱を持っています。大きな課題は、多くのスピーカーが使用している極めて劣悪な機材と、音質を確保するために必要なことへの理解不足です。.
ほぼすべてのことと同様に、解決策はさまざまな要因に取り組むことにあります。スピーカーにはより優れたマイクロフォンを使用してもらい、マイクロフォン技術に関する知識を深め、背景ノイズやエコーにもっと注意を払ってもらう必要があります。ここで行うべき教育は多く、私たちが開始したスピーカー・ハウスキーピング・ビデオキャンペーン。
私たちはここでテクノロジーを活用することもできます。将来、あなたと私がこのトピックに戻り、テクノロジーが人々の質を向上させ、問題が生じたときに補完できる方法について話し合うことができます。.
大きな違いは、適切に設定された良好な機器と、設定が不十分な劣悪な機器との間にあります。.
はい、that’s 正しいです、ドーラ。ここでの大きな違いは、ローカルとリモートの作業間ではなく、it’s よりも、適切に構成された優れた機器と、構成が不十分な劣悪な機器との間です。ハードウェアベースのローカルシステムにおける音質に本質的な違いはありません。RSIシステムを使用する多くの会議やイベント参加者は、現場の同等機器よりも優れたマイクロフォンを持っています。より劣ったデバイスを使用して参加したいと考える方もいます。ビジネスの他のすべてと同様に、適切に管理する必要があります。.
RSIが提供するのは選択肢です。柔軟性による選択肢です。妻が妊娠したとき、雇用主である男性は、単に仕事がなくなったと告げました。幸いにも that’ s は現在違法です。RSIは、旅行を望まない、またはできない通訳者 (who don’ t want or can’ t travel) がより柔軟に働けることを意味すると考えています。妻が受けたひどい態度が好きではなく、雇用主が人々が働けるようにあらゆる手段を講じるべきだと考えるのと同様に、私たちシステム供給者も柔軟性を組み込む責任があると考えます。.
RSI ソリューションは組織にとっても柔軟です。どこでも会議やミーティングを開催でき、設定を即座に行ったり変更したりできます。最近、国際宇宙ステーションに滞在中の宇宙飛行士が世界に向けて発信できるよう支援しました。宇宙飛行士が対面で出席することを求めるのは、もちろん不合理です。.
圧縮のいずれの形態を排除するだけでは、魔法のような解決策にはなりません。ここで改めて強調いたしますが、魔法のような解決策は存在しません。包括的なソリューションの一環として、動的圧縮の不適切な使用やビットレート圧縮の低品質な使用を根本的に排除することが求められます。これは、技術を深く理解し、詳細まで把握した業界のエンジニアが必要であることを意味します。.
いいえ、it'は動的またはビットレート圧縮に対して自動的に悪いわけではありません。.
カスケード圧縮には特有の課題があり、ソリューションを設計する際には努力が必要です。'はカスケード圧縮について懸念することは非常に妥当です。なぜなら、機能させるには多大な労力が必要ですが、'は有能であれば実現可能です。そして、非常に高い品質で実現できます。例えば、ダイナミック圧縮を取り上げると、史上最高のオーディオイノベーションの二つは、カスケード型ダイナミック圧縮の活用から生まれました。.
音声評価の唯一の方法は、当社がブラインドテストと呼んでいる手法です。理想的には二重盲検テストを実施します。音声問題の検出に自信があると主張する方には、必ずブラインドテストでの評価かどうかをご確認ください。ブラインドテストとは、対象がどちらか分からないプログラムで、評価に関与しない第三者が主導するテストです。すべてのテストでは、幅広いリスナー層を活用すべきです。.
多くの人、恐らく大多数は自分の聴覚が卓越していると考えますが、実際にそうであるのは約20人に1人です。まるで私たち全員が優れたドライバーだと思っているかのようです。.
良好な音質は、細部にまで配慮し、全体的に取り組むことで実現できます。.
二元的な表現で語り、『必ず』や『決して〜でない』といった言葉に頼る人々は、私の経験上、誤りであると感じます。圧縮やその他のオーディオツールが不当な批判を受けるのを見るのは好ましくありません。これは私が特に圧縮を好むからでも、圧縮の擁護者だからでもなく、優れたサウンドは細部にまで配慮し、全体的に取り組むことで実現できると考えるからです。真の完璧主義者は二元的な枠にとらわれず、全てのツールを活用し、単純な削減に走らないのです。.
すべての音声処理は不適切に行うことも、適切に行うことも可能です。適切に行われた場合、適切な構成が使用され、効果的に適用されます。ダイナミックコンプレッションは不適切に適用されるとひどい結果になることがありますが、しかし、それは’全体的に誤っているわけではありません。正しく適用すれば、それは'驚異的な資産となります。.