[目次]

リンク

Zoom会議のノイズ抑制(ノイズキャンセリング)設定方法!バックグラウンドの雑音を除去 | AutoWorker〜Google Apps Script(GAS)とSikuliで始める業務改善入門
オリジナル サウンドを保持するオプションを有効にする – Zoom サポート

[Zoom]と[ZOOM]

  • このサイトでは[Zoom]と表記したら、遠隔会議ウェブサービスのことです。
  • このサイトでは[ZOOM]と表記したら、レコーダーやオーディオインターフェイスをつくっている音響メーカーのことです。

インターネット関係の用語

【ローカルの原義】=[相対的に手前のハードウェア/環境]

  • 相対的に手前にあるハードウェア/環境が[ローカル]です。
  • 相対的に手の内にあり、直接手で操作できるハードウェア/環境が[ローカル]です。

【回線の手前】がローカル|この[ローカル]の対義語は[リモート]

  • [ローカルの端末]←回線→[リモートのハードウェアやソフトウェア]
    • [リモートの〔遠隔操作される〕ハードウェアやソフトウェア]として、ドローン、PC、カメラ、ロボットアームなどがある。

【生きた回線の手前】がローカル|この[ローカル]の同義語は[オフライン]、対義語は[オンライン]

  • [オフライン]とは、[生きた回線と切断された状態]のことです。
    • [オフライン]は、[インターネット回線と切断された状態]を意味することがある。
    • [オフライン]は、[LAN〔ローカル・エリア・ネットワーク〕=組織内回線と切断された状態]を意味することがある。
  • [オンライン]とは、[生きた回線と接続された状態]のことです。
  • とくにサーバーの所在領域において、[ローカル]に近い意味になるのが[オンプレミス]という言い回しです。 自社内に[LAN〔ローカル・エリア・ネットワーク〕=組織内回線]を構築して、自社内にサーバーを設置している場合、これを[オンプレミスのサーバー]といいます。 [オンプレミスのサーバー]の対義語は、[クラウド]または[クラウドのサーバー]です。
  • とくにサーバーの所在領域において、[リモート]に近い意味になるのが[クラウド]という言い回しです。 [クラウド]はインターネット回線の向こう側にある[他者が管理しているリモートのサーバー]といったような意味です。

【影響の範囲が狭い/手の内】ローカル|この場合の[ローカル]の対義語は[グローバル]

  • [ローカル変数]←→[グローバル変数]
    • プログラミング言語で、特定範囲内でのみ有効な変数が[ローカル変数]です。
    • プログラミング言語で、広い範囲で有効な変数が[グローバル変数]です。
  • 一般的な[グローバル〔全地球規模の〕]の対義語は[ドメスティック〔国内の/家庭内の〕]です。

ノイズリダクション〔Noise Reduction:NR:雑音低減〕のタイプ分け

  • ノイズゲート〔微小音声の門前払い〕
    • アナログ電子回路を使ったハードウェアノイズゲート〔音声処理用ノイズゲート、エレキギター用ノイズゲートなど〕
    • ソフトウェアによる算術的ノイズゲート
      • 端末のCPUでのソフトウェアによる算術的ノイズゲート〔OBS Studioのプラグインなど〕
      • 外付け機器のCPUでのソフトウェアによる算術的ノイズゲート〔オーディオインターフェイスに内蔵されたノイズゲートなど〕
  • ソフトウェアによる算術的ノイズリダクション

Software noise cancelling

Noise Reduction

Zoomその他のアプリにおける[ノイズ自動除去]の発想は、以下のようなものです。

ノイズを含んだ収録音声を、そのままデジタル化する。そのデジタル信号の中のノイズ成分を、端末のCPUによる演算によって取り除く。

他方、音響機器的な[ノイズ自動除去]の発想は、以下のようなものです。

オーディオインターフェイスよりも前段で、または、オーディオインターフェイスの中で、
【ノイズゲート】を使って、ノイズ以外の信号だけを漉し採る。
そのノイズ成分が少ない[上澄み]だけを[PC/Mac][スマートフォン/タブレット]などの端末に送る。

そもそもZoomは音質が悪く設計されている

  • Zoomは、通常のビジネスミーティングだけでなく、多人数を招待するウェビナー〔=ウェブセミナー〕の開催をも前提としており、[多人数を招待する]というメリットと引き換えにして[音質が悪い]というデメリットを引き受けたかたちだと思われます。
  • Zoomの世界観は、[発言者の音質をよくする]よりも、[Zoomに慣れていない参加者の端末から、余計なノイズが混入するのを防止する]ことのほうが、優先順位や価値が高いと判断する世界観だと思われます。
  • Zoomの世界観は、ミーティングへの参加者は、Zoomに慣れていない参加者が多数派であるから、あらかじめ[音量自動調整][ノイズ自動除去]をONにしておき、Zoomに慣れていない参加者が他者に迷惑をかけないようにする、という父権主義的〔パターナリスティック〕な世界観だと思われます。
  • Zoomの世界観は、ミーティングが成立するだけのギリギリの低音質に留め、[参加者が増えてもミーティングが落ちない]ということを優先する世界観だと思われます。
  • Zoomの世界観は、ミーティングのアーカイブの音質がよくなることは、はなっから念頭にない、という世界観だと思われます。
  • 実際、Zoomの[ノイズ自動除去]は、サンプリングレートが低く、[ノイズ自動除去]が機能すると、音質が極度に悪化します。

[Zoomを介した生配信のアーカイブ動画]の低音質・音声寸断|原因追求|どんな音声なのか?

  • 《1》[語り始め][語り終わり]の音声が消えている。
    • [Zoomが定めた音声処理の1単位]があるものと推定される。 それは例えば、[パケット数などで制限された数秒単位の音声グループ]である。
    • [パケット数などで制限された数秒単位の音声グループの前後の継ぎ目]において、おそらくは[プチ・プチという継ぎ目のノイズ]が発生しているのだろう。 その[プチ・プチという継ぎ目のノイズ]を演算によってミュートすることによって、[語り始め][語り終わり]の音声が消える、いいかえれば、音声が途切れる。
    • この音声の途切れが、語りの内容のキーワードと重なり、[語っている言葉が聞き取れない部分][何を語っているのかわからない部分]が、ところどころに発生している。
    • Zoomを介する必然性がない場合には、Zoomを介さずに、カメラやPC/Macで直接録画した動画ファイルを、無編集でVimeo等にアップロードしたほうがいいであろう。
    • ※ちなみに、最近の動画では、近所から[びっくりするような大きな雑音]が飛び込んでくることがあり、その雑音のせいで[語っている言葉が聞き取れない部分]が、ところどころに発生しています。
  • 《2》[語り始め][語り終わり]の音声において、[音声言語がゆっくり再生になる][音声言語が早回し再生になる]といった音声の乱れを見せる。
  • 《3》[Zoomでノイズキャンセリングされた音声]は、シュワシュワ・キュルキュルという雑音をともなった、Zoom独特の聞き取りづらい音声になっている。 この音声は、1990年代のICレコーダーの低音質モードの音声と、かなり似ている。

[Zoomを介した生配信のアーカイブ動画]の低音質・音声寸断|原因追求|Zoomの設定がマズい可能性

Zoom「音量自動調整」「背景雑音の抑制」はOFFと無効化が良いかも|ノダタケオ(ライブメディアクリエイター)|note

[PC/MacのZoomクライアント]にログインした状態で[マイク音量を自動調整します]の【✓=チェックマーク】をクリックしてOFFにする

【0】[Zoomクライアントにログイン]→
【1】[新規ミーティング]→
【2】[画面左下の【オーディオに接続】付近の【^の記号】]→
【3】[オーディオ設定...]→
【4】[🎧オーディオ]の中の[マイク音量を自動調整します]の【✓チェックマーク】をクリックしてOFFにする。

[PC/MacのZoomクライアント]にログインした状態で[音楽とプロフェショナル オーディオ ミーティング内オプションを表示して「オリジナル サウンド」を有効にします]の【✓=チェックマーク】をクリックしてONにする

【0】[Zoomクライアントにログイン]→
【1】[新規ミーティング]→
【2】[画面左下の【オーディオに接続】付近の【^の記号】]→
【3】[オーディオ設定...]→
【4】[🎧オーディオ]の中の[音楽とプロフェショナル オーディオ]の
        [音楽とプロフェショナル オーディオ ミーティング内オプションを表示して「オリジナル サウンド」を有効にします]
        の【✓=チェックマーク】をクリックしてONにする。
        ONにした状態で、次のようにします。
        【高忠実度音楽モード|⚠高負荷注意】は【✓=チェックマーク】をクリックしてOFFにする。CPUが強力な端末ならONにする。
        【エコー除去】は【✓=チェックマーク】をクリックしてOFFにする。
        【ステレオ オーディオ|⚠高負荷注意】は【✓=チェックマーク】をクリックしてOFFにする。ステレオで生配信する必要がなければONにしない。

[PC/MacのZoomクライアント]にログインした状態で[背景雑音を抑制を低(かすかな背景雑音)]にする

[音楽とプロフェショナル オーディオ ミーティング内オプションを表示して「オリジナル サウンド」を有効にします]がONならば、この項目の設定は無力化されるかもしれません。

【0】[Zoomクライアントにログイン]→
【1】[新規ミーティング]→
【2】[画面左下の【オーディオに接続】付近の【^の記号】]→
【3】[オーディオ設定...]→
【4】[🎧オーディオ]の中の[【背景雑音を抑制】を【低(かすかな背景雑音)】]にする。
        将来もしも[【背景雑音を抑制】を【切】]が創設されたら【切】にする。

[Zoomを介した生配信のアーカイブ動画]の低音質・音声寸断|原因追求|使用中のMacBookが非力である可能性もある

使用中のMacBookが非力である可能性もある|ノートPC〔MacBookシリーズ〕で生配信をするのは無理があるかもしれません

電源系が強力であればあるほど、CPU・GPU・エンコーダー・デコーダーなどの演算能力は[高い][安定する]という傾向があります。

CPU・GPU・エンコーダー・デコーダーなど、それぞれのチップには、定格電力があり、その定格電力の値が大きいほど、演算能力は[高い][安定する]という傾向があります。

Intelプロセッサーでいえば、同世代のCore i7でも、[ノートPC用のCPU]の演算能力は、[デスクトップPC用のCPU]の演算能力を下回るのがふつうです。

  • デスクトップPC用のCore i7は、かなり演算能力が高い。
  • ノートPC用のCore i7は、Core i7の割に演算能力が低い。

CPUの演算能力が[高い][安定する]という状態にするためには、デスクトップPCを使ったほうが無難でしょう。 デスクトップPCは、AC電源を使うので、電力をふんだんに使えることから、それぞれのチップの定格電力が高く設定されているので、それらのチップがもつ演算能力は[高い][安定する]ということが期待できるからです。

使用中のMacBookが非力である可能性もある|Appleシリコン〔M1、M2など〕を搭載したmacOS機は演算能力が強化されています

Appleシリコン〔M1、M2など〕は、[Apple M1チップ〔無印〕]だけを例外として、【メディアエンジン】という【ハードエンコーダー】を搭載しています。

[Apple M1 Ultraチップ][Apple M1 Maxチップ][Apple M1 Proチップ][Apple M2チップ〔無印〕]のどれかなら、【メディアエンジン】という【ハードエンコーダー】を搭載しています。

【メディアエンジン】という【ハードエンコーダー】を搭載しているMacBookシリーズ、あるいは、Mac Studioに乗り換える、という方法もあります。 ただし、Apple製品は割高であり、何よりも使用中のMacBookがもったいないともいえます。

とはいえ、Appleシリコンが登場する前の[Intelプロセッサーを搭載したmacOS機]は、旧世代の機種です。 したがって、演算能力が不足している可能性もあります。

使用中のMacBookを生かしながら、Windows機を導入する手もあります。 しかしWindowsに苦手意識がある場合には、この方法は使えません。

[Zoomを介した生配信のアーカイブ動画]の低音質・音声寸断|原因追求|静止画表示だけの音声中心の動画なら、音質は比較的安定している

[動画を伝送する]ときは帯域幅を多く消費する|[音声を伝送する]ときは帯域幅を少なく消費する

インターネット回線の帯域幅とは、[秒間最大流量]=[1秒間に何ビット送受信できるかの最大値]のことだと思います。

  • 《1》[音声だけのファイル]:ファイルサイズが比較的小さい。
  • 《1》[音声だけのファイル]+《2》[映像=動画だけのファイル]:ファイルサイズが巨大になりがち。
  • [動画を伝送する]:帯域幅を多く消費する。単位時間あたり、大量のデータを流す必要があるから。
  • [音声を伝送する]:帯域幅を少なく消費する。単位時間あたり、少量のデータしか流さなくていいから。
  • [秒間最大流量]を、[映像=動画]に大きく割り振るのか、[音声]に大きく割り振るのか。 その配合割合によって、[映像=動画がそこそこで、音声が不明瞭][映像=動画は不明瞭だけれども、音声が明瞭]など、異なる結果を生みます。
  • [資源を何にどれだけ割り振るか]、いいかえれば、資源配分〔resource allocation:リソース・アロケイション〕を考える必要があります。 語りを中心とする動画コンテンツにおいて、コア〔中心軸〕となる部分は、もちろん音声言語です。 場面によって、資源配分の最適値は変わってきますけれども、[顔出し]=[動画]のせいで[音質]が低下するのであれば、[顔出し]=[動画]はカットするのが正解でしょう。
  • [顔出し]=[動画]をしても[高音質]が確保できるやり方は、[QuickTime Player]または[OBS Studio]を使って、インターネット回線とは関係のない状態で[画面キャプチャー]=[録画]した結果である動画ファイルを、無編集のままアップロード〔撮って出しに〕する、というやり方です。 収録した動画ファイルを、無編集のままアップロード〔撮って出しに〕するだけなら、手間はかかりません。

結局、[自宅のインターネット環境の速さ・安定性][自宅からプロバイダーまでの回線の混み具合][プロバイダーから先の回線の混み具合]などが、生配信の動画のアーカイブの[音質・画質]を決定づけてしまう。 しかもZoomでは、[エコー キャンセレーション][オーディオ向上機能][ビデオ アクセラレーション]など、[音質低下][音声の途切れ][映像の乱れ][PC/Macにかかる高負荷]を招く[ありがた迷惑な便利機能]が、初期値〔デフォルト値〕でONにされています。 こういう綱渡りのようなことをして、[Zoomを介した生配信のアーカイブ動画]を[完成品の動画]とする。 このやり方では、[完成品の動画]の音質が向上するはずもありません。

  • [エコー キャンセレーション][オーディオ向上機能]は、CPUを使った膨大な演算処理を必要とするらしいので、Windowsでいえば、最新版である第12世代の[Intel Core i7]以上を搭載したデスクトップPCを使用して初めて、その効果が出るような機能であるようです。 CPUの製造元が、[Intel][AMD][Apple]でも、新しいCPUほど[多コア化]による分散処理が強力かつ巧みになっていきます。 [エコー キャンセレーション][オーディオ向上機能]は、[多コア化]が進んだ最新のCPUを搭載したPC/Macでないと、処理が重荷になって〔過負荷のため〕、逆に[音質低下][音声の途切れ]を招くだけの結果となるようです。
  • Intelプロセッサーは、かなり下位のモデルでも、Intel Quick Sync Video〔QSV〕というハードウェアエンコードのチップを搭載しています。 Intelプロセッサーを搭載したWindows機なら、QSVが[ビデオ アクセラレーション]として利用できるでしょう。
  • Windows機のうち、NVIDIAのグラフィックボードを搭載した機種は、NVENC〔NVIDIA〕というハードウェアエンコードのチップを搭載しています。 NVIDIAのグラフィックボードを搭載しているため、NVENCが使えるWindows機なら、NVENCもまた[ビデオ アクセラレーション]として利用できるでしょう。 QSVを使うか、NVENCを使うかは、Zoomが判断するのかもしれません。
  • macOS機は、少し前まではIntelプロセッサーを搭載していましたし、Intelプロセッサーの多くはQSVというハードウェアエンコードのチップを搭載しています。 したがって、macOS上で走るアプリの側で、QSVが利用できるように最適化されていれば、[QSV付きのIntelプロセッサーを搭載したMac]であれば、Zoomの[ビデオ アクセラレーション]が利用できる可能性は感じます。 しかしAppleは、ハードウェアの詳しい仕様を秘密にし、かつ、うさんくさい説明文・宣伝文句を使うことで、話をはぐらかして真の姿を見せない傾向があり、よくわからない謎の部分が多く、不誠実な人格を感じさせる社風の会社です。 Appleの宣伝文句は、[日本人の心には響かず、かえってしらける]ということが、なぜAppleの日本法人にはわからないのでしょうか?  ですので、[QSV付きのIntelプロセッサーを搭載したMac]であれば、Zoomの[ビデオ アクセラレーション]が利用できるのかどうか、については不明です。
  • ソフト開発者の側面からすると、PCのOSとしては、Windowsが圧倒的多数派であるため、[Windowsだけでなく、macOSにも対応する]という対応をしても、利益回収がほぼできません。 ですので、[Windows専用ソフト]は数々ありますけれども、Apple純正のソフトを除けば、[macOS専用ソフト]は、ごくごく一部だと思います。 そもそも、macOS側から見ると、ソフトもハードも、選択肢がごくごく限定された範囲になる傾向があります。 つまり、使えるソフト/ハードの豊富さを考えれば、macOSを選択するより、Windowsを選択したほうが、圧倒的に有利です。
  • macOS機は、少し前まではIntelプロセッサーを搭載していましたけれども、今後Appleは、Appleシリコン〔M1、M2などのCPU〕を搭載したMacしか発売しない予定であるようです。
  • Apple シリコン搭載の Mac コンピュータ - Apple サポート (日本)
  • そこから、[macOS用のソフト]において、[Intelプロセッサー搭載Macに向けたソフト]と[Appleシリコン搭載Macに向けたソフト]という、二重のソフト開発・ソフトサポートが必要になっています。 この二重の開発負担・サポート負担に耐えられるソフト開発団体は、大手だけでしょう。
  • 【録画・配信・Zoom等】で最もキモになる、ハードエンコーダーのWindowsにおける代表格は[IntelプロセッサーのQSV]と[GeForce〔NVIDIA〕のNVENC]です。 ハードエンコーダーという[武器]を搭載した、Windowsの標準的なゲーミングデスクトップPCは、本体価格20万円前後です。 ゲーミングデスクトップPCは売れているので、量産効果でコストパフォーマンスがよくなっているのです。
  • Windows環境で【録画・配信・Zoom等】をする人は、[IntelプロセッサーのQSV]または[GeForce〔NVIDIA〕のNVENC]でハードエンコードして、【録画・配信・Zoom等】を余裕をもって行なっていることでしょう。 そういうWindowsのデスクトップPCが20万円で手に入ります。 しかもWindowsのデスクトップPCの場合、[GeForce〔NVIDIA〕のNVENC]の搭載主体であるグラフィックボードそのものを差し替えることが可能です。