9-1 NexVDO SDK - QCAP 機能の概要とアーキテクチャ

この最初の章では、SDK のブロック図の全体的な視点からアプローチします。この包括的なオーディオ・ビデオ SDK は、**Capture(キャプチャ)、Record(録画)、Stream(配信)、Analysis(分析)**の 4 つのコア領域を網羅しています。
ただし、これら 4 つの主要なブロックを深く掘り下げる前に、ブロック図の上部と下部を注意深く観察すると、この SDK がさまざまな開発者のニーズを満たすために、究極の開発しやすさとハードウェア・アクセラレーション・サポートを提供していることがわかります。

1. クロス言語およびフレームワーク開発のサポート:

ブロック図の一番上を見ると、SDK が C/C++、Python、および QT フレームワークを完全にサポートしていることがわかります。つまり、究極の低レベルのパフォーマンスを追求する C/C++ 開発者であっても、AI モデルと迅速な検証に焦点を当てる Python 開発者であっても、プロフェッショナルなグラフィカル・ユーザー・インターフェース (GUI) を構築する必要がある QT エンジニアであっても、最も使い慣れた言語を使用してシームレスに統合できることを意味します。

2. 強力なハードウェアプラットフォームと低レベルのアクセラレーション::

ブロック図の一番下に目を向けると、アーキテクチャ全体が強力な NVIDIA® Jetson Orin™ Platform に深く根ざしていることがわかります。SDK は、GPUDirect/RDMA、NVENC/NVDEC、CUDA コンピューティングなど、NVIDIA のコア・アクセラレーション・テクノロジーを深く統合しており、AI 側の TensorRT や TensorRT-LLM にまで拡張しています。これにより、映像入力から AI インテリジェント分析に至るまでのすべてのプロセスで、パフォーマンスが最適に発揮されることが保証されます。

公式参考情報: 

この SDK の完全な仕様と製品の詳細をいち早く確認したい場合は、[**YUAN(聰泰)公式製品ページ**](https://www.yuan.com.tw/zh-tw/product-info/89) にアクセスして詳細をご覧ください!

今後の章では、「Capture、Record、Stream、Analysis」の各トピックに関する技術的な解説を順次行い、実際の分析アプリケーションの実践を紹介していきます。しかし、この章ではまず、ブロック図の中で最も基礎的で重要な 3 つの機能ブロックである、**Capture(キャプチャ)、Record(録画)、Stream(配信)**について簡単にプレビューしてみましょう。

Capture(キャプチャ) 

映像キャプチャはシステムの「目」のようなものであり、現実世界のシーンを効率的かつロスレスにコンピュータに転送する役割を担っています。医療手術、放送、セキュリティ監視のいずれにおいても、最初のステップは常に、映像情報が完全かつ低遅延でキャプチャされることを保証することです。

これは当たり前のことのように聞こえますが、実際の開発においては困難が伴うことがよくあります。開発者としては、多様な映像入力ソースの課題に直面する可能性があり、また、さまざまなオペレーティングシステムに存在する複雑なフレームワーク(Windows の DirectShow や MediaFoundation、Linux の V4L2 や GStreamer など)に精通している必要があります。

これらの課題を解決するために、YUAN(聰泰)は 30 年の専門的な経験を活かして NexVDO SDK を発表し、「キャプチャ」をかつてないほど簡単かつ強力なものにしました。それでは、ブロック図の左端にある「Capture(キャプチャ)」ブロックに照らし合わせて、詳しく見ていきましょう!

1. フレームワークの障壁を打破:たった4つのAPIであらゆるソースをキャプチャ

ブロック図の基盤設計に従い、当社の SDK は非常に幅広い **2D/3D ビデオ、オーディオ、および VANC キャプチャ** ソースをサポートしています。物理的なキャプチャカード、サウンドカード、USB カメラに接続する場合でも、あるいは仮想デスクトップや IP ストリームをキャプチャする場合でも、すべて問題なく対応できます。

さらに素晴らしいことに、開発者は **4 つの簡単な API を呼び出すだけで、わずか 5 分でオーディオおよびビデオのキャプチャ機能を構築できます**! SDK には「信号とフォーマットの自動検出(Auto Signal Detection)」メカニズムも組み込まれており、デバイスのプラグイン、アンプラグ、無信号(No Signal)の発生、またはフォーマットの変更が必要な場合でも、システムが自動的に判断して処理します。

2. 速度の限界を突破する: NVIDIA GPUDirect と独自特許による支援

業界によって遅延に対する要件は極めて厳格です。たとえば医療分野では、重要な手術中のリスクを回避するために、遅延を 50 ミリ秒未満に抑える必要があります。

究極の低遅延を実現するために、SDK は **NVIDIA GPUDirect テクノロジー** と深く統合されています。この技術により、高品質な映像は不要な伝送経路をバイパスし、直接指定された GPU メモリに取り込まれるため、後続のメモリ転送パフォーマンスのコストと遅延が大幅に削減されます。さらに、ブロック図に記載されている「同期キャプチャ特許(Synchronous Capture Patent)」や「マルチビューキャプチャ特許(Surround & Multiview Patent)」と組み合わせることで、マルチチャンネルおよびマルチ画面のキャプチャ開発がよりスムーズに行えるようになります。

3. 高性能な前処理とレンダリング:映像がシステムに入る際の最初の魔法

映像が入力された後、多くの場合さまざまな前処理が必要になります。NexVDO SDK は、強力な独立した CPU/GPU アクセラレーションエンジンを内蔵しており、豊富で多彩な映像処理機能を提供します。

- 映像の最適化とインターレース解除(Deinterlace):多様な高度な「インターレース解除アルゴリズム」(Motion Adapter、Blending、Filter Triangle など)をサポートし、明るさ(輝度)、色相、コントラスト、彩度をリアルタイムに調整できます。

- 柔軟なクロッピングとオーバーレイ(重ね合わせ):映像のクロッピング(切り抜き)およびスケーリング(拡大・縮小)エンジンを通じて、映像サイズを自由に調整できます。さらに、画面上にテキスト、スクロールテキスト(テロップ)、画像をリアルタイムで追加したり、プロ仕様のグリーンバック合成(ChromaKey)を実行したりすることも可能です。

- 高性能レンダリングエンジン(ThumbDraw):セキュリティ監視でよく見られるマルチスクリーン表示のニーズに対応するため、独自の ThumbDraw テクノロジーにより、単一デバイスの映像を複数の画面にレンダリングしたり、複数の映像を単一の画面にレンダリングしたりすることができます。また、高速表示、反転・ミラーリング、指定領域表示、高度な 3D 表示や HDR 表示もサポートしています。

4. 医療レベルのスナップショットと記録

ブロック図の「画像スナップショット(Image Snapshot)」機能において、SDK は連続撮影と柔軟なクロッピングをサポートするだけでなく、ロスレスまたは非可逆圧縮の BMP、JPG、PNG、TIF フォーマットでの出力が可能です。特に注目すべき点は、専門的な医療アプリケーション向けに、SDK が DICOM および最新の HL7 プロトコルを完全にサポートしていることです。これにより、キャプチャおよび記録されたデータを PACS や医療ワークリスト(Worklist)サーバーにシームレスに統合できます。

完璧な映像ソースをマスターしたところで、次はこれらの貴重な映像をどのように適切に保存するべきでしょうか?次のページでは、ブロック図の右側に進み、同様に機能満載の「Record(録画)」ブロックについて探求していきます。


Record(録画)

安定したキャプチャソースを確保した後、ブロック図は「録画(Record)」ノードに進みます。この SDK における録画の定義は、決して単なる「ハードディスクへのデータ書き込み」ではありません。それは「高性能なエンコーディングと柔軟な録画設計」を主眼としています。ブロック図と照らし合わせながら、開発者のために用意された強力な武器を見ていきましょう!

1. フォーマットの自由と究極のハードウェアエンコーディングパフォーマンス

開発者にとって、多種多様なオーディオ・ビデオのコンテナフォーマットを扱うことは、しばしば最も頭を悩ませる問題です。しかし、私たちの SDK は、AVI、MP4、ASF、WMV、MOV、FLV、TS、M3U8、WAV など、市場のほぼすべての主要なフォーマットを網羅しています。さらに、医療・ヘルスケア業界向けには、DICOM / HL7 / WL などの専門フォーマットをネイティブサポートしており、ファイルの修復、サムネイルの自動生成、字幕(テロップ)の埋め込み、カスタムデータなどの実用的な機能も配慮されています。

エンコーディングフォーマットに関しては、RAW、MPEG2、H.264、H.265 をサポートし、さらに次世代の高効率な **AV1** や AAC オーディオも完全にサポートしています。最も重要なのは、基盤となるハードウェアアクセラレーション技術を全面的に呼び出せることです。Intel® Media SDK、NVIDIA® CUDA/NVENC™、AMD® VCE™ のいずれを使用している場合でも、SDK は GPU に重いエンコーディング作業を担わせ、CPU のパフォーマンスを完全に解放します!

2. プロフェッショナルレベルの「マルチストリーム」録画とオーディオミキシング

放送・テレビ業界や大規模な監視プロジェクトでは、異なる解像度や異なる視点の映像を同時に録画する必要がよくあります。ブロック図からわかるように、SDK は高度な録画モードを専門的に提供しています:

- マルチストリームチャンネル録画 と マルチストリームディレクター録画:プロ仕様のスイッチャー(ディレクター)システムを簡単に構築し、複数の信号ソースを同時に保存できるようにします。

- マルチストリーム 3D 録画:立体(3D)映像の保存に対して最も直接的なサポートを提供します。

- マルチオーディオトラックおよびオーディオミキシング録画:映像があれば、当然音声も欠かせません。SDK を使用すると、開発者は異なる音声ソースをミックスしたり、個別のトラックとして録音したりすることができ、オーディオとビデオの完璧な融合を実現します。

3. 重要な瞬間を逃さない「タイムマシン」とセキュリティメカニズム

これは個人的に録画ブロックの中で最もクールであり、セキュリティやミッションクリティカルなタスクにおいて最も欠かせない機能だと考えています!

- イベント前録画(Pre-event Recording)とタイムシフト録画(Time-Shift Recording):監視システムにおいて、アラームがトリガーされた(例:侵入者が発生した)時に録画を開始するのでは遅すぎることがよくあります。SDK には、強力な「イベント前録画」、「タイムシフト録画」、および「巻き戻し再生(Rewind Playback)」のメカニズムが組み込まれています。イベント発生の数秒前(あるいはそれ以上)の映像も一緒にカプセル化して録画でき、まさに一滴の水も漏らさない完璧な記録を実現します!

- 軍用グレードの保護 :高度な機密性を持つ映像(技術による法執行や医療手術の記録など)に対して、SDK は 「暗号化録画(Encrypted Recording)」 機能を提供します。同時に、ハードディスクの破損によるデータの損失を防ぐため、「同期録画(Synchronous Recording)」 と 「複製(バックアップ)録画(Duplicate Recording)」 も内蔵されており、データの安全性を二重、さらには三重に保護します。

ここまで見てきて、この SDK の「録画」機能が想像をはるかに超えるほど強力だと感じませんか?エンコーディングの速度が速く、幅広いフォーマットをサポートしているだけでなく、放送レベルのディレクターの要件や、厳しいセキュリティ・機密保持のメカニズムも、開発者のためにあらかじめ用意されています。
映像を完璧にキャプチャしてカプセル化(録画)した後は、空間の制限を打ち破り、これらの映像をリアルタイムで世界中に配信するステップに進みます!次の記事では、引き続きブロック図の右側へ進み、超低遅延と全プロトコルサポートを主眼とする 3 つ目のパズルのピース、「Stream(配信)」について解き明かしていきます。どうぞご期待ください!


Stream(配信) 

SDK ブロック図解析の第 3 部へようこそ!前回の記事では、「Record(録画)」機能を通じて高品質な映像を安全にカプセル化し、保存する方法を学びました。しかし、映像の価値はローカルのハードディスクにとどまるべきではありませんよね?今日は、ブロック図の 3 番目のコアブロックである**「Stream(配信)」**に注目し、この SDK がどのようにデバイスと空間の壁を打ち破り、オーディオとビデオの映像をリアルタイムで世界中にプッシュするのかを見ていきます。
低遅延かつ高品質なリアルタイム配信アプリケーションを構築する際、最大の課題は、複雑な基盤となるネットワークプロトコルを深く理解しなければならないことです。しかし心配はいりません。この NexVDO SDK を使用すれば、かつてない開発の自由度を手に入れることができます!ブロック図の「Stream(配信)」ブロックを見ながら、その強力なネットワーク伝送の火力を一つずつ解読していきましょう。

1. 完全制覇!あらゆる業界向けにカスタマイズされた通信プロトコル

ブロック図からわかるように、当社の SDK は市場のほぼすべての主要なストリーミングプロトコルをサポートしており、さまざまな業界の特殊なニーズに完璧に対応しています:

- ライブ配信とニューメディア (RTMP / SRT / HLS): QoS エンコーディング制御が組み込まれており、eスポーツのライブ配信プラットフォームであっても、インフルエンサー向けのプラットフォームであっても、RTMP を介して主要な CDN サーバーに映像を安定してプッシュできます。また、HTTP ベースの HLS プロトコルを利用して、すべてのクロスプラットフォームデバイス(スマートフォンやタブレットなど)でシームレスにプルして視聴することができます。

- セキュリティ監視 (ONVIF / RTSP): SDK は RTSP をサポートしているだけでなく、公式協会によって認定された ONVIF サーバー、クライアント、およびエニュメレーター(Enumerator)を内蔵しています。つまり、この SDK を適用するだけで、ソフトウェアやハードウェアは、市場の主要ブランドの IP カメラや CMS 監視システムと簡単に通信できるようになります。

- ビデオ会議とオンライン教育 (WebRTC / SIP): WebRTC および SIP プロトコルを完全に網羅しており、開発者はユーザーに追加のプラグインのインストールを強制することなく、Web ブラウザで P2P のリアルタイムオーディオ・ビデオ通話やチャットルーム機能を実現でき、面倒なファイアウォール越え(トラバーサル)の問題も簡単に解決できます。

- プロフェッショナル放送・テレビ (TS / NDI): 極めて高い伝送安定性が求められる放送分野向けに、SDK は MPEG2-TS ストリーミングと放送グレードの NDI(ロスレスの Full NDI と低帯域幅の NDI®|HX を含む)をサポートしています。これにより、1G ネットワーク環境で双方向伝送を簡単に実現し、遠隔地間のコラボレーションやマルチ信号のディレクター(スイッチャー)操作が可能になります。さらに、ブロック図にはプロフェッショナル向けオーディオネットワーク Dante AV-H のサポートも示されています。

2. 究極の超低遅延の追求と強力なサーバーアーキテクチャ

幅広いプロトコルのサポートに加えて、伝送速度はストリーミングアプリケーションの魂です。ブロック図の詳細から、当社の RTSP プロトコルが驚異的な **4 ミリ秒 (4ms) の超低遅延** 機能を備えていることがわかります!それだけでなく、「遠隔医療手術」のようなわずかな遅延も許されない厳しいアプリケーション向けに、独自の SkyLink X テクノロジーを開発しました。安定した帯域幅のインターネット上で数ミリ秒未満の遅延を実現し、医師が遠隔からロボットアームを正確に操作することが、もはやSFの世界の話ではなくなりました。

システムアーキテクチャの設計において、SDK は強力な **2D/3D ストリーミングクライアント** と **マルチストリームストリーミングサーバー** を提供します:

- ストリーミングクライアント (Streaming Client): スナップショット、録画、表示をサポートし、PTZ(パン・チルト・ズーム)カメラの直接制御も行うことができます。

- マルチストリームストリーミングサーバー (Multi-Stream Streaming Server): 遅延ライブ配信、伝送暗号化、およびオーディオミキシングをサポートします。また、UDP、TCP、HTTP、マルチキャスト (Multicast)、RAW-UDP などの多様な伝送方法を開発者に提供し、いかなる過酷なネットワーク環境下でも映像がスムーズに配信されることを保証します。


実践編へ進む準備はいいですか?

「Capture(キャプチャ)」、「Record(録画)」から「Stream(配信)」に至るまで、この SDK の最もコアとなる 3 つのオーディオ・ビデオ処理の基礎を完全に解き明かしました。全体的なアーキテクチャと強力な基盤技術を理解した後は、いよいよ実際に手を動かしてコードを書き、これらの機能を実際のアプリケーションに変えていく時間です!

当社の SDK は QT フレームワークを完全にサポートしているため、クロスプラットフォームで美しいグラフィカル・ユーザー・インターフェース (GUI) を極めて効率的に構築できることを意味します。そこで、続く **10-2 章** では理論の授業を一旦休止し、開発者が最も関心を寄せる実践パートへと直接ご案内します。ゼロからステップバイステップで、**QT 開発環境のインストールと構築** を完了させましょう。

キーボードの準備をして、次の実践編でお会いしましょう!

  

Copyright © 2026 YUAN High-Tech Development Co., Ltd.
All rights reserved.