データ処理ソリューション

データ処理

AI に対応したデータ エンジン。

NVIDIA cuDF | NVIDIA cuVS

概要

新たなデータ需要

企業を変革するには、AI エージェントがデータに継続的にアクセスする必要があり、エージェントの論理的推論の思考ループに対応するように設計されていないデータ インフラに負荷がかかります。

NVIDIA cuDFNVIDIA cuVS により非構造化データおよび構造化データの処理を高速化することで、企業は長年投資してきたデータ インフラを有効活用しながら、AI による新たなデータ量と速度の要求に対応することができます。

世界で最も人気のあるデータ エンジンは、アクセラレーテッド コンピューティング プラットフォーム上で実行され、エージェントがが企業全体に存在するテーブル形式の構造化データや、PDF、メール、画像、動画などの非構造化データにアクセスできるようにします。

NVIDIA cuDF と cuVS が世界有数のデータ プラットフォームに採用

主要なデータ プラットフォームが NVIDIA cuDF と cuVS を活用して、AI 対応データの構造化分析と非構造化ベクトル検索をどのように高速化しているかをご覧ください。

利点

AI 向けにデータを変革する

大幅なパフォーマンス向上

このアクセラレーテッド コンピューティング プラットフォームは、データ処理を最大 20 倍向上し、企業が新たなユース ケースに迅速に対処できるようにします。

大幅なコスト削減

NVIDIA の最適化されたスタックで実行することで、組織はコストを 80% 以上削減でき、少ないリソースでデータ インフラをより多くのことに活用できるようになります。

導入が簡単

Apache Spark、OpenSearch など、世界で最も人気のある分析エンジンやベクトル データ エンジンには、導入を簡単に行えるドロップイン アクセラレーターが備わっています。

AI 対応データ

NVIDIA cuVS により PDF、メッセージ、メールに保存された企業データの 90% からコンテキストを取得し、 NVIDIA cuDF により数分でテラバイト規模の構造化データを処理してグラウンド トゥルースを得ることで、データがエージェント型 AI に対応できる状態になります。

製品

データ処理のための CUDA-X

cuDF と cuVS は、高度に最適化された CUDA® プリミティブを基盤に構築された CUDA-X™ ツールキットであり、データ処理エコシステムを高速化します。

構造化データ向け cuDF

  • NVIDIA GPU 上で分析エンジンを高速化
  • Apache Spark、Presto、Polars、DuckDB 向けのドロップイン アクセラレーターを搭載
  • 分析クエリの実行時間を数時間から数分に短縮

非構造化データ向け cuVS

  • RAG と AI パイプラインのために GPU で高速化されたベクトル検索とインデックス構築
  • OpenSearch、Elastic、Milvus などと連携
  • ベクトル インデックスの構築時間を数時間から数分に短縮

採用した企業

データ処理エコシステム

分析 SQL クエリからベクトル検索まで、組織は NVIDIA のアクセラレーテッド コンピューティング プラットフォームを既存のデータ プラットフォームに導入し、AI 対応のパイプラインを高速化しています。

NVIDIA Vera によるデータ処理

エージェント型 AI ワークロードを大規模に実行する企業にとって、AI エージェントは、構造化された企業データに対する並行かつ継続的な小規模クエリを劇的に増加させます。NVIDIA Vera は、1.2 TB/s のメモリ帯域幅と高速なオンチップ ファブリックを搭載しており、コアあたりのパフォーマンス、高いスループット、負荷時での安定性を実現し、増大するクエリの量と速度に対応します。Starburst 分析エンジンでは、NVIDIA Vera は x86 と比較して 3 倍高速にクエリを処理し、クエリ実行を数分から数秒に短縮しました。また、Redpanda ストリーミング エンジンでは、x86 と比較して p99 で 6 倍改善し、データ エンジンの信頼性を高めました。

近日公開予定。

関連情報

データ処理における最新情報

NVIDIA cuDF と cuVS が世界有数のデータ プラットフォームに採用

NVIDIA のアクセラレーテッド コンピューティング プラットフォームは、現代の企業データ処理をを支えています。世界で最も広く利用されているオープン ソース データ エンジン (開発者によって月間 2 億回以上ダウンロードされています) と統合されたこれらのライブラリは、企業データ プラットフォーム、データベース、データ レイクにわたって活用されています。

Snap が NVIDIA cuDF を活用した A/B テストを拡張した方法

Snap は、9 億 4,000 万人以上のユーザーを対象とした A/B テストのために、毎日 10 ペタバイト以上のデータを処理しています。Google Cloud 上で NVIDIA cuDF を活用して Apache Spark を高速化することで、実行時間が 4 倍高速になり、コストを 76% 削減しました。

Velox と NVIDIA cuDF で大規模分析を高速化

IBM と NVIDIA は、cuDF を Velox 実行エンジンと統合し、Presto と Apache Spark の GPU ネイティブなクエリ実行を可能にすることで、CPU のみのシステムと比較して最大 12 倍高速な分析を実現します。

データは、AI のグラウンド トゥルースであり、コンテキスト

CEO の Jensen Huang が、エージェント型 AI の時代におけるデータ処理エコシステムの役割について、語りました。

IBM、データ処理を刷新

IBM watsonx.data の SQL 分析エンジン Presto は、cuDF によって高速化され、5 倍の処理速度向上と 83% のコスト削減を実現します。

Polars を使用して 1 億行のデータを 2 秒未満で処理する

Polars GPU Engine は、GPU 上で Polars コードを実行し、大幅な高速化を実現します。

次のステップ

詳細をもっと知りたいですか?

データ処理に関するニュース、コンテンツ、イベント情報を受け取りましょう。

cuDF

GPU の並列処理とメモリ帯域幅を活用して、データ処理と分析ワークフローを高速化する構造化データ向けオープン ソース ツールキット。

cuVS

非構造化ベクトル検索とデータ クラスタリングのためのオープン ソース ライブラリ。ベクトル検索とインデックス構築の高速化を可能にします。

データ サイエンスの最新情報を受け取る