Solutions de traitement des données

Traitement des données

Moteurs de données prêts pour l'IA.

NVIDIA cuDF | NVIDIA cuVS

Aperçu

Nouvelles demandes de données

Pour transformer votre entreprise, les agents IA ont besoin d'un accès permanent à vos données, ce qui met à rude épreuve une infrastructure de données qui n'est pas conçue pour les boucles de raisonnement agentique.

En accélérant le traitement des données structurées et non structurées avec NVIDIA cuDF et NVIDIA cuVS, les entreprises peuvent répondre aux nouvelles demandes de volume et de vitesse des données liées à l'IA, tout en tirant parti de l'infrastructure de données dans laquelle elles ont investi depuis des années.

Les moteurs de données les plus populaires au monde s'exécutent sur la plateforme de calcul accéléré, ce qui permet aux agents d'accéder à des données structurées sous forme de tableaux et à des données non structurées sous forme de PDF, d'e-mails, d'images et de vidéos à l'échelle de l'entreprise.

NVIDIA cuDF et cuVS adoptés par les principales plateformes de données au monde

Découvrez comment les principales plateformes de données utilisent NVIDIA cuDF et cuVS pour accélérer les analyses structurées et la recherche vectorielle non structurée de données prêtes pour l'IA.

Avantages

Transformez vos données pour l'IA

Gains de performances massifs

La plateforme de calcul accéléré offre une accélération du traitement des données jusqu'à 20 fois, permettant aux entreprises de réagir plus rapidement avec de nouveaux cas d'utilisation.

Réduction significative des coûts

En exploitant la pile optimisée par NVIDIA, les entreprises ont réalisé des économies de 80 % ou plus, ce qui vous permet de tirer le meilleur parti de votre infrastructure de données avec moins de ressources.

Facile à adopter

Les moteurs d'analyse et de données vectorielles les plus populaires au monde proposent des accélérateurs prêts à l'emploi pour faciliter leur mise en œuvre, notamment Apache Spark, OpenSearch et bien d'autres encore.

Données prêtes pour l'IA

Grâce au contexte fourni par 90 % des données d'entreprise stockées dans des fichiers PDF, des messages et des e-mails avec NVIDIA cuVS, et aux données de référence issues de téraoctets de données structurées traitées en quelques minutes avec NVIDIA cuDF, vos données sont prêtes pour l'IA agentique. 

Produits

CUDA-X pour le traitement des données

cuDF et cuVS sont des kits d'outils CUDA-X™, basés sur des primitives CUDA® hautement optimisées, pour accélérer l'écosystème de traitement des données.

cuDF pour les données structurées

  • Accélère les moteurs d'analyse sur les GPU de NVIDIA
  • Inclut des accélérateurs intégrables pour Apache Spark, Presto, Polars et DuckDB 
  • Exécute des requêtes analytiques en quelques minutes au lieu de quelques heures

cuVS pour les données non structurées

  • Recherche vectorielle et création d'IndeX accélérées par GPU pour les pipelines RAG et d'IA
  • S'intègre à OpenSearch, Elastic, Milvus et bien plus encore
  • Réduit les délais de création d'un IndeX vectoriel de quelques heures à quelques minutes

Adopteurs

Écosystème de traitement des données

Des requêtes SQL analytiques à la recherche vectorielle, les entreprises adoptent la plateforme de calcul accéléré de NVIDIA dans leurs plateformes de données existantes pour accélérer les pipelines de préparation pour l'IA.

Traitement des données sur NVIDIA Vera

Pour les entreprises exécutant des charges de travail d'IA agentique à grande échelle, les agents d'IA augmentent considérablement le nombre d'interrogations simultanées et continues à petite échelle de données d'entreprise structurées. NVIDIA Vera dispose d'une bande passante mémoire de 1,2 To/s et d'une structure sur puce à haute vitesse qui offre des performances par cœur, un débit élevé et une prévisibilité sous charge pour prendre en charge le volume et la vitesse accrus des requêtes. Dans le cas du moteur d'analyse Starburst, NVIDIA Vera est parvenu à traiter les requêtes trois fois plus rapidement que les systèmes x86, réduisant ainsi le temps d'exécution des requêtes de plusieurs minutes à quelques secondes, tandis que le moteur de streaming Redpanda a divisé par six son p99 par rapport aux systèmes x86, renforçant ainsi la fiabilité du moteur de données.

PROCHAINEMENT.

Ressources

Les dernières nouveautés en matière de traitement des données

NVIDIA cuDF et cuVS adoptés par les principales plateformes de données au monde

La plateforme de calcul accéléré de NVIDIA alimente le traitement moderne des données d'entreprise. Intégrées aux moteurs de données open source les plus utilisés au monde (téléchargés plus de 200 millions de fois par mois par les développeurs), ces bibliothèques sont exploitées pour les plateformes de données d'entreprise, les bases de données et les lacs de données.

Comment Snap a fait évoluer les tests A/B avec NVIDIA cuDF

Snap traite plus de 10 pétaoctets par jour pour les tests A/B de plus de 940 millions d'utilisateurs. L'accélération d'Apache Spark avec NVIDIA cuDF sur Google Cloud a permis de fournir des temps d'exécution 4 fois plus rapides et de réduire les coûts de 76 %.

Accélérer l'analyse à grande échelle avec Velox et NVIDIA cuDF

IBM et NVIDIA intègrent cuDF au moteur d'exécution Velox, permettant ainsi d'exécuter des requêtes natives des GPU pour Presto et Apache Spark, fournissant ainsi des analyses jusqu'à 12 fois plus rapides que les systèmes uniquement basés sur CPU.

Les données constituent la vérité terrain et le contexte de l'IA

Écoutez le point de vue du PDG Jensen Huang sur le rôle de l'écosystème du traitement des données à l'ère de l'IA agentique.

IBM réinvente le traitement des données

Le moteur d'analyse SQL Presto d'IBM watsonx.data est optimisé par cuDF, ce qui permet de multiplier la vitesse par cinq et de réaliser 83 % d'économies.

Traitement de 100 millions de lignes de données en moins de 2 secondes avec Polars

Le moteur GPU de Polars exécute le code Polars sur des GPU pour des accélérations massives.

Étapes suivantes

Êtes-vous prêts à en savoir plus?

Recevez les dernières actualités, contenus et événements sur le traitement des données.

cuDF

Kit d'outils open source pour les données structurées utilisant le parallélisme GPU et la bande passante mémoire pour accélérer les workflows de traitement et d'analyse des données.

cuVS

Bibliothèque open source pour la recherche vectorielle non structurée et le clustering de données permettant des recherches vectorielles et des créations d'IndeX plus rapides.

Suivez l’actualité de la Data Science