Η Nvidia ανακοίνωσε τη Δευτέρα μια νέα γενιά τσιπ Τεχνητής Νοημοσύνης και λογισμικό για την εκτέλεση μοντέλων AI. Η ανακοίνωση, που έγινε κατά τη διάρκεια του συνεδρίου προγραμματιστών της Nvidia στο Σαν Χοσέ, έρχεται καθώς η κατασκευάστρια τσιπ προσπαθεί να εδραιώσει τη θέση της ως ο προμηθευτής που θα επιλέξει οι εταιρείες Τεχνητής Νοημοσύνης.
Η τιμή της μετοχής της Nvidia έχει πενταπλασιαστεί και οι συνολικές πωλήσεις έχουν υπερτριπλασιαστεί από τότε που το ChatGPT της OpenAI έδωσε το έναυσμα για την έκρηξη της Τεχνητής Νοημοσύνης στα τέλη του 2022. Οι high-end επεξεργαστές γραφικών για διακομιστές (GPU) της Nvidia είναι απαραίτητοι για την εκπαίδευση και την ανάπτυξη μεγάλων μοντέλων AI. Εταιρείες όπως η Microsoft και η Meta έχουν δαπανήσει δισεκατομμύρια δολάρια για την αγορά των τσιπ.
Σύμφωνα με το CNBC, η νέα γενιά επεξεργαστών γραφικών AI ονομάζεται Blackwell. Το πρώτο τσιπ Blackwell ονομάζεται GB200 και θα παραδοθεί αργότερα φέτος. Η Nvidia δελεάζει τους πελάτες της με πιο ισχυρά τσιπ για να ωθήσει νέες παραγγελίες. Οι εταιρείες και οι κατασκευαστές λογισμικού, για παράδειγμα, εξακολουθούν να αγωνίζονται να αποκτήσουν την τρέχουσα γενιά των «Hopper» H100 και παρόμοιων τσιπ.
«Το Hopper είναι φανταστικό, αλλά χρειαζόμαστε μεγαλύτερες GPU», δήλωσε ο CEO της Nvidia, Τζένσεν Χουάνγκ, τη Δευτέρα στο συνέδριο προγραμματιστών της εταιρείας στο Σαν Χοσέ της Καλιφόρνια.
Η εταιρεία παρουσίασε επίσης ένα λογισμικό που δημιουργεί έσοδα και ονομάζεται NIM, το οποίο θα διευκολύνει την ανάπτυξη της τεχνητής νοημοσύνης, δίνοντας στους πελάτες έναν ακόμη λόγο για να παραμείνουν στα τσιπ της Nvidia έναντι ενός αυξανόμενου πεδίου ανταγωνιστών.
Γνωρίστε τον Blackwell, τον διάδοχο του Hopper
Κάθε δύο χρόνια η Nvidia αναβαθμίζει την αρχιτεκτονική της GPU, κάνοντας ένα μεγάλο άλμα στην απόδοση των τσιπ. Πολλά από τα μοντέλα Τεχνητής Νοημοσύνης που κυκλοφόρησαν το περασμένο έτος εκπαιδεύτηκαν στην αρχιτεκτονική Hopper της εταιρείας - που χρησιμοποιείται από τσιπ όπως το H100 - η οποία ανακοινώθηκε το 2022.
Η Nvidia λέει ότι οι επεξεργαστές που βασίζονται στον Blackwell, όπως ο GB200, προσφέρουν μια τεράστια αναβάθμιση των επιδόσεων για τις εταιρείες AI, με 20 petaflops σε απόδοση AI έναντι 4 petaflops για τον H100. Η πρόσθετη επεξεργαστική ισχύς θα επιτρέψει στις εταιρείες AI να εκπαιδεύσουν μεγαλύτερα και πιο περίπλοκα μοντέλα, δήλωσε η Nvidia.
Το τσιπ περιλαμβάνει αυτό που η Nvidia αποκαλεί «μηχανή μετασχηματιστή» που έχει κατασκευαστεί ειδικά για την εκτέλεση AI που βασίζεται σε μετασχηματιστές, μία από τις βασικές τεχνολογίες που στηρίζουν το ChatGPT.
Η GPU Blackwell είναι μεγάλη και συνδυάζει δύο ξεχωριστά κατασκευασμένες μήτρες σε ένα τσιπ που κατασκευάζεται από την TSMC. Θα είναι επίσης διαθέσιμη ως ολόκληρος διακομιστής που ονομάζεται GB200 NVLink 2, συνδυάζοντας 72 GPU Blackwell και άλλα εξαρτήματα της Nvidia που έχουν σχεδιαστεί για την εκπαίδευση μοντέλων AI.
Η Amazon, η Google, η Microsoft και η Oracle θα πωλούν πρόσβαση στον GB200 μέσω υπηρεσιών cloud. Ο GB200 συνδυάζει δύο GPU B200 Blackwell με μία CPU Grace που βασίζεται στην Arm. Η Nvidia δήλωσε ότι η Amazon Web Services θα κατασκευάσει ένα σύμπλεγμα διακομιστών με 20.000 τσιπ GB200.
Η Nvidia δήλωσε ότι το σύστημα μπορεί να αναπτύξει ένα μοντέλο 27 τρισεκατομμυρίων παραμέτρων. Αυτό είναι πολύ μεγαλύτερο ακόμη και από τα μεγαλύτερα μοντέλα, όπως το GPT-4, το οποίο φέρεται να έχει 1,7 τρισεκατομμύρια παραμέτρους. Πολλοί ερευνητές τεχνητής νοημοσύνης πιστεύουν ότι μεγαλύτερα μοντέλα με περισσότερες παραμέτρους και δεδομένα θα μπορούσαν να ξεκλειδώσουν νέες δυνατότητες.
Η Nvidia δεν παρείχε πληροφορίες σχετικά με το κόστος για το νέο GB200 ή τα συστήματα στα οποία χρησιμοποιείται. Το H100 της Nvidia που βασίζεται στο Hopper κοστίζει μεταξύ 25.000 και 40.000 δολαρίων ανά τσιπ, με ολόκληρα συστήματα που κοστίζουν έως και 200.000 δολάρια, σύμφωνα με εκτιμήσεις αναλυτών.