Ο εκδημοκρατισμός της τεχνολογίας δημιουργεί αντίρροπες δυνάμεις σε chips, ενέργεια και big tech

Shutterstock

DeepSeek

Ο εκδημοκρατισμός της τεχνολογίας δημιουργεί αντίρροπες δυνάμεις σε chips, ενέργεια και big tech

29/01/2025 • 00:00

29/01/2025 • 00:00

Η DeepSeek φαίνεται ότι έκανε τη μεγάλη ανατροπή, μειώνοντας εκθετικά το κόστος έναντι του GPT-4 ή του Claude της Anthropic για πολλές εργασίες, αφήνοντας πραγματικά τον κόσμο της Τεχνητής Νοημοσύνης με το στόμα ανοικτό.

Αν και υπάρχουν κάποιες επιφυλάξεις για το αν πράγματι η κινεζική startup δαπάνησε λιγότερα από 6 εκατομμύρια δολάρια για το μοντέλο r1, χρησιμοποιώντας αποκλειστικά 2.000 τσιπ παλιότερης τεχνολογίας της Nvidia και όχι και κάποια από τα Η100 GPUs όπως λένε οι «κακές γλώσσες», εντούτοις το επίτευγμα δεν παύει να είναι κολοσσιαίο.

Βλέπετε, οι Κινέζοι στην προσπάθεια τους να ξεπεράσουν τον σκόπελο των περιορισμών που επέβαλαν οι ΗΠΑ στην εξαγωγή των πιο εξελιγμένων τσιπ της Νvidia και να γεφυρώσουν το τεχνολογικό χάσμα, ξανασκέφτηκαν τα πάντα από την αρχή.

Στο παραδοσιακό AI είναι σαν να γράφουμε κάθε αριθμό με 32 δεκαδικά ψηφία. Η DeepSeek χρησιμοποιεί μόνο 8, απαιτώντας 75% λιγότερη μνήμη και παραμένοντας παρά ταύτα εξαιρετικά ακριβής.

Εν συνεχεία υπάρχει καινοτομία στο σύστημα «πολλαπλών διακριτικών». Το κανονικό AI διαβάζει σαν μαθητής πρώτης τάξης: «Η... γάτα... κάθισε...» Η DeepSeek διαβάζει ολόκληρες φράσεις ταυτόχρονα δύο φορές ταχύτερα και με 90% ακρίβεια. Το να επεξεργάζεσαι δισεκατομμύρια λέξεις σε χρόνο dt, κάνει προφανώς τη διαφορά.

Και κάπου εδώ φτάνουμε και στο πραγματικά ανατρεπτικό κομμάτι της DeepSeek: Οι Κινέζοι αντί για μια Τεχνητή Νοημοσύνη που προσπαθεί να γνωρίζει τα πάντα - αντίστοιχα με έναν άνθρωπο που είναι γιατρός, δικηγόρος, αρχιτέκτονας κ.ο.κ ταυτόχρονα - έχτισαν ένα σύστημα όπου η ΑΙ μοιάζει με εξειδικευμένους ειδικούς που αναλαμβάνουν δράση μόνο όταν χρειάζεται.

Αυτό έχει πολύ συγκεκριμένες συνέπειες: Στα παραδοσιακά μοντέλα, περίπου 1,8 τρισεκατομμύρια παράμετροι είναι ενεργές συνεχώς. Στη DeepSeek είναι ενεργά 671B συνολικά, αλλά μόνο 37B είναι ενεργά ταυτόχρονα. Είναι σαν να έχουμε μια τεράστια ομάδα εξειδικευμένων εργατών, αλλά να καλούμε κάθε φορά μόνο τους ειδικούς που χρειαζόμαστε για τη συγκεκριμένη εργασία που έχουμε να διεκπεραιώσουμε.

Οι πρώτοι υπολογισμοί σύμφωνα με τον διεθνή Τύπο είναι εντυπωσιακοί:

Κόστος εκπαίδευσης: $100M → $5M

Απαιτούμενα GPU: 100.000 → 2.000

Κόστος API: 95% φθηνότερο!

Και η κορύφωση όλων των παραπάνω έρχεται με μια ακόμα μεγαλύτερη ανατροπή:

Η DeepSeek μοιράζεται τις ανακαλύψεις της αντί να τις προστατεύσει για εμπορικά κέρδη!

Είναι όλα ανοιχτού κώδικα. Τουτέστιν ο κώδικας είναι δημόσιος.

Γιατί έχει σημασία ο ανοικτός κώδικας; Επειδή σπάει το μοντέλο του «Μόνο οι γίγαντες της τεχνολογίας μπορούν να παίξουν στο γήπεδο της ΑΙ».

Χάρη στην DeepSeek δεν χρειάζονται πλέον κέντρα δεδομένων δισεκατομμυρίων δολαρίων. Μερικά καλά GPU μπορεί να κάνουν τη δουλειά.

Η εμφάνιση ανοιχτών μοντέλων ΑΙ στην ουσία δημοκρατικοποιεί την πρόσβαση στην προηγμένη τεχνολογία της ΑΙ, εξισορροπώντας το παιχνίδι για τους μικρότερους παίκτες, είτε αυτοί είναι επιχειρήσεις είτε έθνη.

Αυτό είναι ιδιαίτερα κρίσιμο για όσους είναι αρκετά πίσω στον αγώνα ανάπτυξης μοντέλων ΑΙ, όπως για παράδειγμα η Ευρώπη!

Από την άλλη, για εταιρείες τσιπ σαν την Nvidia, η οποία έχει κεφαλαιοποιήσει όσο καμία άλλη εταιρεία την έκρηξη της Τεχνητής Νοημοσύνης, αυτό είναι τρομακτικό.

Ολόκληρο το επιχειρηματικό της μοντέλο βασίζεται στην πώληση εξαιρετικά ακριβών GPU με περιθώρια 90%. Εάν όλοι μπορούν ξαφνικά να κάνουν εφαρμογές AI με κανονικές GPU παιχνιδιών, τότε τα κέρδη θα αποκλίνουν αισθητά από τις μέχρι τώρα προβλέψεις.

Εκτός κι αν η εταιρεία αποφασίσει να καλύψει τις απώλειες με τη χρήση της τιμολογιακής της δύναμης...

Στους μεγάλους χαμένους και οι εταιρείες ηλεκτρικής ενέργειας

Όλα αυτά όμως δεν είναι τρομακτικά μόνο για την Νvidia, αλλά και για κάποιες από τις ενεργειακές εταιρείες και εταιρείες Κοινής Ωφελείας. Βλέπετε υπάρχει πλέον σοβαρό ενδεχόμενο οι προηγμένες δυνατότητες ΑΙ να μπορούν να επιτευχθούν όχι μόνο χωρίς τις τεράστιες ποσότητες υπολογιστικής ισχύος, αλλά και ενέργειας καθώς και νερού ψύξης.

Μπροστά στο ενδεχόμενο να καταρρεύσουν οι προοπτικές για αυξημένη ζήτηση ενέργειας από τα data centers που υποστηρίζουν την Τεχνητή Νοημοσύνη πολλές από τις μετοχές ενεργειακών εταιρειών και εταιρειών Κοινής Ωφελείας τη Δευτέρα στην κυριολεξία απασφάλισαν!

Μεταξύ των εταιρειών που επηρεάστηκαν περισσότερο βρίσκονται η Constellation Energy, η οποία τη Δευτέρα σημείωσε πτώση 21% ενώ την Τρίτη κατάφερε να πάρει πίσω μόνο το 1,38% των απωλειών, η GE Vernova, με πτώση 22% τη Δευτέρα και άνοδο 7% την Τρίτη και η Vistra Energy, με πτώση 30% τη Δευτέρα και άνοδο 9% την Τρίτη.

Οι Constellation, Vistra και GE Vernova ήταν μέχρι πρόσφατα ηγέτες στην αγορά του S&P, καθώς οι επενδυτές θεωρούσαν ότι η αυξανόμενη ζήτηση ενέργειας από τα data centers για τις ανάγκες της ΑΙ θα οδηγούσε σε μεγάλη αύξηση της κατανάλωσης ηλεκτρικής ενέργειας.(σ.σ: Περισσότερα μπορείτε να διαβάσετε εδώ).

Η Constellation Energy για παράδειγμα έχει συνάψει συμφωνίες, όπως αυτή με τη Microsoft για την επαναλειτουργία του πυρηνικού σταθμού Three Mile Island, που θα παρέχει ενέργεια στην Amazon.

Συνολικά δε, οι μεγάλες τεχνολογικές εταιρείες υπέγραψαν νέες συμφωνίες για περισσότερα από 10 GW νέας πυρηνικής ικανότητας τον τελευταίο χρόνο.

Οι αναλυτές μάλιστα, μέχρι την προηγούμενη εβδομάδα προέβλεπαν ότι θα χρειαστούν 85-90 GW νέας πυρηνικής ικανότητας για να καλυφθεί η όλη αύξηση στη ζήτηση ενέργειας των κέντρων δεδομένων μέχρι το 2030.

Ωστόσο, λιγότερο από το 10% αναμενόταν να είναι διαθέσιμο παγκοσμίως μέχρι το 2030.

Μετά όμως την ανατροπή από την DeepSeek, όλα αυτά είναι στον αέρα.

Συμπερασματικά, η επενδυτική κοινότητα έχει αμφιβολίες για τις εκτιμήσεις που κάνουν οι αμερικανικές εταιρείες σχετικά με τις ανάγκες για cloud infrastructure, ζήτηση τσιπς και ενεργειακή κατανάλωση, καθώς η τεχνολογία της DeepSeek μπορεί να σημαίνει λιγότερη ζήτηση για τσιπ, λιγότερη ανάγκη για μαζική παραγωγή ενέργειας για την τροφοδοσία των μοντέλων και λιγότερη ανάγκη για κέντρα δεδομένων μεγάλης κλίμακας.

Η διαφορετική μοίρα για κάποιες Big Tech

Η DeepSeek δεν έχει συγκεντρώσει χρήματα από εξωτερικά κεφάλαια, ούτε έχει κάνει σημαντικές κινήσεις για τη δημιουργία εσόδων από τα μοντέλα της. Νομοτελειακά αυτό δημιουργεί ερωτήματα για το πόσο βιώσιμο είναι το μοντέλο των αμερικανικών κολοσσών, με τα δεκάδες δις επενδύσεων στην ΑΙ, όταν υπάρχει τέτοιος ανταγωνισμός.

Βλέπετε, η τεχνολογία της DeepSeek χρησιμοποιεί ένα διαφορετικό είδος εσωτερικής αρχιτεκτονικής που απαιτεί λιγότερη χρήση μνήμης, μειώνοντας έτσι σημαντικά το υπολογιστικό κόστος κάθε αναζήτησης ή αλληλεπίδρασης με το σύστημα τύπου chatbot.

Έχει δε ήδη επαινεθεί από ερευνητές για την ικανότητά της να αντιμετωπίζει σύνθετες συλλογιστικές εργασίες, ιδιαίτερα στα μαθηματικά και την κωδικοποίηση και φαίνεται να παράγει αποτελέσματα συγκρίσιμα με τους ανταγωνιστές, με ένα κλάσμα της υπολογιστικής ισχύος που χρειάζονται εκείνοι.

Το αξιοθαύμαστο δε είναι ότι η DeepSeek έκανε την ανατροπή με μια ομάδα μικρότερη των 200 ατόμων. Για λόγους σύγκρισης αναφέρεται ότι η Meta έχει ομάδες όπου η αποζημίωση τους από μόνη της θα υπέρβαινε ολόκληρο τον προϋπολογισμό εκπαίδευσης της DeepSeek...

Οι επιπτώσεις είναι τεράστιες:

Η ανάπτυξη της Τεχνητής Νοημοσύνης γίνεται πιο προσιτή
Ο ανταγωνισμός αυξάνεται δραματικά
Οι απαιτήσεις υλικού και το κόστος πέφτουν κατακόρυφα.

Μήπως όμως τις επιπτώσεις αυτές θα έπρεπε να τις δούμε την ίδια στιγμή και ως ένα νέο εφαλτήριο;

Ένα εφαλτήριο που καθιστά την ΑΙ πιο προσιτή σε όλο το οικοσύστημα της τεχνολογίας, με αποτέλεσμα την έναρξη της ανάπτυξης μιας ευρείας σειράς χρήσιμων εφαρμογών που θα αυξήσουν την παραγωγικότητα και θα έχουν άμεσο αντίκρυσμα στην καθημερινότητα μας;

Η ανοιχτή πρόσβαση στην ΑΙ επιτρέπει στις εταιρείες να την εκμεταλλευτούν για συγκεκριμένα επιχειρηματικά αποτελέσματα, μειώνοντας τα εμπόδια εισόδου για τις μικρές και το τεράστιο κόστος για τις μεγάλες, επιταχύνοντας τον ρυθμό υιοθέτησης της ΑΙ σε διάφορους τομείς.

Σκεφτείτε τώρα το εξής: Αν με 200 άτομα και πρόσβαση κυρίως στις κάρτες Η800 της Νvidia, η DeepSeek έκανε την ανατροπή, ποιες νέες δυνατότητες ανοίγονται για τις Big Tech τύπου Microsoft, Apple, Αlphabet κ.α που έχουν πρόσβαση στα πιο προηγμένα τσιπ, χιλιάδες άτομα προσωπικό και πρόσβαση στην νέα πρωτοποριακή τεχνολογία της DeepSeek μιας και είναι ανοικτού κώδικα;

Επιπλέον, πιθανότατα να γλυτώσουν δισεκατομμύρια επενδύσεων που είχαν προϋπολογίσει για τα επόμενα χρόνια!

Αυτός είναι ο λόγος που όχι μόνο απείχαν από την ακραία μεταβλητότητα των δύο τελευταίων ημερών οι Microsoft, Alphabet, Amazon, Apple και Meta, αλλά στην ουσία οι περισσότερες σημείωσαν και άνοδο.

Οι δηλώσεις χθες το βράδυ του Altman στο X είναι ενδεικτικές αυτής της οπτικής γωνίας:

«Το r1 της DeepSeek είναι ένα εντυπωσιακό μοντέλο, ιδιαίτερα όσον αφορά το τι μπορεί να προσφέρει σε σχέση με το κόστος του. Εμείς προφανώς θα παραδώσουμε πολύ καλύτερα μοντέλα και επίσης είναι αναζωογονητικό να έχουμε ένα νέο ανταγωνιστή!»

Μαίρη Βενέτη

Venetimary1@gmail.com

Aποποίηση Ευθύνης

Το υλικό αυτό παρέχεται για πληροφοριακούς και μόνο σκοπούς. Σε καμία περίπτωση δεν πρέπει να εκληφθεί ως προσφορά, συμβουλή ή προτροπή για την αγορά ή πώληση των αναφερόμενων προϊόντων. Παρόλο που οι πληροφορίες που περιέχονται βασίζονται σε πηγές που θεωρούνται αξιόπιστες, καμία διασφάλιση δε δίνεται ότι είναι πλήρεις ή ακριβείς και δεν θα πρέπει να εκλαμβάνονται ως τέτοιες.