DeepSeek: Ποια είναι η κινεζική εταιρεία που απειλεί την πρωτοκαθεδρία των ΗΠΑ
Τεχνητή Νοημοσύνη

DeepSeek: Ποια είναι η κινεζική εταιρεία που απειλεί την πρωτοκαθεδρία των ΗΠΑ

Χρειάστηκαν μόλις μία συνεδρίαση στην Wall Street και μία ανακοίνωση από πλευράς μιας εταιρείας που μετρά μόλις ένα χρόνο ζωής, της κινεζικής AI startup DeepSeek, για να οδηγηθούν οι τεχνολογικές μετοχές σε μαζικό sell off τη Δευτέρα στο Χρηματιστήριο της Νέας Υόρκης. Το νέο μοντέλο Τεχνητής Νοημοσύνης, υπό την ονομασία «DeepSeek R1», ήρθε για να ταράξει τα νερά στις αγορές και να κλονίσει την εμπιστοσύνη των επενδυτών ως προς τη βιωσιμότητα της δυτικής κυριαρχίας στον τομέα AI.

Το νέο μοντέλο Τεχνητής Νοημοσύνης αναπτύχθηκε από την DeepSeek, μια startup που ιδρύθηκε το 2023 και κατάφερε με κάποιο τρόπο μια σημαντική ανακάλυψη που ο διάσημος επενδυτής τεχνολογίας Μαρκ Αντρέεσεν έχει αποκαλέσει «η στιγμή Σπούτνικ της Tεχνητής Nοημοσύνης».

Ο Αντρέεσεν, υποστηρικτής του Τραμπ και συνιδρυτής της εταιρείας επιχειρηματικών κεφαλαίων της Silicon Valley Andreessen Horowitz, αποκάλεσε το DeepSeek «μία από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις που έχω δει ποτέ», σε ανάρτησή του στο X.

Σύμφωνα με τα όσα υποστηρίζει η εταιρεία, το DeepSeek R1 μπορεί να φτάσει σχεδόν τις δυνατότητες των πολύ πιο διάσημων αντιπάλων του, όπως το GPT-4 της OpenAI, το Llama της Meta και το Gemini της Google - αλλά με κόστος εκπληκτικά μικρότερο από τα αντίστοιχα που έχουν ξοδέψει οι «κολοσσοί» της Τεχνητής Νοημοσύνης.

Συγκεκριμένα, η εταιρεία ισχυρίζεται ότι ξόδεψε μόλις 5,6 εκατομμύρια δολάρια για να τροφοδοτήσει το βασικό μοντέλο AI της, σε σύγκριση με τα εκατοντάδες εκατομμύρια, αν όχι δισεκατομμύρια δολάρια, που ξοδεύουν οι αμερικανικές εταιρείες για τις δικές τους τεχνολογίες Τεχνητής Νοημοσύνης.

Με απλά λόγια, η DeepSeek φαίνεται ότι κατόρθωσε να δημιουργήσει ένα μοντέλο Τεχνητής Νοημοσύνης χαμηλού κόστους και μάλιστα κάνοντας χρήση μικροτσίπ ΑΙ σχετικά χαμηλής ισχύος.

Όπως εκτιμούν έμπειροι αναλυτές, οι ειδήσεις γύρω από το DeepSeek R1 ήταν «γροθιά στο στομάχι» για τις ΗΠΑ, οι οποίες εδώ και χρόνια πασχίζουν να περιορίσουν την προμήθεια μικροτσίπ ΑΙ υψηλής ισχύος προς την Κίνα, επικαλούμενες ανησυχίες για την εθνική ασφάλεια.

Ποια είναι, όμως, η DeepSeek;

Η εταιρεία, η οποία ιδρύθηκε στα τέλη του 2023 από τον Κινέζο διαχειριστή hedge fund Λιάνγκ Γουενφένγκ, είναι μία από τις δεκάδες startups που έχουν εμφανιστεί τα τελευταία χρόνια, αναζητώντας χρηματοδοτήσεις και μεγάλες επενδύσεις, ώστε να καβαλήσουν το «κύμα» της Τεχνητής Νοημοσύνης, που έχει οδηγήσει παγκοσμίως την τεχνολογική βιομηχανία σε νέα ύψη.

Για τους «παροικούντες την τεχνολογική Ιερουσαλήμ», ο Γουενφένγκ είναι ο Σαμ Άλτμαν της Κίνας, ένας πρωτοπόρος των τεχνολογιών ΑΙ και των επενδύσεων σε νέες έρευνες. Ο ίδιος είναι επικεφαλής του hedge fund, High-Flyer, το οποίο επικεντρώνεται στην ανάπτυξη εφαρμογών Τεχνητής Νοημοσύνης.

Σύμφωνα με άρθρο της Wall Street Journal, η DeepSeek ανήκε στην ομάδα των AI startups, όπως οι Anthropic και Perplexity, που είχαν κυκλοφορήσει διάφορα μοντέλα AI το 2024, με σκοπό να τραβήξουν την προσοχή του κλάδου της υψηλής Τεχνολογίας.

Όπως και άλλες νεοσύστατες επιχειρήσεις AI, συμπεριλαμβανομένων των Anthropic και Perplexity, η DeepSeek κυκλοφόρησε διάφορα ανταγωνιστικά μοντέλα AI κατά τη διάρκεια του περασμένου έτους που έχουν τραβήξει την προσοχή του κλάδου. Το μοντέλο V3 της αύξησε κάποια ευαισθητοποίηση σχετικά με την εταιρεία, αν και οι περιορισμοί του περιεχομένου της γύρω από ευαίσθητα θέματα σχετικά με την κινεζική κυβέρνηση και την ηγεσία της προκάλεσαν αμφιβολίες σχετικά με τη βιωσιμότητά της ως ανταγωνιστή του κλάδου, όπως ανέφερε η αμερικανική εφημερίδα.

Και ύστερα ήρθε το μοντέλο R1…

Στα τέλη του 2024 η εταιρεία δημοσιεύει λάνσαρε το μοντέλο R1, το οποίο κυκλοφόρησε επίσημα την περασμένη εβδομάδα, κερδίζοντας την προσοχή του κόσμου, όταν η εταιρεία αποκάλυψε στην WSJ το συγκλονιστικά χαμηλό κόστος λειτουργίας του.

Το σπουδαιότερο, όμως, είναι το γεγονός ότι το R1 είναι ένα μοντέλο ανοιχτού κώδικα, γεγονός που συνεπάγεται ότι και άλλες εταιρείες μπορούν να το δοκιμάσουν και να βασιστούν στο μοντέλο, με σκοπό να το βελτιώσουν.

Μέσα σε μία εβδομάδα από την επίσημη κυκλοφορία της, η εφαρμογή DeepSeek βρέθηκε πολύ ψηλά στα charts του App Store, ενώ τη Δευτέρα ξεπέρασε σε downloads ακόμη και το ChatGPT, έχοντας «κατεβεί» πάνω από 1 εκατ. φορές.

Γιατί θεωρείται σημαντική η είδηση για την DeepSeek

Η Τεχνητή Νοημοσύνη είναι ένας τεχνολογικός κλάδος που απαιτεί μεγάλα αποθέματα αλλά και σημαντικές δαπάνες. Υπενθυμίζεται πως ήδη ισχυροί «παίκτες» ΑΙ στις ΗΠΑ αγοράζουν εταιρείες πυρηνικής ενέργειας, ώστε να προμηθεύουν με επαρκές απόθεμα ηλεκτρικής ενέργειας τα μοντέλα ΑΙ που αναπτύσσουν.

Υπενθυμίζεται ότι την περασμένη εβδομάδα η Meta ανακοίνωσε δαπάνη άνω των 65 δισ. δολαρίων για την ανάπτυξη τεχνολογιών ΑΙ, ενώ κατά τις ίδιες ημέρες ο πρόεδρος των ΗΠΑ, Ντόναλντ Τραμπ, ανακοίνωσε επένδυση άνω των 500 δισ. δολαρίων για την Τεχνητή Νοημοσύνη υπό την ονομασία Stargate.

Υπό το πρίσμα αυτό, η εμφάνιση μιας εταιρείας που ευαγγελίζεται μικρότερο κόστος και μάλιστα με τσιπ μικρότερης ισχύος έρχεται να σημάνει μια αισθητή αλλαγή ως προς τον τρόπο σκέψης και αντίληψης ενός ολόκληρου κλάδου. Αν τα όσα υποστηρίζει η DeepSeek μπορούν να επιτευχθούν με σημαντικά μειωμένο κόστος, τότε σίγουρα ανοίγονται νέες προοπτικές στον τομέα της Τεχνητής Νοημοσύνης.

Τι θα πρέπει να προσέξουμε ως προς την DeepSeek

Την ίδια στιγμή, πάντως, υπάρχουν και εκείνοι που υποστηρίζουν ότι θα πρέπει να περιμένουμε να δούμε σε βάθος χρόνου πώς θα κριθεί η αξιοπιστία της DeepSeek ως προς αυτά που ευαγγελίζεται.

Ο κλάδος των Big Tech δέχεται τους ισχυρισμούς της εταιρείας ότι το κόστος δημιουργίας του μοντέλου R1 ήταν τόσο χαμηλό (5,6 εκατ. δολάρια). Κανείς, μέχρι στιγμής, δε φαίνεται να αμφισβητεί αυτά τα δεδομένα, ωστόσο η DeepSeek δεν έχει πει μέχρι στιγμής δημοσίως πόσο κόστισε η εκπαίδευση του μοντέλου της, αφήνοντας έξω τα δυνητικά έξοδα έρευνας και ανάπτυξης.

Ένα δεύτερο δεδομένο αφορά σε αυτό καθαυτό το επιστημονικό επίτευγμα: Σίγουρα ένα νέο επαναστατικό μοντέλο AI είναι σημαντικό, αλλά ενδεχομένως να μην είναι αρκετό, ώστε να υπερκεράσει την πολυετή πρόοδο των ΗΠΑ στον τομέα της Τεχνητής Νοημοσύνης.Και μια μαζική μετατόπιση πελατών σε μια κινεζική νεοσύστατη επιχείρηση είναι μάλλον απίθανη.