Μετά το λανσάρισμα της έκδοσης 1.0 τον περασμένο Δεκέμβριο, η Google ανακοίνωσε το Gemini 1.5 ως το μοντέλο επόμενης γενιάς.
Η ισχύς του είναι το παράθυρο περιεχομένου, το πόσα μπορεί να κατανοήσει δηλαδή και μετράται σε tokens. Το Gemini 1.5 Pro έχει 1 εκατομμύριο tokens, τη στιγμή που το GPT-4 έχει 128.000. Πρακτικά αυτό σημαίνει 10-11 ώρες βίντεο ή δεκάδες χιλιάδες γραμμές κώδικα.
Η Google ισχυρίστηκε ότι από τότε που ξεκίνησε το Gemini 1.0, δοκιμάζει, βελτιώνει και ενισχύει συνεχώς τις δυνατότητές του - και το 1.5 Pro είναι αποτέλεσμα των προσπαθειών της. Όσον αφορά την υποκείμενη τεχνολογία, το 1.5 Pro βασίζεται στην αρχιτεκτονική Mixture-of-Experts (MoE). Η αρχιτεκτονική MoE μπορεί να γίνει κατανοητή ως μια συλλογική προσέγγιση όπου το συνολικό πρόβλημα διαιρείται σε πολυάριθμα επιμέρους καθήκοντα, τα οποία αργότερα εκπαιδεύονται από ένα σύμπλεγμα εμπειρογνωμόνων σε κάθε επιμέρους καθήκον. Στην ουσία, το μοντέλο MoE καλύπτει διαφορετικά δεδομένα εισόδου με διαφορετικούς εκπαιδευόμενους ή εμπειρογνώμονες.
Το Gemini 1.5 Pro μπορεί να αναλύσει, να ταξινομήσει και να συνοψίσει απρόσκοπτα μεγάλες ποσότητες περιεχομένου μέσα σε μια δεδομένη προτροπή.
Η Google λέει ότι το Gemini 1.5 Pro μπορεί να αιτιολογήσει διάφορες λεπτομέρειες από τα 402 σελίδων πρακτικά της αποστολής Apollo 11 στη Σελήνη. Επιπλέον, μπορεί να αναλύσει σημεία πλοκής και γεγονότα από μια βωβή ταινία 44 λεπτών με πρωταγωνιστή τον Μπάστερ Κίτον.
Επίσης, μπορεί να εκτελέσει πιο σημαντικές εργασίες επίλυσης προβλημάτων σε μεγαλύτερα τμήματα κώδικα. Όταν του δίνεται μια προτροπή με περισσότερες από 100.000 γραμμές κώδικα, μπορεί να σκεφτεί καλύτερα σε διάφορα παραδείγματα, να προτείνει χρήσιμες τροποποιήσεις και να δώσει εξηγήσεις για το πώς λειτουργούν τα διάφορα μέρη του κώδικα.
Προς το παρόν, το Gemini 1.5 Pro θα διατεθεί μόνο σε επιχειρήσεις και developers, μέσω των Vertex AI και AI Studio της Google. Με τον καιρό, θα αντικαταστήσει τις προηγούμενες εκδόσεις του Gemini. Θα γίνει διαθέσιμο σε όλους στο gemini.google.com με 128.000 tokens, ενώ όσοι θέλουν το ισχυρό μοντέλο του 1 εκατομμύριο tokens θα πρέπει να πληρώσουν.
Το Gemini 1.5 Pro (128.000 token context window) κυκλοφορεί ως limited preview σε προγραμματιστές και εταιρικούς πελάτες μέσω των AI Studio και Vertex AI. Περιγράφεται ως πειραματικό κατά τη διάρκεια αυτής της περιόδου.