Το 2025 θα είναι η χρονιά των agents της Τεχνητής Νοημοσύνης, σύμφωνα με την αντιπρόεδρο και γενική διευθύντρια του Gemini app and Speech στην Google, Sissie Hsiao.
Πρόκειται, δηλαδή, για προγράμματα λογισμικού, τα οποία, υποβοηθούμενα από την Τεχνητή Νοημοσύνη θα μπορούν να ολοκληρώσουν πολύπλοκες εργασίες, αυτόνομα και με μεγάλη ταχύτητα.
Μάλιστα, όπως αναφέρει η ίδια, η βιομηχανία της τεχνολογίας «τρέχει», προκειμένου να θέσει στη διάθεση των καταναλωτών εφαρμογές Τεχνητής Νοημοσύνης, αλλά αυτό είναι μόνο μια «γεύση» των συνολικών δυνατοτήτων που διαθέτει.
Για παράδειγμα, είπε η Hsiao, οι καταναλωτές χρησιμοποιούν το Gemini AI της Google για πιο προηγμένες εργασίες, όπως εξάσκηση για συνεντεύξεις για δουλειά με το Gemini Live και διόρθωση σφαλμάτων κώδικα με το Gemini Advanced.
Ήδη, από το Νοέμβριο, η Google λάνσαρε μια εφαρμογή iPhone για το Gemini, που περιλάμβανε τη νέα λειτουργία φωνητικής βοηθού Gemini Live, η οποία μπορεί να χειριστεί φυσικές συνομιλίες με διακοπές, καθώς και αλλαγές θεματολογίας. Μέχρι στιγμής, το Gemini Live προσφέρει 10 διαφορετικές φωνητικές επιλογές και υποστηρίζει 12 γλώσσες, συμπεριλαμβανομένων των ισπανικών και των αραβικών. Μάλιστα, στελέχη της Google δήλωσαν ότι σχεδιάζουν να αναπτύξουν περισσότερες γλώσσες.
Ο Gemini, ο οποίος δεν είναι τίποτα άλλο παρά ένας agent Τεχνητής Νοημοσύνης, «κάποια στιγμή στο εγγύς μέλλον θα είναι βαθιά εξατομικευμένος, θα θυμάται τι του έχετε πει στο παρελθόν και με τη δική σας καθοδήγηση, θα μπορεί να ενεργεί για λογαριασμό σας σε όλο το οικοσύστημα της Google, σε υπηρεσίες τρίτων και στο Web», ανέφερε η Sissie Hsiao.
Ακόμη, αναφέρθηκε στη νέα λειτουργία Τεχνητής Νοημοσύνης της Google, στο Gemini Advanced, που ονομάζεται Deep Research. Η λειτουργία αυτή χρησιμοποιεί την Τεχνητή Νοημοσύνη για να εξερευνήσει πολύπλοκα θέματα και να μετατρέψει τα ευρήματα σε εύχρηστες αναφορές για τους χρήστες. Μάλιστα, η Hsiao αποκάλεσε το Deep Research «το πρώτο χαρακτηριστικό» στο Gemini «που φέρνει στη ζωή το όραμά μας για την ανάπτυξη περισσότερων δυνατοτήτων agents στα προϊόντα».
Η αγορά ΤΝ το επόμενο έτος θα αφορά «τη συνέχιση της δημιουργίας του πλήρους οικοσυστήματος», δήλωσε η ίδια, προσθέτοντας ότι εμπορικά τη βλέπει παρόμοια με την αγορά των smartphones.
«Δεν πρόκειται πλέον μόνο για το υλικό, αλλά για ολόκληρο το οικοσύστημα εφαρμογών, υπηρεσιών και ενοποιήσεων που το περιβάλλουν», δήλωσε η Hsiao. «Ομοίως με την Τεχνητή Νοημοσύνη, το πόσο καλά θα εκτελέσουμε την οικοδόμηση του πιο ολοκληρωμένου και φιλικού προς τον χρήστη οικοσυστήματος είναι επιτακτική ανάγκη».
Η Google επικεντρώνεται στο να καταστήσει το Gemini τον «πιο χρήσιμο προσωπικό βοηθό AI» το 2025, δήλωσε ο Hsiao, προσθέτοντας ότι το κλειδί για να γίνει αυτό είναι η ενσωμάτωση της AI στην καθημερινή ζωή των χρηστών και η απρόσκοπτη ενσωμάτωση της καθημερινής ρουτίνας.
Η Hsiao αναφέρθηκε και στο Gemini Live, μια εμπειρία συνομιλίας για κινητά τηλέφωνα, που επιτρέπει στους χρήστες να συνομιλούν ελεύθερα με το chatbot.
«Το να μπορείς να μιλάς στον Gemini όταν ψάχνεις για ιδέες ή κάνεις πρόβες για μια σημαντική συζήτηση, άλλαξε τα δεδομένα», δήλωσε η Hsiao. «Προχωρώντας προς τα εμπρός, θα δοθεί ακόμη μεγαλύτερη έμφαση σε χαρακτηριστικά που κάνουν την αλληλεπίδραση με την Τεχνητή Νοημοσύνη ακόμη πιο εύκολη, προσιτή και χρηστική».
Και το 2025 θα δούμε τις τεχνολογικές εταιρείες που εστιάζουν στην ΤΝ να συνεχίζουν να αναπτύσσουν πολυτροπική ή πολυμεσική ΤΝ. Δηλαδή, μοντέλα που μπορούν να επεξεργάζονται διαφορετικούς τύπους δεδομένων πέραν του κειμένου, όπως η ομιλία, η εικόνα και το βίντεο.
Στο πλαίσιο αυτό, στο τελευταίο ετήσιο συνέδριο προγραμματιστών της Google, η εταιρεία παρουσίασε το Project Astra, το οποίο αποτελεί μια ματιά στο μέλλον των πολυτροπικών ή πολυμεσικών βοηθών AI.