Η Google αποκαλύπτει το Project Mariner: Ένας «πράκτορας» AI έρχεται στο Chrome
Shutterstock
Shutterstock
TechCrunch

Η Google αποκαλύπτει το Project Mariner: Ένας «πράκτορας» AI έρχεται στο Chrome

Ο πρώτος «πράκτορας» Τεχνητής Νοημοσύνης, ο οποίος αναλαμβάνει... δράση στο διαδίκτυο, είναι γεγονός. Η Google, παρουσίασε την Τετάρτη (11/12), ένα ερευνητικό πρωτότυπο από το τμήμα DeepMind της εταιρείας με την ονομασία Project Mariner.

Ο εν λόγω «πράκτορας», που λειτουργεί με το Gemini, αναλαμβάνει τον έλεγχο του προγράμματος περιήγησης Chrome, μετακινεί τον κέρσορα στην οθόνη σας, πατάει κουμπιά και συμπληρώνει φόρμες, επιτρέποντάς του να χρησιμοποιεί και να περιηγείται στους ιστότοπους, όπως θα έκανε ένας άνθρωπος.

Η εταιρεία ξεκινά με την απελευθέρωση του «πράκτορα» Τεχνητής Νοημοσύνης σε μια μικρή ομάδα προεπιλεγμένων χρηστών, αναφέρει η Google.

Η Google συνεχίζει να πειραματίζεται με νέους τρόπους για το Gemini να διαβάζει, να συνοψίζει και τώρα να χρησιμοποιεί ιστοσελίδες. Ένα στέλεχος της Google δήλωσε στο TechCrunch ότι αυτό αποτελεί μέρος μιας «θεμελιωδώς νέας αλλαγής παραδείγματος UX»: μετακινώντας τους χρήστες μακριά από την άμεση αλληλεπίδραση με τους ιστότοπους, και αντ' αυτού να αλληλεπιδρούν με ένα γενετικό σύστημα Τεχνητής Νοημοσύνης που το κάνει για εσάς».

Σε μια επίδειξη, η διευθύντρια της Google Labs Jaclyn Konzelmann έδειξε πώς λειτουργεί το Project Mariner.

«Αφού ρυθμίσετε τον «πράκτορα» Τεχνητής Νοημοσύνης με μια επέκταση στο Chrome, ένα παράθυρο συνομιλίας εμφανίζεται στα δεξιά του προγράμματος περιήγησής σας. Μπορείτε να δώσετε εντολή στον πράκτορα να κάνει πράγματα όπως «να δημιουργήσει ένα καλάθι αγορών από ένα παντοπωλείο με βάση αυτή τη λίστα».

Από εκεί, ο «πράκτορας» ΤΝ πλοηγήθηκε στον ιστότοπο ενός παντοπωλείου -στην προκειμένη περίπτωση της Safeway- και στη συνέχεια αναζήτησε και πρόσθεσε αντικείμενα σε ένα εικονικό καλάθι αγορών. Ένα πράγμα που γίνεται αμέσως αντιληπτό είναι το πόσο αργός είναι ο «πράκτορας»: Υπήρχαν περίπου 5 δευτερόλεπτα καθυστέρησης μεταξύ κάθε κίνησης του δρομέα. Ορισμένες φορές, ο «πράκτορας» σταματούσε την εργασία του και επέστρεφε στο παράθυρο συνομιλίας, ζητώντας διευκρινίσεις για ορισμένα στοιχεία (πόσα καρότα κ.λπ.).

Ο «πράκτορας» της Google δεν μπορεί να κάνει check out, καθώς δεν πρέπει να συμπληρώνει αριθμούς πιστωτικών καρτών ή πληροφορίες χρέωσης. Το Project Mariner δεν θα δέχεται επίσης cookies για τους χρήστες, ούτε θα υπογράφει συμφωνία όρων χρήσης. Η Google λέει ότι σκόπιμα δεν του επιτρέπει να κάνει αυτά τα πράγματα, προκειμένου να δώσει στους χρήστες περισσότερο έλεγχο.

Στο παρασκήνιο, λαμβάνει στιγμιότυπα οθόνης του παραθύρου του προγράμματος περιήγησης, κάτι με το οποίο οι χρήστες θα πρέπει να συμφωνήσουν στους όρους παροχής υπηρεσιών, και τα στέλνει στο Gemini στο cloud για επεξεργασία. Το Gemini στη συνέχεια στέλνει οδηγίες πίσω στον υπολογιστή σας για την πλοήγηση στην ιστοσελίδα.

Το Project Mariner μπορεί επίσης να χρησιμοποιηθεί για την εύρεση πτήσεων και ξενοδοχείων, για αγορές οικιακών ειδών, για την εύρεση συνταγών και για άλλες εργασίες που σήμερα απαιτούν από τους χρήστες να κάνουν κλικ στον ιστό.

Σημαντική προειδοποίηση είναι ότι το Project Mariner λειτουργεί μόνο στην πρώτη ενεργή καρτέλα ενός προγράμματος περιήγησης Chrome, πράγμα που σημαίνει ότι δεν μπορείτε να χρησιμοποιήσετε τον υπολογιστή σας για άλλα πράγματα, ενώ ο «πράκτορας» εργάζεται στο παρασκήνιο - πρέπει να παρακολουθείτε το Gemini να κάνει αργά κλικ. Ο επικεφαλής τεχνολογίας της Google DeepMind, Koray Kavukcuoglu, λέει ότι αυτή ήταν μια πολύ σκόπιμη απόφαση, ώστε οι χρήστες να γνωρίζουν τι κάνει.

Εκτός από το Project Mariner, η Google παρουσίασε την Τετάρτη και αρκετούς άλλους «πράκτορες» ΤΝ για πιο συγκεκριμένες εργασίες.

Το Deep Research, έχει στόχο να βοηθήσει τους χρήστες να εξερευνήσουν πολύπλοκα θέματα, δημιουργώντας ερευνητικά σχέδια πολλαπλών βημάτων. Ωστόσο, εκπρόσωπος της Google σημειώνει ότι δεν έχει σχεδιαστεί για να λύνει προβλήματα μαθηματικής και λογικής συλλογιστικής, να γράφει κώδικα ή να κάνει ανάλυση δεδομένων. Ο «πράκτορας» ΤΝ κυκλοφορεί σήμερα στο Gemini Advanced και θα έρθει στην εφαρμογή Gemini το 2025.

Ο Jules, έχει ως στόχο να βοηθήσει τους προγραμματιστές με εργασίες κωδικοποίησης. Ενσωματώνεται απευθείας στις ροές εργασίας του GitHub, επιτρέποντας στο Jules να βλέπει την υπάρχουσα εργασία σας και να κάνει αλλαγές απευθείας στο GitHub. Το Jules κυκλοφορεί σε μια επιλεγμένη ομάδα δοκιμαστών beta και θα είναι διαθέσιμο αργότερα μέσα στο 2025.