Του Γιάννη Γορανίτη
Ένα λογισμικό τεχνητής νοημοσύνης που ανέπτυξε ο κινεζικός κολοσσός Alibaba Group κατόρθωσε να αποδώσει καλύτερα από τους ανθρώπους σε ένα απαιτητικό τεστ κατανόησης κειμένου.
Το νέο αυτό τεστ, ειδικά σχεδιασμένο από το πανεπιστήμιο του Στάνφορντ, είναι το πιο αναλυτικό και σαφώς μεγαλύτερο από όλα τα αντίστοιχα που έχουν δοκιμαστεί μέχρι σήμερα. Από το λανσάρισμά του μέχρι σήμερα δεκάδες οργανισμοί, εταιρείες και εκπαιδευτικοί φορείς έχουν σπεύσει να δοκιμάσουν τις δυνατότητες των μηχανών τους: από τη Microsoft Research και την Samsung Research, μέχρι την Tencent, το Allen Institute for Artificial Intelligence και το Facebook AI Research.
Το λογισμικό της Alibaba όμως έγινε το πρώτο που απέδωσε καλύτερα από τους ανθρώπους, γεννώντας ελπίδες για το μέλλον της τεχνητής νοημοσύνης, αλλά και ανησυχίες για την πανθομολογούμενη απώλεια θέσεων εργασίας που συνδέεται με την ανάπτυξη της ΑΙ. Η συγκεκριμένη εξέλιξη, για παράδειγμα, θα μπορούσε να συνδεθεί με την απώλεια θέσεων εργασίας σε τμήματα εξυπηρέτησης πελατών.
Το (χαμένο) πλεονέκτημα των ανθρώπων
Το ερωτηματολόγιο SQuAD (The Stanford Question Answering Dataset) δημιουργήθηκε με στόχο τη σύγκριση των δυνατοτήτων των διάφορων μοντέλων τεχνητής νοημοσύνης με τις αντίστοιχες των ανθρώπων. Το πλέον προνομιακό πεδίο είναι η κατανόηση κειμένου –χώρος όπου αντικειμενικά ο άνθρωπος έχει πλεονέκτημα έναντι των μηχανών, σε αντίθεση για παράδειγμα με μαθηματικές διεργασίες, δοκιμασίες υπολογισμού και παιχνίδια όπως το σκάκι, η ντάμα, το Go κ.ά., όπου οι μηχανές έχουν αποκτήσει πλεονέκτημα. Ή τέλος πάντων, έτσι πιστεύαμε μέχρι πριν λίγες ημέρες.
Το SQuAD λοιπόν αποτελείται από περισσότερα από 100.000 ζεύγη ερωταπαντήσεων, οι οποίες αντλούνται από 500 και πλέον άρθρα της Wikipedia. Η απάντηση δεν μπορεί να προκύψει χωρίς να έχει προηγηθεί ανάγνωση και κατανόηση του κειμένου, αποκλείοντας με αυτό τον τρόπο –και σε συνδυασμό με τον μεγάλο αριθμό ερωτήσεων– τον παράγοντα της τυχαιότητας. Πριν λίγες ημέρες το προηγμένο μοντέλο μηχανικής μάθησης της Alibaba απάντησε σωστά σε 82.440 ερωτήσεις, ξεπερνώντας όλα τα υπόλοιπα λογισμικά ΑΙ, αλλά και για πρώτη φορά την ανθρώπινη επίδοση (το ρεκόρ ως τώρα ήταν 82.304).
Μπορείτε να διαβάσετε ολόκληρη τη μελέτη των ερευνητών του Στάνφορντ σε αυτό το link και να δοκιμάσετε να απαντήσετε στις ερωτήσεις εδώ.
Τι μπορεί να αλλάξει;
Αν ένα bot κερδίσει τον παγκόσμιο πρωταθλητή στο σκάκι, θα μιλάμε για μια εντυπωσιακή εξέλιξη, αλλά μάλλον ελάχιστοι θα ανησυχήσουν για το επαγγελματικό τους μέλλον (εκτός ίσως από τον ίδιο τον πρωταθλητή!). Όταν όμως μια μηχανή ξεπερνάει τον άνθρωπο στην κατανόηση και ανάλυση κειμένου, οι θετικές και αρνητικές επιδράσεις ενδέχεται να είναι πολύ σημαντικότερες.
Οι εταιρείες για παράδειγμα που αναπτύσσουν αυτούς τους αλγόριθμους δεν κρύβουν ότι στοχεύουν στην αντικατάσταση των ανθρώπων που εργάζονται στην εξυπηρέτηση πελατών με μηχανές. Πολύ σύντομα, ένα τηλεφωνικό κέντρο για παράδειγμα θα μπορούσε να λειτουργήσει εξίσου αποτελεσματικά αν στις θέσεις των ανθρώπων «κάθονταν» bots. Αρκεί βέβαια, οι ερωτήσεις να μπορούν να απαντηθούν με σαφείς απαντήσεις, και να μην περιέχουν αφηρημένες ή σύνθετες έννοιες.
Η Alibaba δοκίμασε πρόσφατα μια εκδοχή του λογισμικού και οι ιθύνοντές της δηλώνουν ενθουσιασμένοι με τα αποτελέσματα. Δεν ξέρουμε βέβαια, αν τον ενθουσιασμό τους συμμερίζονται και οι εργαζόμενοι στο τμήμα, που δεν αποκλείεται σύντομα να χάσουν τη δουλειά τους. Αλλά αυτό είναι ένα ζήτημα που δεν μπορεί να απασχολεί μόνο την τεχνολογική κοινότητα, καθώς τα επόμενα χρόνια αναμένεται να λειτουργήσει ως βραδυφλεγής βόμβα, η οποία όμως αν απασφαλιστεί έγκαιρα και ορθά μπορεί να λειτουργήσει ευεργετικά για τις κοινωνίες και τις οικονομίες.