Του Γιάννη Γορανίτη
Για πρώτη φορά στην ιστορία της τεχνολογίας μια μηχανή έφτασε σε τόσο υψηλά επίπεδα αντίληψης και προσαρμοστικότητας, που κατάφερε να νικήσει ορισμένους από τους καλύτερους παίκτες πόκερ παγκοσμίως.
Το σύστημα τεχνητής νοημοσύνης (AI) που πέτυχε την ιστορική αυτή νίκη αποκαλείται Libratus και αναπτύχθηκε επί δύο χρόνια από εξειδικευμένους επιστήμονες Πληροφορικής του Πανεπιστημίου Carnegie Mellon (CMU).
Η νίκη του έχει ακόμη μεγαλύτερη αξία όχι μόνο γιατί ήταν σαρωτική και επετεύχθη εις βάρος τεσσάρων κορυφαίων επαγγελματιών παικτών, αλλά γιατί σημειώθηκε σε ένα 20ήμερο τουρνουά πόκερ. Το παιχνίδι μάλιστα ήταν το λεγόμενο «no-limit Texas Hold' em», στο οποίο δεν υπάρχουν όρια στα πονταρίσματα και η τακτική των παικτών αναδιαμορφώνεται διαρκώς.
Θρίαμβος μετά από 120.000 «χέρια»
Για να αντιληφθείτε την έκταση της επιτυχίας της μηχανής και τον ελάχιστο βαθμό τυχαιότητας, αξίζει να αναφέρουμε ότι κατά τη διάρκεια του τουρνουά παίχτηκαν 120.000 παρτίδες. Μετά την ολοκλήρωσή τους, ο Libratus είχε συγκεντρώσει $1,76 εκατομμύρια σε (εικονικές) μάρκες και οι ανθρώπινοι αντίπαλοί του είχαν σηκώσει τα χέρια ψηλά.
Σε αντίθεση με άλλα παιχνίδια με χαρτιά, αλλά και το σκάκι, το τάβλι ή τη ντάμα, στο πόκερ και δη στην παραλλαγή του «Texas Hold'em» διαδραματίζει σοβαρό ρόλο η ψυχολογία του παίκτη, την οποία φυσικά δεν είναι εύκολο να αντιληφθεί ο υπολογιστής. Το ίδιο ισχύει και για τις μπλόφες, που στην πλειονότητα των παρτίδων αποτελούν βασικό κριτήριο της έκβασης. Όπως χαρακτηριστικά δηλώνει ο επικεφαλής του ερευνητικού προγράμματος, Tuomas Sandholm: «Ο υπολογιστής δεν πρόκειται να κερδίσει στο πόκερ, αν δεν μπορεί να μπλοφάρει».
Προκειμένου να φτάσει σε αυτό το επίπεδο, στο «μυαλό» του Libratus έτρεξαν σε προσομοίωση 15 εκατομμύρια ώρες παιχνιδιού. Το μυαλό αυτό φιλοξενείται σε έναν υπερ-υπολογιστή που τρέχει στα 1,35 petaflops και διαθέτει 274ΤΒ μνήμης (περίπου 7.000 φορές ταχύτερος από το πιο γρήγορο laptop της αγοράς).
Ο καθηγητής Tuomas Sandholm (δεύτερος από αριστερά) και ο διδακτορικός φοιτητής Noam Brown (δεξιά του) που σχεδίασαν τον Libratus, ανάμεσα στους ηττημένους επαγγελματίες του πόκερ.
Ικανότητες μάθησης
Η προσομοίωση όμως πριν το τουρνουά δεν ήταν αρκετή, γι' αυτό και οι ερευνητές του Πανεπιστημίου Carnegie Mellon επιστράτευσαν τις πιο σύγχρονες τεχνολογίες μηχανικής μάθησης. Με αυτό τον τρόπο η μηχανή μάθαινε κατά τη διάρκεια των παιχνιδιών, παρατηρώντας τη στρατηγική και τον τρόπο παιχνιδιού των επαγγελματιών παικτών.
Κάθε βράδυ πάντως μετά την ολοκλήρωση του παιχνιδιού, οι ερευνητές ανατροφοδοτούσαν τον υπολογιστή με τα δεδομένα και προσάρμοζαν τον αλγόριθμο στις απαιτήσεις του παιχνιδιού. Το ίδιο άλλωστε έκαναν –και κάνουν– οι παίκτες κατά τη διάρκεια τέτοιων τουρνουά. Σε αυτή την περίπτωση, οι παίκτες προσπαθούσαν και σε κάποιο βαθμό πετύχαιναν να αποκρυπτογραφήσουν την τακτική και τον τρόπο παιχνιδιού της μηχανής, οπότε ο Libratus έπρεπε να διαφοροποιείται διαρκώς και σε αυτό τον τομέα.
Η επιτυχία λοιπόν του ρομποτικού χαρτοπαίκτη ήταν ότι προσαρμόστηκε στις συνήθειες και το στυλ των ανθρώπων και κάθε μέρα που περνούσε γινόταν και καλύτερος. Προς το τέλος, οι αντίπαλοί του παραδέχτηκαν ότι ήταν αδύνατο να τον αντιμετωπίσουν.
Στο γράφημα απεικονίζεται η πρόοδος της μηχανής έναντι των ανθρώπων κατά τη διάρκεια του παιχνιδιού.
Και γιατί χρειαζόμαστε έναν υπερ-υπολογιστή που κερδίζει στο πόκερ;
Προφανώς και δεν τον χρειαζόμαστε. Όπως δεν χρειαζόμαστε τον Deep Blue που κέρδισε τον παγκόσμιο πρωταθλητή στο σκάκι, τον IBM Watson που επικράτησε στο τηλεπαιχνίδι γνώσεων Jeopardy ή τη μηχανή τεχνητής νοημοσύνης της Google, AlphaGo που νίκησε τους ανθρώπους στο επιτραπέζιο Go.
Όλες αυτές οι νίκες των μηχανών δεν αποτελούν παρά επίδειξη των δυνατοτήτων τους. Ο Libratus μπορεί να κατασκευάστηκε για να «ταπεινώσει» τους αντιπάλους του στο πόκερ, αλλά οι μελλοντικές εφαρμογές του είναι αναρίθμητες. Όπως χαρακτηριστικά λέει ο δημιουργός του: «Φανταστείτε ότι το smartphone σας κάποια μέρα θα είναι σε θέση να διαπραγματευτεί την καλύτερη τιμή για το νέο σας αυτοκίνητο. Αυτό είναι μόνο η αρχή».
Για παράδειγμα μηχανές που αξιοποιούν την Τεχνητή Νοημοσύνη και τη μηχανική μάθηση θα μπορούν να αξιοποιούνται στη λήψη σύνθετων αποφάσεων π.χ. επιχειρήσεων ή χρηματιστών, να θωρακίζουν την ασφάλεια υπολογιστικών συστημάτων από περίπλοκες επιθέσεις ή να αναλύουν σύνθετα ιατρικά δεδομένα και να προτείνουν βέλτιστες θεραπείες.
Ο δημιουργός του μάλιστα, καθηγητής Sandholm σκοπεύει να αξιοποιήσει τις δυνατότητές του στο πλαίσιο της δουλειάς του στην Optimized Markets, μια εταιρεία που ειδικεύεται στην αυτοματοποίηση των διαπραγματεύσεων.
Στο ενδιάμεσο, ίσως να κερδίζει και κανένα τουρνουά πόκερ…