Του Γιάννη Γορανίτη
Μία selfie αρκεί για να δημιουργήσετε ένα άκρως ρεαλιστικό 3D ομοίωμα του προσώπου σας. Αυτό τουλάχιστον κατάφερε με τη βοήθεια της Τεχνητής Νοημοσύνης και του machine learning μια ερευνητική ομάδα στη Μ. Βρετανία.
Μέλη της τετραμελούς ομάδας που υπογράφει τη σχετική εργασία είναι και δύο Έλληνες επιστήμονες, ο Βασίλης Αργυρίου από το Kingston University και ο Γιώργος Τζιμιρόπουλος από το Πανεπιστήμιο του Nottingham. Ζητήσαμε από τον Δρ. Βασίλη Αργυρίου, ο οποίος αποφοίτησε από το Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης και σήμερα διδάσκει στο Πανεπιστήμιο του Kingston, να μας περιγράψει τη λειτουργία της εφαρμογής.
«Η μελέτη προσφέρει ένα νέο μηχανισμό για 3D ανακατασκευή προσώπου από μόνο μία εικόνα», μας εξηγεί ο κ. Αργυρίου. «Έχει τη δυνατότητα να προσαρμόζεται σε διάφορες εκφράσεις και προσανατολισμούς του προσώπου, ενώ προσφέρει μεγάλη ακρίβεια ακόμη και σε περιπτώσεις που έχουμε θόρυβο ή επικαλύψεις. Επίσης παρουσιάζει ένα νέο τρόπο προσέγγισης του προβλήματος παρακάμπτοντας πολλά ενδιάμεσα στάδια που ήταν απαραίτητα σε προηγούμενες τεχνικές».
Οι χρηστικές εφαρμογές
Η τεχνολογία στην οποία βασίζεται η εφαρμογή ονομάζεται convolutional neural-network (CNN, συνελικτικό νευρωνικό δίκτυα) και αξιοποιείται ευρέως στο deep learning. Όπως μας εξηγεί ο κ. Αργυρίου «Το Deep learning χρησιμοποιείται σε εφαρμογές μηχανικής μάθησης και γνωστά παραδείγματα είναι το ΑΙ της Google που κέρδισε στο παιχνίδι GO τον παγκόσμιο πρωταθλητή, τα συστήματα αναγνώρισης ομιλίας στα κινητά (όπως η Siri), για αυτόματη διόρθωση κειμένου, σε αυτοκίνητα χωρίς οδηγό, εφαρμογές αναγνώρισης τραγουδιών ή αντικειμένων, κτλ». Όσον αφορά τη χρήση της τεχνολογίας στο στη συγκεκριμένο project o Βασίλης Αργυρίου μας ανέφερε το νέο είδος δικτύου Volumetric Regression Network (VRN) το οποίο θα χρησιμοποιηθεί σε αντίστοιχα προβλήματα 3D ανακατασκευής.
Αναφερόμενος στις μελλοντικές εφαρμογές του '3D Face Reconstruction from a Single Image', ο κ. Αργυρίου στέκεται στην αναγνώριση προσώπου για λόγους ασφαλείας (π.χ. σε αεροδρόμια ή σε χώρους όπου συνωστίζεται μεγάλο πλήθος), ενώ μπορεί να αξιοποιηθεί και σε αρκετές ψυχαγωγικές εφαρμογές. Ενδεικτικά μας ανέφερε την αξιοποίησή του σε mobile apps (Face Swap κτλ.), στον κινηματογράφο για τη δημιουργία ειδικών εφέ και βέβαια στον χώρο των videogames όπου μεταξύ άλλων ο κάθε χρήστης μπορεί με τη βοήθεια της εφαρμογής να δημιουργεί ένα τρισδιάστατο avatar με το πρόσωπό του. «Γενικά μπορεί να αξιοποιηθεί από οποιαδήποτε εφαρμογή που επεξεργάζεται ή χρειάζεται την τρισδιάστατη πληροφορία του προσώπου», μας λέει.
Η εργασία της ερευνητικές ομάδας δημοσιεύτηκε εδώ ενώ όσοι θέλουν να δοκιμάσουν την εφαρμογή μπορούν να επισκεφτούν το online demo εδώ. Ήδη, δεκάδες χιλιάδες χρήστες του internet ανέβασαν μια φωτογραφία τους, προκειμένου να δουν τη 3D εκδοχή του προσώπου τους. Για λόγους ασφαλείας τα μοντέλα που δημιουργούνται αυτοκαταστρέφονται μετά από λίγα λεπτά.
Τα μελλοντικά project
Όπως μας είπε ο Έλληνας καθηγητής, η ερευνητική δουλειά συνεχίζεται. Αυτή την περίοδο εργάζεται στο μεγαλεπήβολο project EU H2020, το οποίο μεταξύ άλλων στοχεύει στην ανάλυση της συμπεριφοράς ανθρώπων σε μεγάλες συγκεντρώσεις όπως συναυλίες, αγώνες, εκδηλώσεις, κτλ.
«Σκοπεύουμε να χρησιμοποιήσουμε αντίστοιχες deep learning τεχνικές βασισμένες σε CNNs, και άλλα δίκτυα (GANs και RNNs)», δήλωσε χαρακτηριστικά. Το συγκεκριμένο project ονομάζεται MONICA και περισσότερες πληροφορίες μπορείτε να βρείτε στο site www.monica-project.eu.
Η μεγάλη σημασία του εγχειρήματος υπερτονίζεται από το ότι στην ερευνητική συμμετέχουν περισσότεροι από 25 οργανισμοί σε όλη την Ευρώπη, αλλά και από τον συνολικό προϋπολογισμό, που ξεπερνά τα 15 εκατ. ευρώ.