Κάθε φορά που το Netflix μας προτείνει μια νέα ταινία ή το Facebook μας «σερβίρει» νέους φίλους, στο παρασκήνιο τρέχουν πανίσχυροι αλγόριθμοι ικανοί να διαβάσουν τις προτιμήσεις μας με βάση τα στοιχεία που έχουν συγκεντρώσει για εμάς. Πολύπλοκες εικασίες, σίγουρα όχι τόσο όσο εκείνες του Γκόλντμπαχ και του Πουανκαρέ, οι οποίες ωστόσο κάθε φορά επιλύονται με στοχευμένο τρόπο χάρη στη βοήθεια μηχανών που μπορούν να βουτάνε σε ωκεανούς δεδομένων, ανασύροντας μόνο όσα είναι χρήσιμα.
Μπορεί άραγε η μέθοδος αυτή να βρει χρήση και σε άλλα πεδία; Τι θα γινόταν, για παράδειγμα, αν αντί για τη βιβλιοθήκη του Netflix, δίναμε ως «τροφή» σε αλγόριθμους γενετικά δεδομένα και βιομοριακά συμπυκνώματα;
Αυτό ακριβώς έκαναν ερευνητές από το St John's College στο Κέιμπριτζ. Μεγάλα δεδομένα που είχαν προκύψει κατά τη διάρκεια δεκαετιών έρευνας τέθηκαν στην υπηρεσία της μηχανικής μάθησης ώστε να αποκρυπτογραφήσει τη «βιολογική γλώσσα» του καρκίνου, του Αλτσχάιμερ και άλλων νευροεκφυλιστικών ασθενειών. Η μελέτη τους δημοσιεύτηκε στο επιστημονικό περιοδικό PNAS στις 8 Απριλίου και θα μπορούσε να χρησιμοποιηθεί στο μέλλον για να διορθώσει τα λάθη που λαμβάνουν χώρα μέσα στα κύτταρα.
Το ανθρώπινο σώμα φιλοξενεί χιλιάδες πρωτεΐνες, πολλές εκ των οποίων διαδραματίζουν άγνωστο σε εμάς ρόλο. Αν και αποτελούν απαραίτητα θρεπτικά συστατικά για το ανθρώπινο σώμα, υπό συγκεκριμένες συνθήκες λειτουργούν ως πυροκροτητές εκδήλωσης σοβαρών ασθενειών.
Οι ερευνητές του St John's College ζήτησαν από ένα μοντέλο μηχανικής που βασίζεται σε νευρωνικά δίκτυα να μάθει τη γλώσσα των πρωτεϊνών και συγκεκριμένα των μετασχηματισμένων βιομοριακών συμπυκνωμάτων που βρίσκονται στα κύτταρα, ώστε να σπάσουν τη «γλώσσα» βιολογικών δυσλειτουργιών που προκαλούν καρκίνο και νευροεκφυλιστικές ασθένειες όπως το Αλτσχάιμερ.
Οι πρωτεΐνες είναι μεγάλα, πολύπλοκα μόρια που έχουν κρίσιμο ρόλο στη διατήρηση της ζωής, καθώς είναι οι θεμέλιοι λίθοι της δομής, της λειτουργίας και της ρύθμισης των ιστών και των οργάνων του σώματος. Στη νόσο του Αλτσχάιμερ, η οποία πλήττει 50 εκατομμύρια ανθρώπους παγκοσμίως, οι πρωτεΐνες σχηματίζουν συσσωματώματα και σκοτώνουν υγιή νευρικά κύτταρα. Ένας υγιής εγκέφαλος διαθέτει μηχανισμούς για να απορρίπτει αποτελεσματικά αυτές τις δυνητικά επικίνδυνες μάζες πρωτεϊνών. Αυτό, όμως, δεν συμβαίνει πάντα.
Σύμφωνα με τη σχετική δημοσίευση, τα πρωτεϊνικά συμπυκνώματα έχουν προσελκύσει τα τελευταία χρόνια την προσοχή της επιστημονικής κοινότητας επειδή ελέγχουν βασικά γεγονότα στο κύτταρο όπως η γονιδιακή έκφραση - η διαδικασία που προκαλεί τη μεταφορά κωδικοποιημένων πληροφοριών (του γονιδίου) στο λειτουργικό προϊόν του γονιδίου (πρωτεΐνη ή RNA) - και την πρωτεϊνική σύνθεση - η διαδικασία με την οποία τα κύτταρα χρησιμοποιούν το DNA, το RNA και τα ένζυμα για να σχηματίσουν πρωτεϊνικά μόρια. Τυχόν ελαττώματα στις ποσότητες των πρωτεϊνών μπορούν δυνητικά να οδηγήσουν στην εκδήλωση σοβαρών ασθενειών.
Οι ερευνητές τροφοδότησαν τον αλγόριθμο με όλα τα διαθέσιμα δεδομένα για τις γνωστές πρωτεΐνες, ώστε να μπορεί να μάθει και να προβλέπει τη «γλώσσα» τους, με τον ίδιο τρόπο που ένας κειμενογράφος προβλέπει τη λέξη που γράφουμε και τη συμπληρώνει αυτόματα ή κάνει προτάσεις διόρθωσης.
Τότε μπόρεσαν να «ρωτήσουν» για τη «γραμματική» που οδηγεί μερικές μόνο πρωτεΐνες στο σχηματισμό συμπυκνωμάτων μέσα στα κύτταρα. Ενα εξαιρετικά δύσκολο πρόβλημα, η επίλυση του οποίου μπορεί να ξεκλειδώσει τη γλώσσα μιας νόσου. Η περαιτέρω χρήση της μηχανικής μάθησης θα μπορούσε να μεταμορφώσει την έρευνα για τον καρκίνο και τις νευροεκφυλιστικές ασθένειες. Ο τελικός στόχος είναι η χρήση τεχνητής νοημοσύνης για την ανάπτυξη στοχευμένων φαρμάκων που θα βοηθήσουν ριζικά στην ανακούφιση των συμπτωμάτων ή και θα εξαλείψουν ασθένειες που σήμερα είναι ανίατες.