Του Γιάννη Παλιούρη
Οι οικονομικοί αναλυτές της Wall Street απολαμβάνουν αναγνώριση «ημίθεων» και απολαβές που ζαλίζουν – τουλάχιστον στις περιόδους που τα Χρηματιστήρια τραβούν την ανηφόρα. Η ικανότητά τους να πλοηγούνται μέσα σε ωκεανούς οικονομικών δεδομένων και να βρίσκουν «νησίδες» κερδών, είναι αυτή που τους καθιστά αναντικατάστατους. Εκτός αν σε λίγα χρόνια οι επενδυτές προτιμήσουν το αλγοριθμικό μοντέλο ανάλυσης που ανέπτυξαν ερευνητές στο ΜΙΤ, το οποίο προέβλεψε με πολύ μεγαλύτερη ακρίβεια τις πωλήσεις διάφορων εταιρειών, χρησιμοποιώντας μάλιστα κλάσμα των δεδομένων που είχαν στη διάθεσή τους αναλυτές της Wall Street.
Στον χρηματοοικονομικό τομέα υπάρχει αυξανόμενο ενδιαφέρον για τη χρήση ανακριβών αλλά τεράστιων δεδομένων, για την πρόβλεψη εταιρικών κερδών. Ο λόγος για τα «εναλλακτικά» δεδομένα τα οποία βρίσκονται κάτω από το ραντάρ των παραδοσιακών μετρήσεων. Παράγονται καθημερινά με φρενήρεις ρυθμούς, αλλά δεν συγκεντρώνονται συστηματικά υπό τη μορφή επίσημων στοιχείων. Η ροή ειδήσεων στο Διαδίκτυο ή η αλληλεπίδραση στα social media, είναι χαρακτηριστικά παραδείγματα «εναλλακτικών» δεδομένων. Μέχρι πριν λίγα χρόνια θεωρούνταν αδιάφορα ή αδύνατο να τύχουν αξιοποίησης, λόγω της αδυναμίας εξαγωγής συμπερασμάτων από αυτά.
Ερευνητές του ΜΙΤ δημιούργησαν ένα αλγοριθμικό μοντέλο προβλέψεων που κατόρθωσε να χειραγωγήσει «εναλλακτικά» δεδομένα μόνο από ανώνυμες εβδομαδιαίες συναλλαγές πιστωτικών καρτών και τριμηνιαίες εκθέσεις κερδοφορίας, τριάντα εταιρειών. Το μοντέλο ξεπέρασε τις συνδυασμένες εκτιμήσεις ειδικών αναλυτών της Wall Street στο 57% των προβλέψεων, για τα αποτελέσματα του επόμενου τριμήνου. Μάλιστα, οι αναλυτές είχαν πρόσβαση σε όλα τα διαθέσιμα ιδιωτικά ή δημόσια δεδομένα, ενώ το μοντέλο των ερευνητών χρησιμοποίησε ένα πολύ μικρό σύνολο δεδομένων.
Καλώς ή κακώς, πολλά καταναλωτικά στοιχεία όχι μόνο διατηρούνται αλλά και διατίθενται προς πώληση. Στις ΗΠΑ οι λιανοπωλητές, για παράδειγμα, μπορούν να αγοράσουν στοιχεία για συναλλαγές μέσω πιστωτικών καρτών ή δεδομένα τοποθεσίας για να δουν πόσα άτομα ψωνίζουν σε έναν ανταγωνιστή. Οι διαφημιζόμενοι μπορούν να χρησιμοποιήσουν αντίστοιχα στοιχεία για να δουν πώς επηρεάζουν οι διαφημίσεις τους τις πωλήσεις.
Προηγμένα εργαλεία Τεχνητής Νοημοσύνης και Μηχανικής Μάθησης έχουν πλέον τη δυνατότητα όχι μόνο να εξορύξουν δυσπρόσιτα και φαινομενικά άχρηστα δεδομένα, αλλά και να εξάγουν πολύτιμα στοιχεία από αυτά. Ουσιαστικά είναι να σαν τιθασεύεις ένα χαοτικό κύμα πληροφοριών, αξιοποιώντας την ενέργεια που το συνοδεύει.
Όπως και σε κάθε άλλη περίπτωση που αφορά δεδομένα έτσι και η χρήση των «alternative data» είναι ένα ακανθώδες ζήτημα που έχει να κάνει με την προστασία της ιδιωτικότητας. Δεν είναι τυχαίο ότι ήδη από το 2017 οι Financial Times είχαν επισημάνει τις ανησυχίες επενδυτών για τις πληροφορίες που λάμβαναν μέσω «εναλλακτικών δεδομένων». Το γεγονός ότι παράγουμε έναν ωκεανό δεδομένων δεν σημαίνει αυτόματα, ότι οποιοσδήποτε μπορεί να τσαλαβουτά μέσα σε αυτόν.