Η μηχανική μάθηση βοηθά ήδη στα αρχαία ελληνικά κείμενα

Μια πρόσφατα δημοσιευμένη μελέτη από το Nature πρόσφερε μια προφανή ιδέα συνδέοντας τις δυνατότητες του ιστορικού πεδίου και της μηχανικής μάθησης. Εάν υπάρχουν πολλά κείμενα ήδη επεξεργασμένα από ιστορικούς, εν προκειμένω αρχαιοελληνικές επιγραφές χαραγμένες σε πέτρα, κεραμική ή μέταλλο, τότε η μηχανική μάθηση μπορεί να κάνει μια πρόταση με βάση τα υπάρχοντα υλικά για την ανασύσταση των υπόλοιπων αποσπασματικών κειμένων και τον προσδιορισμό του τόπου και του χρόνου τους δημιουργία. Το μεγαλύτερο πρόβλημα για τους ιστορικούς είναι ότι οι επιγραφές έχουν καταστραφεί με την πάροδο του χρόνου και δεν μπορεί να γίνει γνωστός ο ακριβής χρόνος και ο τόπος δημιουργίας τους, καθώς οι φορείς των επιγραφών θα μπορούσαν να έχουν μεταφερθεί οπουδήποτε από την αρχική τους θέση στο πέρασμα των αιώνων. Όλα αυτά καθιστούν εξαιρετικά δύσκολη την αποκατάσταση και κατανόηση των κειμένων, δηλαδή την επιστήμη της επιγραφικής.

Οι συγγραφείς της μελέτης χρησιμοποίησαν το βαθύ νευρωνικό δίκτυο DeepMind Ithaca της Alphabet για την έρευνα, κατά τη διάρκεια της οποίας επεξεργάστηκαν ένα σύνολο δεδομένων 185.500 λεζάντων από το Ινστιτούτο Ανθρωπιστικών Σπουδών Packard. Στη μελέτη, οι ερευνητές εξέτασαν τόσο τα γράμματα όσο και τις λέξεις για να κατανοήσουν το πλαίσιο, ενώ αντικατέστησαν τα κατεστραμμένα γράμματα με ειδικούς χαρακτήρες.

Πηγή: DeepMind – Ithaca

Σύμφωνα με τους ερευνητές, η συνεργασία μηχανών και ανθρώπων οδηγεί στα πιο αποτελεσματικά αποτελέσματα, γι’ αυτό και η διαδικασία σχεδιάστηκε με αυτόν τον τρόπο. Μεταξύ των ψηφιοποιημένων κειμένων, προσδιορίστηκε η δυσκολία των εργασιών αποκατάστασης με τη βοήθεια ιστορικών, καθώς και οι κειμενικοί παραλληλισμοί που θα μπορούσαν να χρησιμεύσουν ως δείγματα. Στη συνέχεια, παρουσιάστηκε στους ιστορικούς η πιο πιθανή υπόθεση αποκατάστασης Ithaka 20-20 και το νευρωνικό δίκτυο Pythia (επίσης από το DeepMind) πραγματοποίησε την εργασία αποκατάστασης. Τέλος, οι ειδικοί έχουν επισημάνει στο κείμενο γνωστά ελληνικά προσωπικά ονόματα, κάτι που είναι απαραίτητο για τον προσδιορισμό του τόπου και της περιόδου.

Το αποτέλεσμα είναι αρκετά πειστικό για την αποκατάσταση των κειμένων, καθώς και για τον προσδιορισμό του τόπου και του χρόνου τους. Σύμφωνα με τη μελέτη Nature, η Ιθάκη από μόνη της αποκαθιστά κατεστραμμένα θραύσματα κειμένου με ακρίβεια 61,8%, αλλά και αύξησε το έργο των ιστορικών από 25,3% σε 71,7% ακρίβεια. Ο προσδιορισμός του τόπου δημιουργίας του κειμένου είναι 70,8% έναντι των τιμών του 21,2% όσων ασχολούνται με την ονομολογία. Το εργαλείο μπορεί επίσης να εκτιμήσει καλύτερα τον χρόνο δημιουργίας κειμένου, με ακρίβεια περίπου 29 ετών, από ό,τι συνώνυμα που επιτυγχάνονται με τιμές εντός 144 ετών σε δεδομένα δοκιμής.

Ο συγγραφείς της μελέτης εκτός από το να βοηθήσουν την ελληνική ιστορία, επέλεξαν και μια γενικότερη ερευνητική εστίαση, αποδεικνύοντας ότι η τεχνητή νοημοσύνη μπορεί να είναι ένα χρήσιμο εργαλείο στα χέρια των ιστορικών. Με τη βοήθεια του Ithaka, οι ερευνητές μπορούν τώρα να προσπαθήσουν να μελετήσουν σύνολα δεδομένων ακκαδικών, δημοτικών, εβραϊκών και Μάγια, αλλά στο μέλλον η DeepMind θέλει να κάνει και άλλες αρχαίες γλώσσες αναλύσιμες. Ιθάκη Ο ανοιχτός κώδικας του μπορεί να βρεθεί στο GitHubκαι στον χώρο των ερευνητών αρχαιοελληνικών επιγραφών μπορούν να πειραματιστούν με τη συσκευήκαι άλλα με προκαθορισμένα δείγματα κειμένων.

Mariya Makarova

"Τυπικός τηλεοπτικός νίντζα. Λάτρης της ποπ κουλτούρας. Ειδικός στο Διαδίκτυο. Λάτρης του αλκοόλ. Καταθλιπτικός αναλυτής. Γενικός λάτρης του μπέικον."

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *