DH t(r)ip της Παρασκευής_88 | Δικτυώνοντας τα κείμενα: Η εκδοτική των κειμένων στην εποχή του σημασιολογικού ιστού
Ποιος είναι ο ρόλος των κειμενικών σπουδών και ειδικότερα της εκδοτικής των κειμένων στην ψηφιακή εποχή; Δεν αρκεί η ψηφιοποίηση των πρωτογενών κειμενικών πηγών; Κι όμως, τις τελευταίες δεκαετίες η συζήτηση γύρω από φιλολογικές, ιστορικο-κριτικές εκδόσεις τεκμηρίων της παγκόσμιας γραμματείας γνωρίζει νέα άνθιση, ακριβώς χάρη στην ψηφιακή συνθήκη. Η ίδια η εκδοτική εργασία (μια διανοητική εργασία πάνω στο κείμενο-πηγή, την ιστορία του και την υλικότητά του) αναγνωρίζεται όχι ως έργο μετατροπής γλωσσικών δεδομένων σε μηχαναγνώσιμη μορφή, αλλά ως μια διαδικασία που η ίδια παράγει (δομημένα) δεδομένα, δηλαδή γνώση. Το μέλλον της ψηφιακής εκδοτικής είναι η δικτύωση αυτής της γνώσης μέσα από την υιοθέτηση ανοικτών προτύπων.
Στην ψηφιακή συνθήκη, στόχος μιας έκδοσης είναι η παροχή όχι μόνο ενός επιμελημένου κειμένου αλλά και όλων των μεταδεδομένων τόσο για το κείμενο όσο και για τις εκδοτικές επιλογές. Το πλέον διαδεδομένο πρότυπο περιγραφής και αναπαράστασης κειμενικών τεκμηρίων και πληροφορίας σε ψηφιακή μορφή είναι αυτό που διαμορφώνει η πρωτοβουλία TEI (Text Encoding Initiative). Μια ψηφιακή εκδοτική εργασία με αυτούς τους όρους λειτουργεί ως παραγωγή και οργάνωση κειμενικής γνώσης: για τη διαδικασία της γραφής (π.χ. διαγραφές, προσθήκες κλπ.), την υλικότητα του τεκμηρίου, το κειμενικό περιεχόμενο (σημασιολογική πληροφορία), τα γλωσσικά δεδομένα (γλωσσολογική πληροφορία) κλπ. Το πρότυπο TEI μετρά αρκετές δεκαετίες ερευνητικής αξιοποίησης και είναι ήδη διαθέσιμες πολλές ψηφιακές εκδόσεις που βασίζονται σε αυτό, σε ποικίλα πεδία των ανθρωπιστικών επιστημών, από την επιγραφική μέχρι τη νεοελληνική λογοτεχνία. Οι ψηφιακές αυτές εκδόσεις διαφέρουν μεταξύ τους ως προς το αν δίνουν έμφαση στην αναπαράσταση και κωδικοποίηση στοιχείων του υλικού τεκμηρίου («τεκμηριοκεντρικές εκδόσεις») ή στην παροχή ενός εξομαλυμένου, χρηστικού κειμένου προς ανάγνωση και ανάλυση με μεθόδους εξόρυξης δεδομένων («κειμενοκεντρικές εκδόσεις»). Η διάκριση αυτή, ωστόσο, είναι κάθε άλλο παρά απόλυτη και μάλλον αφορά την προηγούμενη, πρώτη φάση της ψηφιακής εκδοτικής. Σήμερα, η επιστημολογική παραδοχή είναι ότι κάθε είδος ψηφιακού εκδοτικού έργου οργανώνει και παράγει δεδομένα και άρα είναι πρόσφορο για ψηφιακή κειμενική ανάλυση. Η συνειδητοποίηση αυτή στρέφει πλέον το ενδιαφέρον προς την αξιοποίηση των ψηφιακών φιλολογικών εκδόσεων (και) ως αποθετηρίων δεδομένων, και μάλιστα σημασιολογικά εμπλουτισμένων δεδομένων.
Παραδοσιακά, η έντυπη εκδοτική πρακτική συμπεριλάμβανε κωδικοποίηση της πληροφορίας μέσω, μεταξύ άλλων, του συνοδευτικού κριτικού υπομνήματος. Σήμερα, στην εποχή του σημασιολογικού ιστού δεν αρκεί η παραγωγή δομημένων δεδομένων, έστω και με τη μέθοδο κωδικοποίησης του προτύπου TEI. Η προστιθέμενη αξία αυτών των δεδομένων, ειδικά όσων αφορούν ονοματικές οντότητες (πρόσωπα, τόπους, γεγονότα, οργανισμούς κλπ.), πολλαπλασιάζεται όταν μετατρέπονται σε ανοικτά διασυνδεδεμένα δεδομένα (Linked Open Data)· όταν, για παράδειγμα, συνδέονται με καθιερωμένους καταλόγους οντοτήτων όπως Wikidata, VIAF κ.ο.κ. Το πρότυπο TEI εξασφαλίζει όχι μόνο τη διαλειτουργικότητα (μέσω της χρήσης κοινού, προτυποποιημένου λεξιλογίου επισημείωσης) αλλά και τη διασυνδεσιμότητα των πληροφοριών μέσω αντιστοίχισης με εξωτερικούς καταλόγους καθιερωμένων όρων. Για παράδειγμα, το τρέχον project DraCor συγκεντρώνει έργα της ευρωπαϊκής δραματουργίας κωδικοποιημένα σε TEI και εμπλουτισμένα με σημασιολογικά δεδομένα (π.χ. σύνδεση των ονομάτων των συγγραφέων με Wikidata) που επιτρέπουν πολυεπίπεδη κειμενική εξόρυξη. Αντίστοιχα, η πρόσφατη ψηφιακή έκδοση Paolo Bufalini’s Notebook συνδυάζει την κριτική μεταγραφή και επισημείωση του ημερολογιακού τεκμηρίου με τον σημασιολογικό εμπλουτισμό του και τη διασύνδεση των ευρετηριασμένων προσώπων και έργων με καθιερωμένα λεξιλόγια. Η συγκεκριμένη έκδοση αυτοαποκαλείται σημασιολογική (semantic), ωστόσο νέοι όροι προτείνονται συνεχώς: δεδομενοκεντρική, δικτυωμένη ή δηλωτική (assertive) έκδοση (με τον τελευταίο όρο να προέρχεται από το πεδίο των ιστορικών σπουδών).
Η διασυνδεσιμότητα των δεδομένων επιτρέπει και τη δημιουργία μετα-καταλόγων, όπως ο ερευνητικός πόρος correspSearch. Search scholarly editions of letters: αξιοποιώντας το ανοικτό πρότυπο Correspondence MetadataInterchange Format (CMIF), επιτρέπει την ψηφιακή δικτύωση ανόμοιων, αλλά συνδεδεμένων συλλογών αλληλογραφίας μέσω των μεταδεδομένων τους, για στοχευμένες αναζητήσεις με βάση αποστολέα, αποδέκτη, χρονολογία ή τόπο.
Συγγραφή: Μαρία Ακριτίδου
Επιμέλεια: Γεράσιμος Χρυσοβιτσάνος