DH t(r)ip της Παρασκευής_31 | Πέρα από τις τυπωμένες λέξεις: χειρόγραφα και ψηφιακές τεχνολογίες
Τα χειρόγραφα τεκμήρια, μαζί με τα βιβλία, είναι μεταξύ των βασικών πηγών έρευνας για πολλούς μελετητές από διάφορους κλάδους των Ανθρωπιστικών Σπουδών. Εκτός από επιστημονικούς κλάδους που ασχολούνται με ειδικούς τύπους τεκμηρίων, όπως η Παπυρολογία και η Εκδοτική, η πρόσβαση στις ποικίλες χειρόγραφες πρωτογενείς πηγές (πάπυροι, περγαμηνές και χαρτώα τεκμήρια, κ.ά.) και η εργασία με αυτές, διευκολύνεται από νέες ψηφιακές μεθόδους και εργαλεία.
Η τεχνολογία Optical Character Recognition (OCR) επιτρέπει τη μετατροπή κειμένων σε αναγνωρίσιμη από τους υπολογιστές μορφή. Αποτελεί την πιο κοινή μέθοδο ψηφιοποίησης έντυπων κειμενικών τεκμηρίων, παρέχοντας παράλληλα τη δυνατότητα επεξεργασίας και τροποποίησης του μεγέθους και του τύπου των αρχείων. Τα λογισμικά που χρησιμοποιούν την τεχνολογία OCR χορηγούν ικανοποιητικής ακρίβειας αποτελέσματα σε τυπωμένα κείμενα, όχι όμως και στην περίπτωση χειρόγραφων τεκμηρίων. Το κενό αυτό καλύπτει η τεχνολογία Handwritten Text Recognition (HTR), που αναγνωρίζει τον γραφικό χαρακτήρα χρησιμοποιώντας “πρότυπα” γραφής που αντιστοιχίζονται με γράμματα. Η HTR εξελίσσεται μέσα από πρωτοβουλίες όπως το tranScriptorium, μια σύμπραξη ερευνητικών και πανεπιστημιακών ιδρυμάτων που αξιοποιεί το περιεχόμενο ιστορικών ντοκουμέντων για να αντλήσει δεδομένα και να αναπτύξει ένα ολοκληρωμένο, αποτελεσματικό και προσιτό σύστημα αναγνώρισης χαρακτήρων.
Τι γίνεται όμως όταν ο όγκος του υλικού καθιστά δύσκολη -έως αδύνατη- την ολοκλήρωση των διαφόρων project; Τότε υιοθετείται η πρακτική του πληθοπορισμού (crowdsourcing) και ζητείται η συνδρομή του κοινού για τη μετατροπή των αρχείων από τη φυσική σε ψηφιακή μορφή. Η υλοποίηση αυτών των έργων μπορεί να γίνει με τη χρήση εύχρηστων εργαλείων ανοικτού κώδικα, όπως τα Scripto και FromThePage. Το Scripto αναπτύχθηκε από το Roy Rosenzweig Center for History and New Media και έχει ήδη χρησιμοποιηθεί στα projects The City War in Letters και DIY History του Πανεπιστημίου της Αϊόβα. Αντίστοιχα, το εργαλείο FromThePage χρησιμοποιούν προγράμματα όπως το Julia Brumfield Diaries. Δίνεται με τον τρόπο αυτό η δυνατότητα στον οποιονδήποτε να ξεκινήσει το δικό του πρόγραμμα μεταγραφής χειρογράφων σε ψηφιακή μορφή.
Την ίδια στιγμή που οργανισμοί πειραματίζονται με εργαλεία και μοντέλα για την ευκολότερη μεταγραφή των χειρόγραφων τεκμηρίων τους, η ερευνητική κοινότητα του ΤΕΙ (Text Encoding Initiative) επεξεργάζεται ένα κοινό πρότυπο για την ηλεκτρονική περιγραφή της σύνθετης πληροφορίας των χειρόγραφων πηγών, οι οποίες περιέχουν -εκτός από το κείμενο- και πληροφορίες σχετικά με την επιφάνεια της σελίδας, τη διακόσμηση, τις παρεμβάσεις του εκδότη-μελετητή (όπως ο υπομνηματισμός του) και τις κριτικές διαπιστώσεις του γύρω από τα γραφικά σημάδια του τεκμηρίου (διαγραφές, προσθήκες κ.ο.κ). Έτσι, έχουν οργανωθεί και χρησιμοποιούνται ειδικές κατηγορίες κωδικοποίησης προκειμένου να περιγραφούν τα χειρόγραφα, οι πρωτογενείς πηγές και οι απαραίτητες πληροφορίες που αφορούν στο κριτικό υπόμνημα. Αυτές οι συμβάσεις κωδικοποίησης βρίσκουν εφαρμογή σε πολλές προσπάθειες ψηφιακής αναπαράστασης κι αποκατάστασης χειρογράφων, όπως για παράδειγμα στα σημειωματάρια του Proust, όπου επιχειρείται να αποδοθεί η διαδοχή των συγγραφικών σταδίων.
Μια σειρά από πολύ ενδιαφέροντα project ψηφιακής μεταγραφής κειμένων -ποικίλης και πολύ ενδιαφέρουσας θεματολογίας- υλοποιούνται ήδη. Το Transcribe Bentham αποτελεί μια συνεργατική πρωτοβουλία μεταγραφής των χειρογράφων του φιλοσόφου και νομικού Jeremy Bentham, που φυλάσσονται στα αρχεία του Πανεπιστημίου του UCL, ενώ το Ancient Lives δίνει τη δυνατότητα σε όσους ενδιαφέρονται για την παπυρολογία να βοηθήσουν στην ανάγνωση και ψηφιακή απόδοση των Παπύρων της Οξυρρύγχου. Τέλος, oι Bodleian Libraries του Πανεπιστημίου της Οξφόρδης καλούν μουσικόφιλους εθελοντές της βιβλιοθήκης να περιγράψουν τις παρτιτούρες από τις μουσικές συλλογές τους, ενώ, μεταγράφοντας τις ψηφιοποιημένες σελίδες των ημερολογίων των αμερικανικών πλοίων από τα μέσα του 19ου αιώνα, μπορεί κανείς να συνεισφέρει στην επιστημονική έρευνα των κλιματικών συνθηκών του παρελθόντος.
H t(r)ip team της ερευνητικής ομάδας Ακαδημίας Αθηνών DARIAH-ΑΤΤΙΚΗ:
Διδώ-Δανάη Γεωργούλα, Άννα Μαρία Σιχάνη, Ηράκλειτος Σουγιουλτζόγλου, Γεράσιμος Χρυσοβιτσάνος