Χώρος διαλόγου για τις Ψηφιακές Ανθρωπιστικές Σπουδές

DH t(r)ip της Παρασκευής_57 | Το πέρασμα της Διαλεκτολογίας στην ψηφιακότητα

Οι ταχύτατες και αλματώδεις εξελίξεις στην Υπολογιστική Γλωσσολογία έφεραν μια εναλλακτική προσέγγιση των περισσότερων θεωρητικών ζητημάτων της περιγραφής, ανάλυσης και επεξεργασίας της γλώσσας. Με τη συνδρομή των εργαλείων ανάλυσης κειμένων, την επεξεργασία ομιλίας και τη δημιουργία ψηφιακών σωμάτων κειμένων, σχεδόν όλοι οι κλάδοι της Γλωσσολογίας εντάσσονται δυναμικά στο τεχνολογικό άρμα με απώτερο σκοπό την ταχύτερη επεξεργασία των δεδομένων, τη διαχείριση μεγαλύτερου όγκου υλικού, την αυτόματη επισημείωση και ανάλυση. Οι παραπάνω αλλαγές δεν άφησαν ανεπηρέαστη τη Διαλεκτολογία που προϋποθέτει την ύπαρξη μεγάλου όγκου υλικού για να αναπτύξει και δημιουργήσει τις θεωρητικές της προσεγγίσεις. Από τη αναλογική διαχείριση δύσκολα συλλεχθέντων δεδομένων, γίνεται το πέρασμα στην ψηφιακότητα στις διαλέκτους και τα πρώτα βήματα κυριαρχίας της Υπολογιστικής Διαλεκτολογίας.

Οι Διάλεκτοι στον Παγκόσμιο και Ευρωπαϊκό Ψηφιακό Χάρτη: Πριν μερικές δεκαετίες οι πρώτες απόπειρες για την κατασκευή ενός ηλεκτρονικού σώματος κειμένων ή προφορικού λόγου αποτελούσε μεγάλη πρόκληση και εξαιρετικά δύσκολη προσπάθεια τόσο στην ψηφιοποίηση όσο και στην οργάνωση του υλικού. Ωστόσο, η ανάγκη για διαχείριση μεγάλου όγκου διαλεκτικών δεδομένων, καθώς και αξιοποίηση των ήδη υπαρχόντων μέσων καταχώρησης υλικού, όπως ημερολόγια, σημειωματάρια, βιβλία, κασέτες, μπομπίνες, ηχητικοί κύλινδροι οδήγησε σε μια συστηματική προσπάθεια προς την κατεύθυνση της συνύπαρξης με την Υπολογιστική Γλωσσολογία. Έχοντας αυτά ως βάση, η Υπολογιστική/ Ψηφιακή Διαλεκτολογία είχε όλα τα εχέγγυα για να πραγματοποιήσει τα πρώτα ψηφιακά προγράμματα μεγάλης εμβέλειας, όπως είναι το Syntactic Atlas of the Dutch Dialects (SAND), το Freiburg English Dialect Corpus (FRED), το Scottish Corpus of Texts and Speech (SCOTS), το ICE-Ireland, το Origins of New Zealand English (ΟΝΖΕ), το The Newcastle Electronic Corpus of Tyneside English (DECTE), αρκετών διαλεκτικών Ατλάντων μεταξύ άλλων.


Η διαλεκτική βάση GreeD (Greek Dialects) είναι η πρώτη συστηματική προσπάθεια συλλογής, ψηφιοποίησης, καταλογογράφησης και κωδικοποίησης διαλεκτικών προφορικών δεδομένων από το Εργαστήριο Νεοελληνικών Διαλέκτων του Πανεπιστημίου Πατρών και αποτελεί μια ενεργή προσπάθεια δεκαετίας συλλογής προφορικού υλικού από διαλέκτους και ιδιώματα της Ελληνικής τόσο του Ελλαδικού χώρου όσο και εκτός (Ιταλία, Τουρκία, Κύπρο). Η βάση δεδομένων ΔΙΑΦΩΝΗΕΝ αποτελεί προϊόν του ερευνητικού προγράμματος για τα φωνήεντα των Ελληνικών διαλέκτων: Φωνολογική και φωνητική ανάλυση, κατάρτιση διαλεκτικού ευρετηρίου και κοινωνική ευαισθητοποίηση για την ανάδειξη του γλωσσικού πλούτου. Επίσης η AMiGre  αποτελεί προϊόν ερευνητικού προγράμματος για την διεπαφή των Ποντιακών, Καππαδοκικών και Αϊβαλιώτικων στα χνάρια της Μικρασιατικής Ελληνικής γλώσσας. Η βάση δεδομένων του προγράμματος Καταγραφή και ανάλυση μιας γλώσσας υπό εξαφάνιση: το γραμματικό σύστημα της Γκρίκο περιέχει ηχητικά δεδομένα από τέσσερα ελληνόφωνα χωριά (Καλημέρα, Κοριλιάνο Ντ’ Ότραντο, Μαρτάνο και Στερνατία). Tο αρχείο ηχογραφήσεων των Ελληνικών διαλέκτων έχει δημιουργηθεί από τη συγκέντρωση ηχογραφήσεων Ελληνικών διαλέκτων που μιλιούνται σήμερα, στα νησιά  και  στην  ηπειρωτική  Ελλάδα.


Ψηφιακές υλοποιήσεις στην Ελληνική Διαλεκτολογία: Ακολουθώντας τα πρότυπα των βάσεων δεδομένων, οι αντίστοιχες πολυμεσικές βάσεις συνδυάζουν συχνά την εικόνα ψηφιοποιημένων αρχείων, τα ηχητικά δεδομένα ηχογραφήσεων και συνοδεύονται από τα αντίστοιχα μεταδεδομένα και τις απαραίτητες επισημειώσεις ανάλογα με τις ερευνητικές ανάγκες. Οι τρεις άξονες δόμησης των συγκεκριμένων βάσεων είναι πρωτίστως τα δεδομένα (οιασδήποτε μορφής και φύσεως), τα μεταδεδομένα περιγραφής και τέλος τα τεχνολογικά εργαλεία ανάλυσης και επεξεργασίας. Μια πολυμεσική βάση είναι απαραίτητο να διαθέτει όλους τους άξονες, αν και καταχρηστικά εντάσσονται σε αυτήν την κατηγορία διαλεκτικές βάσεις που πληρούν μόνο δύο από τα τρία κριτήρια.


Το αρχαιότερο και βαρύνουσας σημασίας έργο της Ακαδημίας Αθηνών είναι αναμφίβολα το Ιστορικόν Λεξικόν της Νέας Ελληνικής Γλώσσης της τε Κοινώς Ομιλουμένης και των Ιδιωμάτων (ΙΛΝΕ),  ένα ερμηνευτικό ιστορικό λεξικό, περιγραφικό και όχι ρυθμιστικό, της προφορικής Νέας Ελληνικής γλώσσας καθώς και όλων των διαλέκτων και ιδιωμάτων της. Στο ψηφιακό αποθετήριο της Ακαδημίας η ηλεκτρονική εκδοχή του ΙΛΝΕ περιλαμβάνει τους τυπωμένους πέντε τόμους (1933-1989), καθώς και τον προσφάτως εκδοθέντα έκτο τόμο (2017) καλύπτοντας έως και τη λέξη διάλεκτος. Το τριαδιαλεκτικό ΛΕΠΟΚΑΜ, το πολυμεσικό λεξικό των διαλέκτων του Πόντου, της Καππαδοκίας και του Αϊβαλιού, αποτελεί προϊόν του ερευνητικού προγράμματος AMiGre. Η Ανέμη (Ψηφιακή Βιβλιοθήκη Νεοελληνικών Σπουδών) περιλαμβάνει πλήθος από σαρωμένα γλωσσάρια, λεξικά, λεξιλόγια και διαλεκτικά βιβλία, τα οποία απλώς περιγράφονται από μεταδεδομένα MARC21, πρότυπο βιβλιοθηκονομίας, και χωρίς καμία δυνατότητα πραγματικής αξιοποίησης των πρωτογενών αρχείων. Για  την  κυπριακή  διάλεκτο  υπάρχει  επίσης  το  διαδικτυακό  λεξικό  Συντυχιές του  Πανεπιστημίου  Κύπρου,  το  οποίο  προσφέρει  ηλεκτρονικό  (ψηφιακό)  λημματολόγιο  με  δυνατότητα  αναζήτησης,  καθώς και ηχητική απόδοση των λέξεων. O ηλεκτρονικός γλωσσικός άτλαντας του νησιού της Λέσβου αποτελεί τον πρώτο και μοναδικό ηλεκτρονικό διαδραστικό γλωσσικό άτλαντα στην Ελλάδα. Ο συγκεκριμένος άτλας ασχολείται με τη χαρτογράφηση της διαλεκτικής ποικιλίας της Λέσβου, ενός νησιού με μεγάλο εύρος γλωσσικών φαινομένων που δεν αποκλίνουν μόνο από την Κοινή Νέα Ελληνική, αλλά ποικίλλουν από χωριό σε χωριό.


Συγγραφή: Αθανάσιος Καρασίμος
Επιμέλεια: Ελένη Βερναρδάκη

Comments are closed.