Skip to main navigation Skip to main content Skip to page footer
Menu

A CORPUS-BASED VALENCY LEXICON FOR A CONTRASTIVE AND DIACHRONIC STUDY OF ANCIENT & MEDIEVAL LANGUAGES

Στο εργαστήριο GlossaContact Lab φιλοξενήθηκε το Ερευνητικό  Έργο A Corpus-based Valency Lexicon for a Contrastive and Diachronic Study of Ancient & Medieval Languages (2024-2025).

Στόχοι

1. Ψηφιοποίηση διαχρονικών κειμένων

Συστηματική ψηφιοποίηση κειμένων της ελληνικής (αρχαία, μεσαιωνική, νέα ελληνική) και αγγλικής γλώσσας (παλαιά, μεσαιωνική, σύγχρονη αγγλική), καθώς και άλλων Ινδοευρωπαϊκών γλωσσών (π.χ. λατινικά, σανσκριτικά, γερμανικές, ρωμανικές και σλαβικές γλώσσες), με χρήση του προτύπου TEI XML και έμφαση στην κωδικοποίηση που ευθυγραμμίζεται με το PROIEL-style annotation. Η ψηφιοποίηση περιλαμβάνει την ενσωμάτωση ανα-μεταφράσεων (ενδογλωσσικών και διαγλωσσικών) για τη μελέτη της γλωσσικής επαφής και της διαχρονικής εξέλιξης.

2. Επισημείωση κειμένων με βάση το PROIEL και ανάλυση δομής ορισμάτων

Αυτόματη και ημι-αυτόματη επισημείωση των κειμένων με χρήση του PROIEL και του Penn-Helsinki Parsed Corpora, με έμφαση στη δομή ορισμάτων (valency/argument structure) και τη λημματοποίηση. Η ανάλυση επικεντρώνεται στην εξαγωγή και τυποποίηση των ορισματικών σχέσεων, με στόχο την καταγραφή της εξέλιξης του ρηματικού σθένους και των συντακτικών δομών, ιδιαίτερα στην αγγλική και την ελληνική γλώσσα.

3. Δημιουργία διαχρονικού σώματος κειμένων με έμφαση στη δομή ορισμάτων και τις ανα-μεταφράσεις 

Ανάπτυξη ενός διαχρονικού σώματος κειμένων που ενσωματώνει ανα-μεταφράσεις (ενδογλωσσικές και διαγλωσσικές) και θα επικεντρώνεται στη δομή ορισμάτων (valency), με στόχο τη συγκριτική ανάλυση της γλωσσικής αλλαγής και της επαφής μεταξύ γλωσσών, συμπεριλαμβανομένης της διαχρονικής πορείας της ελληνικής και της αγγλικής και άλλων Ινδο-ευρωπαϊκών γλωσσών. Το σώμα υποστηρίζεται από μεταδεδομένα που διευκολύνουν την ανάλυση της εξέλιξης των ρηματικών δομών και των ορισματικών σχέσεων.

4. Ψηφιοποίηση διαχρονικών κειμένων

Συστηματική ψηφιοποίηση κειμένων της ελληνικής (αρχαία, μεσαιωνική, νέα ελληνική) και αγγλικής γλώσσας (παλαιά, μεσαιωνική, σύγχρονη αγγλική), καθώς και άλλων Ινδοευρωπαϊκών γλωσσών (π.χ. λατινικά, σανσκριτικά, γερμανικές, ρωμανικές και σλαβικές γλώσσες), με χρήση του προτύπου TEI XML και έμφαση στην κωδικοποίηση που ευθυγραμμίζεται με το PROIEL-style annotation. Η ψηφιοποίηση περιλαμβάνει την ενσωμάτωση ανα-μεταφράσεων (ενδογλωσσικών και διαγλωσσικών) για τη μελέτη της γλωσσικής επαφής και της διαχρονικής εξέλιξης.

5. Επισημείωση κειμένων με βάση το PROIEL και ανάλυση δομής ορισμάτων

Αυτόματη και ημι-αυτόματη επισημείωση των κειμένων με χρήση του PROIEL και του Penn-Helsinki Parsed Corpora, με έμφαση στη δομή ορισμάτων (valency/argument structure) και τη λημματοποίηση. Η ανάλυση επικεντρώνεται στην εξαγωγή και τυποποίηση των ορισματικών σχέσεων, με στόχο την καταγραφή της εξέλιξης του ρηματικού σθένους και των συντακτικών δομών, ιδιαίτερα στην αγγλική και την ελληνική γλώσσα.

6. Δημιουργία διαχρονικού σώματος κειμένων με έμφαση στη δομή ορισμάτων και τις ανα-μεταφράσεις 

Ανάπτυξη ενός διαχρονικού σώματος κειμένων που ενσωματώνει ανα-μεταφράσεις (ενδογλωσσικές και διαγλωσσικές) και θα επικεντρώνεται στη δομή ορισμάτων (valency), με στόχο τη συγκριτική ανάλυση της γλωσσικής αλλαγής και της επαφής μεταξύ γλωσσών, συμπεριλαμβανομένης της διαχρονικής πορείας της ελληνικής και της αγγλικής και άλλων Ινδο-ευρωπαϊκών γλωσσών. Το σώμα υποστηρίζεται από μεταδεδομένα που διευκολύνουν την ανάλυση της εξέλιξης των ρηματικών δομών και των ορισματικών σχέσεων.

Επισκεφτείτε την ιστοσελίδα μας για νέα και ενημερώσεις.