|
Τόσο το γλωσσικό όσο και το πολυμεσικό υλικό είναι καταχωρισμένα
σε μια δομή δεδομένων, η οποία αποτελεί τη βάση για την ανάκτηση
και την παρουσίαση των πληροφοριών. Το λογισμικό για την παρουσίαση
του υλικού του ΤΟΛ περιλαμβάνει τις ακόλουθες λειτουργίες ανάκτησης
όρων:
- Ανάκτηση όρων με βάση τον όρο
- Ανάκτηση όρων με βάση τον θεματικό τομέα. Τα λήμματα ή μέρος του
λήμματος μπορεί να αναζητηθεί από τη βάση δεδομένων του ΤΟΛ με βάση
έναν ή περισσότερους θεματικούς τομείς.
- Ανάκτηση συνοδευτικού πολυμεσικού υλικού. Η αναζήτηση συνοδευτικού
υλικού (κείμενα, εικόνες, βίντεο) βασίζεται στη χρήση τεχνικών ανάκτησης
πληροφορίας (full text retrieval) σε περιβάλλον πολυμέσων. Για το
σκοπό αυτό τα πολυμέσα συνοδεύονται από κατάλληλα επεξεργασμένα μεταδεδομένα
(metadata) τα οποία είναι προσβάσιμα από το μηχανισμό ανάκτησης κειμένου.
- Ανάκτηση με βάση τον ορισμό. Οι όροι του ΤΟΛ μπορούν να ανακτώνται
με βάση μέρος του ορισμού τους. Ο μηχανισμός ανάκτησης βασίζεται
σε τεχνικές ανάκτησης πληροφορίας (full text retrieval).
- Ανάκτηση με βάση τη μετάφραση: Οι όροι μπορούν να ανακτηθούν με
βάση την αγγλική ή τουρκική μετάφραση.
Οι μηχανισμοί ανάκτησης που περιγράφηκαν παραπάνω υλοποιούνται
και για τις τρεις γλώσσες, ελληνικά, αγγλικά και τουρκικά. Ειδικά
για τα ελληνικά, το σύστημα ανάκτησης οδηγεί σε όρους του λεξικού
ακόμα και στην περίπτωση που η προς αναζήτηση λέξη είναι ανορθόγραφη
ή εμφανίζεται σε άλλον τύπο (π.χ. στον πληθυντικό) από τον όρο
που περιλαμβάνεται στο λημματολόγιο του ΤΟΛ. Για τον σκοπό αυτό,
το λογισμικό ενσωματώνει μηχανισμούς ορθογραφικής διόρθωσης, γραμματικής
αναγνώρισης και παραγωγής κλίσης λέξεων στα ελληνικά.
|
|