Ανάκτηση Πληροφορίας

Κωδικός Μαθήματος
CEID_ΝΕ5597
Τομέας
Τομέας Λογικού των Υπολογιστών
Επίπεδο
Προπτυχιακά
Διδάσκων
ΜΑΚΡΗΣ ΧΡΗΣΤΟΣ
Εξάμηνο
Χειμερινό
ECTS
5

Εισαγωγικές έννοιες (διαδικασία χρήστη, λογική αναπαράσταση κειμένων, διαδικασία ανάκτησης). Μετρικές εκτίμησης απόδοσης ανάκτησης (ανάκληση, ακρίβεια, μέση ακρίβεια, R- ακρίβεια, ιστογράμματα ακρίβειας, αρμονικός μέσος όρος, μετρικές προσανατολισμένες στο χρήστη). Μοντέλα Ανάκτησης Πληροφορίας. Συνολοθεωρητικά μοντέλα (Boolean μοντέλο, μοντέλο ασαφών συνόλων, επεκταμένο Boolean Μοντέλο), Αλγεβρικά μοντέλα (μοντέλο διανυσματικού χώρου, μοντέλο λανθάνουσας σημασιολογικής δεικτοδότησης), Πιθανοτικά μοντέλα, Τεχνικές Μηχανικής Μάθησης στην Ανάκτηση Πληροφορίας (Learning to Rank, Γλωσσικά Μοντέλα, Διανυσματική αναπαράσταση λέξεων (word embeddings όπως word2vec, CBOW,skipgram), LSTM, Transformers, BERT, GPT, reasoning search), Ανάκτηση Πληροφορίας στον Παγκόσμιο Ιστό. Μηχανές Αναζήτησης στον Παγκόσμιο Ιστό (Crawler, Indexer, δεικτοδοτητής). Ο αλγόριθμος HITS (Hyperlink-Induced Topic Search). Η μηχανή αναζήτησης Google (η μέθοδος βαθμολόγησης PageRank). O αλγόριθμος SALSA,  Λεκτική Δεικτοδότηση (ανεστραμμένα αρχεία, αρχεία υπογραφών, bitmaps). Τεχνικές Αποθήκευσης σε Κατανεμημένη Ανάκτηση Πληροφορίας (Mapreduce, Apache Spark), Πλήρης Δεικτοδότηση (δέντρα επιθεμάτων, πίνακας επιθεμάτων, άκυκλα κατευθυνόμενα γραφήματα (DAWG) συμβολοσειρών). Δεικτοδότηση συμβολοσειρών στη δευτερεύουσα μνήμη (υπερ-πίνακας επιθεμάτων, Β-δέντρο προθεμάτων, Β-δέντρο συμβολοσειρών). Συμπίεση Κειμένων και Δομών Δεικτοδότησης, Text Mining.

Μετάβαση στο περιεχόμενο