Στόχος της παρούσας διπλωματικής είναι η ανάλυση και η εξέταση του Latent Dirichlet Allocation (LDA), ενός γενετικού αλγορίθμου ανάλυσης κειμένουν, και κάποιων παραλαγών του. Εξετάζουμε την υλοποίηση του απλού LDA και του ιεραρχικού LDA μέσω μίας βιβλιοθήκης, του Mallet, καθώς και υλοποιούμε τον Correlated LDA χρησιμοποιώντας κλάσεις από την ίδια βιβλιοθήκη. Τέλος εφαρμόζουμε τους τρεις αλγορίθμους στο σώμα κειμένων "Polarity Dataset Version 2.0", μία συλλογή επισκοπήσεων ταινιών.
In the current thesis, the objective is to analyse Latent Dirichlet Allocatιοn (LDA), a genetic machine learing algorithm in text mining, and some other versions of it as well. We see in depth simple and hierarchical LDA, which have been created in Mallet. We create also an algorithm for Correlated LDA using classes from the same packet. Finaly we implement those algorithm in the text corpus "Polarity Dataset Version 2.0", a collection of movie reviews.