HEAL DSpace

Διερεύνηση χρήσης τεχνικών μηχανικής μάθησης για ταξινόμηση (Classification) βιογραφικών

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Γκόλια, Νίκη
dc.contributor.author Gkolia, Niki en
dc.date.accessioned 2021-03-29T20:53:06Z
dc.date.available 2021-03-29T20:53:06Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/53179
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.20877
dc.rights Default License
dc.subject Κατηγοριοποίηση el
dc.subject Μηχανική μάθηση el
dc.subject Συσταδοποίηση el
dc.subject Επεξεργασία φυσικής γλώσσας el
dc.subject Naive bayes en
dc.title Διερεύνηση χρήσης τεχνικών μηχανικής μάθησης για ταξινόμηση (Classification) βιογραφικών el
heal.type bachelorThesis
heal.classification Μηχανική μάθηση el
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2021-03-18
heal.abstract Ο στόχος της παρούσας διπλωματικής είναι η διερεύνηση και η αξιολόγηση αλγορίθμων μηχανικής μάθησης για την ταξινόμηση βιογραφικών σημειωμάτων ανάλογα με το περιεχόμενό τους. Τα βιογραφικά σημειώματα προέρχονται από διαφορετικές πηγές και καταλήγουν στον υπεύθυνο ανθρώπινου δυναμικού ο οποίος καλείται να τα κατηγοριοποιήσει τόσο ως προς την ειδικότητα του υποψηφίου όσο και ως προς την καταλληλότητά του για την εκάστοτε θέση εργασίας. Η παρούσα διπλωματική εργασία στοχεύει πρωτίστως στο σχεδιασμό κατάλληλης μεθοδολογίας για την υποβοήθηση αυτής της διαδικασίας. Σε αυτό το πλαίσιο, γνωστοί αλγόριθμοι επιβλεπόμενης μάθησης όπως οι Naïve Bayes, Decision Trees, Random Forest και Support Vector Model χρησιμοποιούνται για να δημιουργηθούν μοντέλα πρόβλεψης. Επιπλέον, στο πλαίσιο της διερεύνησης του συνόλου δεδομένων, εφαρμόζεται και η τεχνική συσταδοποίησης, με τον αλγόριθμο K-means. Προτού εφαρμοστούν οι παραπάνω αλγόριθμοι, τα δεδομένα πρέπει να προεπεξεργαστούν ώστε να μετατραπούν από απλά κείμενα σε διανύσματα συγκεκριμένου μεγέθους χαρακτηριστικών. Τα χαρακτηριστικά αποτελούνται από λέξεις που περιέχουν πληροφορία σχετικά με την κατηγορία του βιογραφικού. Ωστόσο, πολλά από αυτά τα χαρακτηριστικά δε διαθέτουν σημαντικές πληροφορίες για το περιεχόμενο του κειμένου. Για το λόγο αυτό, εφαρμόζονται ειδικές μέθοδοι για εξαγωγή χαρακτηριστικών προκειμένου να διατηρηθούν μόνο τα σημαντικά χαρακτηριστικά των κειμένων. Έπειτα, ο κάθε αλγόριθμος εφαρμόζεται σε ένα σύνολο δεδομένων ελέγχου προκειμένου να γίνει αξιολόγηση του μοντέλου. Πέραν του πειραματικού μέρους της διπλωματικής εργασίας, παρουσιάζονται λεπτομερώς τόσο τα επιμέρους επιστημονικά πεδία στα οποία εντάσσεται η παρούσα εργασία, όσο και οι αλγόριθμοι και οι τεχνικές που χρησιμοποιήθηκαν. el
heal.advisorName Ασκούνης, Δημήτριος el
heal.committeeMemberName Δούκας, Χρυσόστομος el
heal.committeeMemberName Ψαρράς, Ιωάννης el
heal.committeeMemberName Ασκούνης, Δημήτριος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Ηλεκτρικών Βιομηχανικών Διατάξεων και Συστημάτων Αποφάσεων el
heal.academicPublisherID ntua
heal.numberOfPages 122 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής