HEAL DSpace

Global counterfactual exlanations: Efficient coputation and bias auditing

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Τσόπελας, Κωνσταντίνος el
dc.contributor.author Tsopelas, Konstantinos en
dc.date.accessioned 2025-04-15T06:54:34Z
dc.date.available 2025-04-15T06:54:34Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/61745
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.29441
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Μηχανική μάθηση el
dc.subject Επεξηγησιμότητα el
dc.subject Δικαιοσύνη el
dc.subject Δικαιοπραξία el
dc.subject Explainability en
dc.subject Fairness en
dc.subject Recourse en
dc.subject Machine learning en
dc.subject Global counterfactual explanations en
dc.subject Καθολικές αντιθετικές εξηγήσεις el
dc.title Global counterfactual exlanations: Efficient coputation and bias auditing en
heal.type masterThesis
heal.classification Μηχανική μάθηση el
heal.classification Machine learning en
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2024-11-06
heal.abstract Τα αντιθετικά επεξηγηματικά σενάρια (counterfactual explanations) αποκτούν ζωτική σημασία για την ενίσχυση της διαφάνειας και της αμεροληψίας (fairness) των μοντέλων μηχανικής μάθησης, ιδιαίτερα σε ευαίσθητες περιοχές εφαρμογής. Η παρούσα διπλωματική εργασία εξετάζει δύο υπάρχουσες εργασίες — το GLANCE (Global Actions in a Nutshell for Counterfactual Explainability) και το FACTS (Fairness-Aware Counterfactuals for Subgroups) — οι οποίες επικεντρώνονται στη δημιουργία καθολικών αντιθετικών επεξηγηματικών σεναρίων (global counterfactual explanations) και στον έλεγχο δικαιοσύνης μέσω τέτοιων αντιθετικών εξηγήσεων, αντίστοιχα. Το GLANCE παράγει συνοπτικές, ερμηνεύσιμες καθολικές αντιθετικές εξηγήσεις μέσω της συσταδοποίησης (clustering) στιγμιότυπων και ενεργειών, αναζητώντας αντιπροσωπευτικές ενέργειες που πετυχαίνουν καλή ισορροπία ανάμεσα στην αποτελεσματικότητα, το κόστος και την επεξηγησιμότητα. Από την άλλη μεριά, το FACTS έχει σκοπό τον έλεγχο της δικαιοσύνης της δικαιοπραξίας (fairness of recourse auditing), αξιολογώντας αν διαφορετικές προστατευόμενες υποομάδες αντιμετωπίζουν ίσο βαθμό δυσκολίας στην αναζήτηση δικαιοπραξίας. Για το σκοπό αυτό το FACTS "βλέπει" τα στιγμιότυπα και τις ενέργειες τόσο σε ατομικό επίπεδο (μικρο-προοπτική) όσο και σε επίπεδο ομάδας (μακρο-προοπτική). Η παρούσα διπλωματική συγκρίνει τις δύο αυτές εργασίες και τους αντίστοιχους αλγορίθμους που προτείνουν, αναπαράγοντας τα πειράματα και τα αποτελέσματά τους, και αναδεικνύοντας τα πλεονεκτήματα και τους περιορισμούς τους. Συνδέει επίσης τις βασικές τους συλλογιστικές πορείες, επιδεικνύοντας πώς οι έννοιες των ομάδων στιγμιότυπων και των καθολικών αντιθετικών εξηγήσεων μπορούν να αξιοποιηθούν και για σκοπούς επεξηγησιμότητας και για σκοπούς ελέγχου της δικαιοσύνης. Μέσω της αναπαραγωγής και της επέκτασης των πειραμάτων των GLANCE και FACTS, παρέχουμε μια λεπτομερή αξιολόγηση των δύο εργασιών, απεικονίζοντας τα πλεονεκτήματα και τις αδυναμίες τους. Επιπλέον, συνδέουμε τις δύο αυτές προσεγγίσεις για να αναδείξουμε πώς οι καθολικές αντιθετικές εξηγήσεις και οι έλεγχοι δικαιοσύνης μπορούν να αλληλοσυμπληρώνονται, προωθώντας το διπλό στόχο της επεξηγησιμότητας και της δικαιοσύνης στα συστήματα μηχανικής μάθησης. el
heal.abstract Counterfactual explanations are vital for enhancing the transparency and fairness of machine learning models, particularly in sensitive domains. This thesis explores two frameworks — GLANCE (Global Actions in a Nutshell for Counterfactual Explainability) and FACTS (Fairness-Aware Counterfactuals for Subgroups) — which address global counterfactual generation and fairness auditing via counterfactuals, respectively. GLANCE generates concise, interpretable global counterfactuals by clustering instances and actions to find representative actions that balance effectiveness, cost, and interpretability. FACTS, meanwhile, audits fairness of recourse by evaluating whether different protected subgroups face equal difficulty when seeking recourse, using both individual-level (micro) and group-level (macro) perspectives. This thesis compares these frameworks through experimental replication, highlighting their strengths and limitations. It also connects their narratives, demonstrating how the concepts of instance groups and global counterfactuals can be leveraged for both explainability and fairness auditing purposes. en
heal.advisorName Φωτάκης, Δημήτριος el
heal.committeeMemberName Φωτάκης, Δημήτριος el
heal.committeeMemberName Βουλόδημος, Αθανάσιος el
heal.committeeMemberName Σαχαρίδης, Δημήτριος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 111 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα