Μοντελοποίηση, Ανάλυση και Διαφοροποιημένη Ανάκτηση Νομικής Πληροφορίας

Κόνιαρης, Μάριος

dc.contributor.author	Κόνιαρης, Μάριος	el
dc.date.accessioned	2017-12-20T11:09:19Z
dc.date.available	2017-12-20T11:09:19Z
dc.date.issued	2017-12-20
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/46136
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.2825
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.subject	Νομική Πληροφορική	el
dc.subject	Διαφοροποίηση	el
dc.subject	Ανάλυση δικτύων	el
dc.title	Μοντελοποίηση, Ανάλυση και Διαφοροποιημένη Ανάκτηση Νομικής Πληροφορίας	el
dc.contributor.department	Εργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων	el
heal.type	doctoralThesis
heal.secondaryTitle	Modeling, Analysis and Diversification of Legal Information	en
heal.classification	Επιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής	el
heal.classification	Επιστήμες Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού & Μηχανικού Η/Υ	el
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2017-07
heal.abstract	Στην εποχή της κοινωνίας της πληροφορίας ο κλάδος της νομικής Πληροφορικής έχει να αντιμετωπίσει σημαντικές προκλήσεις εξαιτίας του όγκου και της πολυπλοκότητας των νομικών δεδομένων. Σε αυτό το πλαίσιο, ζητήματα διαχείρισης και διάχυσης της νομικής πληροφορίας, μοντέλα διαχείρισης της νομικής πολυπλοκότητας, τεχνικές διευκόλυνσης των χρηστών στην αναζήτηση νομικών πληροφοριών και μέθοδοι ενθάρρυνσης της συμμετοχής των πολιτών στο σχεδιασμό των ρυθμίσεων, αποτελούν ανοιχτά ερευνητικά ζητήματα. Προς την κατεύθυνση αυτή, η παρούσα διατριβή μελετά και προτείνει μεθόδους: α) διαχείρισης της νομικής πληροφορίας με σημασιολογικά πρότυπα, β) μοντελοποίησης του δικαίου σε μορφή σύνθετου δικτύου, γ) διαφοροποιημένης ανάκτησης νομικής πληροφορίας και δ) διαφοροποιημένης ανάκτησης καταχωρήσεων σε κείμενα διαβουλεύσεων και κοινωνικά δίκτυα. Στο πλαίσιο της διατριβής προτείνουμε ένα μοντέλο σημασιολογικής αναπαράστασης της ελληνικής νομικής πληροφορίας και τεχνικές αυτόματης εξαγωγής και αναπαράστασης σε αυτό το μοντέλο νομικής πληροφορίας. Δεδομένου ότι τα νομικά έγγραφα διαχέονται σε μη μηχαναγνώσιμες μορφές, είναι απαραίτητος ο αυτόματος μετασχηματισμός τους σε μορφή κατάλληλη για τη μοντελοποίηση νομικών πηγών, με σκοπό την δομική και σημασιολογική αναπαράστασή τους, τη διασύνδεσή τους βάσει νομικών παραπομπών και την ταξινόμησή τους. Τα παραπάνω έχουν υλοποιηθεί σε μια πλατφόρμα διαχείρισης, νομικής πληροφορίας, η οποία αξιοποιεί την σημασιολογική αναπαράσταση των νομικών πηγών, προσφέροντας, μεταξύ άλλων, εξελιγμένα αποτελέσματα αναζήτησης. Η προτεινόμενη αρχιτεκτονική αξιολογήθηκε σε πραγματικό περιβάλλον παραγωγής, του δημοσίου τομέα, παρέχοντας στο ευρύ κοινό σημασιολογική πρόσβαση στην ελληνική φορολογική νομοθεσία. Ταυτόχρονα, προτείνουμε ένα μοντέλο αναπαράστασης του γραπτού δικαίου σε μορφή σύνθετου δικτύου. Εφαρμόζουμε το μοντέλο στο σύνολο του γραπτού δίκαιου της Ε.Ε. και εξετάζουμε την δομή και την τοπολογία του, προσπαθώντας να εντοπίσουμε οργανωτικές αρχές του γραπτού δικαίου. Η εμπειρική μας ανάλυση αναδεικνύει σε μακροσκοπικό επίπεδο αφανείς οργανωτικές αρχές του σώματος του δικαίου και παρέχει ερμηνεία για την επίδραση της δομής του δικτύου σε μεμονωμένες νομικές πηγές και σε μικροσκοπικό επίπεδο επιτρέπει την ποσοτικοποίηση της σχετικής σημασίας μιας νομικής πηγής μέσα σε ένα σώμα κειμένων. Προκύπτει, μεταξύ άλλων, ότι οι νομικές πηγές έχουν έντονη τάση να συνδέονται με νομικές πηγές του ιδίου τύπου, σχηματίζοντας ομάδες του ίδιου τύπου/τομέα. Η επικοινωνία μεταξύ των πολύ συσσωρευμένων περιοχών αραιά συνδεδεμένων κόμβων διατηρείται από μερικούς κόμβους, καθώς το δίκτυο είναι επίσης εξαιρετικά ετερογενές σε σχέση με τον αριθμό των συνδέσεων των νομικών πηγών και συγκεκριμένα είναι ένα δίκτυο νόμου δύναμης μικρού κόσμου (power law small-world network). Η προέλευση αυτής της ετερογένειας, μπορεί να εξηγηθεί από τη διαδικασία της επιλεκτικής προσκόλλησης, η οποία ενισχύει τη δημοτικότητα των πηγών υψηλής κατάταξης. Ταυτόχρονα, αξιολογούμε την χρονική εξέλιξη καθώς και την ανθεκτικότητα του σε περίπτωση μεταβολών. Η πρόταση μας παρέχει μια πρώτη προσέγγιση για την βελτίωση της αποτελεσματικότητας του νομικού συστήματος, ενώ παράλληλα νέες ερευνητικές κατευθύνσεις είναι δυνατό να προκύψουν μέσω αυτής. Επιπρόσθετα, στην παρούσα διατριβή, εξετάζονται θέματα μεγιστοποίησης της νομικής ποικιλομορφίας των αποτελεσμάτων αναζήτησης, με στόχο την διευκόλυνση των χρηστών κατά την αναζήτηση χρήσιμης πληροφορίας σε ένα τεράστιο όγκο νομικών δεδομένων. Για παράδειγμα, ένας δικηγόρος που προετοιμάζει τα επιχειρήματα του για δεδομένη υπόθεση θα διευκολυνθεί περισσότερο από μια λίστα αποφάσεων που περιέχει αποφάσεις από διαφορετικούς κλάδους, διαφορετικά δικαστήρια, σε διαφορετικές εποχές, σε σχέση με μια λίστα ομοιογενών αποφάσεων με παρόμοια χαρακτηριστικά. Συγκεκριμένα, προσαρμόζουμε αλγορίθμους που έχουν προταθεί στη βιβλιογραφία για την κάλυψη ετερογενών αναγκών, όπως η δημιουργία περιλήψεων κειμένων, η διαφοροποιημένη κατάταξη σε γράφους και η διαφοροποίηση αποτελεσμάτων αναζήτησης. Ταυτόχρονα, εξετάζουμε την συνεισφορά εξειδικευμένων κριτηρίων διαφοροποίησης νομικών πηγών, τα οποία και ενσωματώνουμε στους αλγορίθμους. Πραγματοποιούμε εκτενή πειραματική αξιολόγηση των μεθόδων και κριτηρίων διαφοροποίησης σε ποικίλες περιπτώσεις, με πραγματικές συλλογές νομικών εγγράφων, από διαφορετικά νομικά συστήματα, χρησιμοποιώντας διεθνώς αποδεκτές μετρικές και αντικειμενική μεθοδολογία επισημείωσης του συνόλου δεδομένων, παρέχοντας όρια εξισορρόπησης μεταξύ της σχετικότητας και της ποικιλομορφίας του συνόλου αποτελεσμάτων. Παράλληλα, με βάση την συμμετοχή των πολιτών στο σχεδιασμό των ρυθμίσεων μέσω της διαδικασίας διαβούλευσης, αλλά και της ευρείας εξάπλωσης των κοινωνικών δικτύων, εξετάζουμε τη διαφοροποιημένη ανάκτηση καταχωρήσεων χρηστών σε κείμενα διαβουλεύσεων και σε κοινωνικά δίκτυα. Στην κατεύθυνση αυτή, ορίζουμε εξειδικευμένα κριτήρια διαφοροποίησης που λαμβάνουν υπόψη τα χαρακτηριστικά των καταχωρήσεων και του κοινωνικού δικτύου, τα οποία και εισάγουμε σε ευριστικούς αλγόριθμους διαφοροποίησης, με στόχο την ανάκτηση συνόλου ετερογενών/ποικιλόμορφων καταχωρήσεων. Για τις ανάγκες της πειραματικής αξιολόγησης των μεθόδων/κριτηρίων διαφοροποίησης, που πραγματοποιήθηκε με βάση δημοσίως διαθέσιμα πραγματικά σύνολα δεδομένων, επεκτείναμε μετρικές αξιολόγησης για την αποτίμηση της ποικιλομορφίας των καταχωρήσεων.	el
heal.abstract	Information society poses new threats to the legal informatics discipline, mainly due to the volume and complexity of legal data. In this context, legal information management and dissemination, legal complexity, techniques facilitating users in seeking legal information, and methods to encourage citizens’ participation in regulatory planning activities are challenging research issues to be addressed. This doctoral thesis reports upon studies for a) legal sources management with semantic standards; b) modeling civil law as a complex network, c) application of diversification methods for legal information retrieval, and d) application of diversification methods for public consultation texts and social networks. We present a novel methodology that acquires a semantic representation of legislation, from unstructured formats, by expressing legal documents structure in the form of a set of syntactic rules, i.e., a domain-specific language for legal documents. Since legal documents are usually disseminated in unstructured formats, it is advisable to transform them to another format, suitable for modelling legal sources, capturing the internal organization of the textual structure and the legal semantics, interlinking them based on discovered legal references and classifying them. The above has been integrated on legal document management platform aiming to improve access to legal sources by offering advanced modelling, managing and mining functions. The platform has been successfully deployed in a public sector operated production environment, providing citizens semantic access to Greek tax law. We also propose a novel approach to model civil law collections as a complex network. We applied our approach on the European Union legislation corpus and identified otherwise, hidden organizing principles of the legislation corpus, interpreted the influence of the network structure to individual legal sources and quantified the relative importance of a legal source within the legislation corpus. Among others, legal sources have a strong tendency to connect with legal documents of the same type, forming clusters of the same sector. Communication between highly clustered areas of sparsely connected nodes is maintained by a few hubs, since the Legislation Network is also highly heterogeneous with respect to the number of edges incident on a node and in particular it is a small world power law network. The origin of this heterogeneity may be derived by the preferential attachment process, which amplifies the popularity of highly ranked sources. Further, we studied the temporal evolution of the legislation corpus and evaluated its tolerance to errors, by performing a resilience test. Our approach aims to improve the efficiency of the legal system and future research directions can be built on our findings. Additionally, we address diversification of results in legal search as a means of assisting user’s searching for useful information in a huge amount of legal data. For example, a lawyer preparing his/her arguments for a given case will find more informative and helpful a diverse result, i.e., a result containing several claims, varying in the type of court and other characteristics, than a set of homogeneous results that contain only relevant cases with similar features. We adopt several state of the art methods from the web search, network analysis and text summarization domains. We also look at the contribution of legal sources diversification criteria, which we also incorporate into the algorithms. We provide an exhaustive evaluation of the methods and criteria in a variety of settings, using real collections of legal documents, from different legal systems, that we objectively annotated with relevance judgments for this purpose, using widely accepted metrics, offering balance boundaries between reinforcing relevant documents or sampling the information space around the legal query Also, taking into consideration citizen’s involvement in regulations through public consultation, as well as the widespread use of social networks, we address result diversification on user comments/microblog post. Towards this direction, we define comment and microblog posts-specific diversification criteria and apply them on heuristic diversification algorithms. We perform an experimental analysis showing that the diversity criteria we introduce result in distinctively diverse subsets of user’s posts.	en
heal.sponsor	Νομική Πληροφορική, Διαφοροποίηση, Ανάλυση δικτύων	el
heal.sponsor	Legal Informatics, Diversification, Network analysis	en
heal.advisorName	Βασιλείου, Ιωάννης	el
heal.committeeMemberName	Βασιλείου, Ιωάννης	el
heal.committeeMemberName	Σελλής, Τιμολέων	el
heal.committeeMemberName	Κοντογιάννης, Κωνσταντίνος	el
heal.committeeMemberName	Κόλλιας, Στέφανος	el
heal.committeeMemberName	Αναγνωστόπουλος, Ιωάννης	el
heal.committeeMemberName	Τσανάκας, Παναγιώτης	el
heal.committeeMemberName	Στάμου, Γεώργιος	el
heal.academicPublisher	Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών	el
heal.academicPublisherID	ntua
heal.numberOfPages	186
heal.fullTextAvailability	true