HEAL DSpace

Βελτιστοποίηση χειρισμού Μεγάλων Ενεργειακών Δεδομένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Βασιλείου, Ιωάννης el
dc.contributor.author Αντωνιάδου, Παναγιώτα Π. el
dc.contributor.author Antoniadou, Panagiota L. en
dc.contributor.author Σεκλιζιώτης, Λάμπρος Δ. el
dc.contributor.author Sekliziotis, Pavlos D. en
dc.date.accessioned 2014-03-21T07:36:44Z
dc.date.available 2014-03-21T07:36:44Z
dc.date.copyright 2013-12-09 -
dc.date.issued 2014-03-21
dc.date.submitted 2013-12-09 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/38221
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.16341
dc.description 142 σ. el
dc.description.abstract Σκοπός της παρούσας διπλωματικής εργασίας είναι η εφαρμογή διαφόρων τεχνικών βελτιστοποίησης σε μία βάση PostgreSQL πολύ μεγάλου όγκου δεδομένων. Η βάση αυτή ανήκει σε γνωστή εταιρεία που αναπτύσσει λογισμικό με σκοπό την παρακολούθηση φωτοβολταϊκών πάρκων. Η ροή των εισερχόμενων δεδομένων προς τη βάση είναι συνεχόμενη, αφού η εξόρυξη τους γίνεται με χρήση χρονοσειρών. Λόγω του μεγέθους της βάσης ο χρόνος απόκρισης είναι μεγάλος, με αποτέλεσμα οι χρήστες συχνά να δυσκολεύονται να αντλήσουν την πληροφορία που τους ενδιαφέρει. Αρχικός μας στόχος λοιπόν είναι να βρούμε τρόπους που θα κάνουν τα ερωτήματα πιο γρήγορα και τα δεδομένα πιο άμεσα διαχειρίσιμα. Στο πρώτο μέρος της εργασίας, θα περιγράψουμε την αρχική δομή της βάσης έτσι όπως μας δόθηκε και θα εξηγήσουμε τις αδυναμίες που εντοπίσαμε. Αφού περιγράψουμε την υπάρχουσα εφαρμογή, θα παραθέσουμε τις τεχνικές βελτιστοποίησης που εφαρμόσαμε και τα αποτελέσματα που πήραμε από κάθε πείραμα που κάναμε. Τα πειράματα που υλοποιήσαμε επιβεβαιώνουν την κακή κλιμάκωση των σχεσιακών βάσεων και για το λόγο αυτό στο δεύτερο μέρος της διπλωματικής θα ασχοληθούμε με το στήσιμο και την μελέτη μίας μη σχεσιακής ΝοSQL βάσης. Αφού κάνουμε αναλυτική περιγραφή των πλεονεκτημάτων και των μειονεκτημάτων μίας τέτοιας βάσης, θα παραθέσουμε τα αποτελέσματα της απόδοσής της πάνω στο σύστημα που έχουμε στη διάθεσή μας. Τέλος, με βάση τα αποτελέσματα από όλα τα πειράματα θα προτείνουμε αλλαγές που θα βελτιώσουν την απόδοση του συστήματος. el
dc.description.abstract The purpose of this diploma thesis is the application of optimization techniques on big data. The object of this study is a PostgreSQL database of approximately 1 terabyte, which came at our disposal from a well-known company. This company is building software for the monitoring of photovoltaic plants. Therefore, the data we are handling are measurements that describe each plant’s performance. These data are generated by a timeseries mechanism that works continuously, so we always have new inserts in the database. At the same time, the users are applying queries on the database regarding present or past measurements. Our goal is to make this whole process more efficient by optimizing the mostly used queries and by changing the current structure of the database. In the first part of our thesis, we are going to test several optimization techniques on the relational model we were given and observe their results on the queries’ performance. In the second part, we are going to examine the non-relational database field by studying the features of NoSQL database systems. In particular, we are transferring the database we had from PostgreSQL to Cassandra and compare basic operations such as backup and restore of a database dump or execute simple queries such as selecting and inserting a great amount of rows. Finally, considering the results from both parts we are going to form a proposal of changes on the database that will improve its performance. en
dc.description.statementofresponsibility Παναγιώτα Π. Αντωνιάδου el
dc.description.statementofresponsibility Λάμπρος Δ. Σεκλιζιώτης el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Σχεσιακές βάσεις el
dc.subject Μη σχεσιακές βάσεις el
dc.subject Τεχνικές Βελτιστοποίησης el
dc.subject Διαχωρισμός δεδομένων el
dc.subject Μεγάλα δεδομένα el
dc.subject PostgreSQL en
dc.subject Cassandra en
dc.subject NoSQL en
dc.subject Optimization en
dc.subject Indexing en
dc.subject Partitioning en
dc.subject Batch insertion en
dc.subject Bulk loading en
dc.subject Big data en
dc.title Βελτιστοποίηση χειρισμού Μεγάλων Ενεργειακών Δεδομένων el
dc.title.alternative Optimization of Big Data Management en
dc.type bachelorThesis el (en)
dc.date.accepted 2013-12-09 -
dc.date.modified 2013-12-09 -
dc.contributor.advisorcommitteemember Κοντογιάννης, Κωνσταντίνος el
dc.contributor.advisorcommitteemember Σταύρακας, Ιωάννης el
dc.contributor.committeemember Βασιλείου, Ιωάννης el
dc.contributor.committeemember Κοντογιάννης, Κωνσταντίνος el
dc.contributor.committeemember Σταύρακας, Ιωάννης el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών el
dc.date.recordmanipulation.recordcreated 2014-03-21 -
dc.date.recordmanipulation.recordmodified 2014-03-21 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής