HEAL DSpace

Μεγάλα δεδομένα (big data) και σύγχρονες επιχειρήσεις -Εργαλεία - Εφαρμογές

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Δαραμάρα, Χριστίνα el
dc.contributor.author Daramara, Christina en
dc.date.accessioned 2017-12-04T12:26:17Z
dc.date.issued 2017-12-04
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/46028
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.14993
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.subject Μεγάλα δεδομένα el
dc.subject Ανάλυση επιχειρήσεων el
dc.subject Ανάλυση μεγάλων δεδομένων el
dc.subject Hadoop en
dc.subject Hue en
dc.subject Big data en
dc.subject Business Analytics en
dc.subject Big data analytics en
dc.title Μεγάλα δεδομένα (big data) και σύγχρονες επιχειρήσεις -Εργαλεία - Εφαρμογές el
heal.type bachelorThesis
heal.classification Big data el
heal.classification Data analysis el
heal.classification Business analysis el
heal.classificationURI http://id.loc.gov/authorities/subjects/sh2012003227
heal.classificationURI http://skos.um.es/unesco6/120903
heal.classificationURI http://zbw.eu/stw/descriptor/19108-6
heal.dateAvailable 2018-12-03T22:00:00Z
heal.language el
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2017-09
heal.abstract Σύμφωνα με την IBM, δημιουργούνται πάνω από 2,5 τετράκις εκατομμύρια bytes δεδομένων ανά έτος, ενώ παράλληλα η ποσότητα των δεδομένων που παράγεται αυξάνεται σε ένα τέτοιο εκπληκτικό ποσοστό ώστε το 90% εξ’ αυτών να έχει δημιουργηθεί μόλις μέσα στα τελευταία δύο χρόνια. Ολόκληρη η πληροφορία που είχε παράξει το ανθρώπινο είδος τα προηγούμενα δεκάδες χιλιάδες χρόνια της ιστορίας του, αποτελούσαν μόλις το 10% του συνόλου. Η ανθρωπότητα σήμερα παράγει δεδομένα με ιλιγγιώδεις ρυθμούς και, πλέον, το ποσοστό αυτών που είναι αποθηκευμένο σε αναλογική μορφή είναι απειροελάχιστο. Οι άνθρωποι και οι τεχνολογίες που χρησιμοποιούν παράγουν αχανείς ποσότητες από ψηφιακά data, οι οποίες συσσωρεύονται ολοένα και δημιουργούν νέες ευκαιρίες, μετασχηματίζοντας παράλληλα ολόκληρες αγορές και, κατά μία έννοια, την ίδια τη ζωή στον πλανήτη. Η μεγάλη τεχνολογική και επιχειρηματική πρόκληση της εποχής είναι η αποτελεσματική διαχείριση του τεράστιου όγκου δεδομένων που πλέον βρίσκεται στην διάθεση εταιρειών και καταναλωτών. Όροι όπως “Big Data” και “Data Analytics” βρίσκονται πλέον στο επίκεντρο των συζητήσεων των ΙΤ τμημάτων ανά τον κόσμο. Ο όρος “Big Data” είναι ένας αρκετά γενικός και ασαφής όρος που περιγράφει κάθε συλλογή δεδομένων που έχει μεγάλο μέγεθος και περίπλοκη διάρθρωση. Κατά κανόνα ως “big data” νοούνται τα datasets που είναι υπερβολικά μεγάλα και περίπλοκα για να τα διαχειριστούν οι συνήθεις υπολογιστικές λύσεις του εμπορίου. Η διαχείριση αυτού του όγκου δεδομένων είναι ένα έργο δύσκολο υπολογιστικά, που όμως μπορεί να δώσει πολλά και πολύτιμα αποτελέσματα με τη σωστή επεξεργασία. Τα Big Data δημιουργούνται ουσιαστικά από τα πάντα γύρω μας ανά πάσα στιγμή. Κάθε ψηφιακή αλληλεπίδραση με μέσα μαζικής δικτύωσης παράγει δεδομένα, από το browsing στον υπολογιστή και το online λιανεμπόριο μέχρι τις αγορές στο iTunes και τα likes στο Facebook. Τα δεδομένα αυτά αλιεύονται από πολλαπλές πηγές, με τρομακτική ταχύτητα, όγκο και ποικιλία. Για να εξαγάγει όμως κάνεις ουσιαστική αξία από αυτά, θα πρέπει να έχει στην κατοχή του τη βέλτιστη επεξεργαστική ισχύ, τα κατάλληλα εργαλεία ανάλυσης και φυσικά, τις ανάλογες δεξιότητες. Σκοπός της παρούσας διπλωματικής εργασίας είναι η παρουσίαση της υφιστάμενης κατάστασης των “Big Data”, των εξελίξεων και των προοπτικών στη λήψη αποφάσεων στις σύγχρονες επιχειρήσεις. Επίσης, αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη των εργαλείων “Big Data” και πιο συγκεκριμένα η λεπτομερής περιγραφή του Hadoop και του Hue, το οποίο είναι μία web διεπαφή που υποστηρίζει το Apache Hadoop και το οικοσύστημά του. Μέσω του Hue θα γίνουν κάποιες πρακτικές εφαρμογές ανάλυσης δεδομένων σε ανοιχτά σύνολα δεδομένων. Αυτά τα σύνολα δεδομένων θα είναι από πραγματικές επιχειρήσεις και πιο συγκεκριμένα πρόκειται για δεδομένα από τις επιχειρήσεις Airbnb, Walmart και Yelp. Μάλιστα το dataset του Yelp έχει δημιουργηθεί στα πλαίσια ενός διαγωνισμού που διοργανώνει η εταιρεία κάθε χρόνο και προκαλεί φοιτητές να επεξεργαστούν τα παρεχόμενα δεδομένα και να δημιουργήσουν το δικό τους project, το οποίο θα αξιολογηθεί από την εταιρεία και μπορεί να κερδίσει ένα βραβείο. el
heal.abstract According to IBM, more than 2.5 million bytes of data are generated per year, while the amount of data generated is rising to such an astonishing rate that 90% of them have been created just over the last two years. All the information that humanity had produced over the past tens of thousands of years of its history was only 10% of the total. Humanity today produces data at a dizzying rate, and now, the proportion of those stored in analogue form is infinitesimal. The people and technologies they use produce vast amounts of digital data, which are increasingly piling up new opportunities, while transforming whole markets and, in a sense, life on the planet itself. The great technological and business challenge of the time is to efficiently manage the huge amount of data that is now at the disposal of companies and consumers. Terms such as "Big Data" and "Data Analytics" are now at the heart of the discussions of IT departments around the world. The term "Big Data" is a fairly general and unclear term that describes every data collection that has a large size and complicated structure. As a rule, "large data" means datasets that are too large and complex to handle by common commercial computing solutions. Managing this data volume is a difficult computing project, but it can give many and valuable results with proper processing. Big Data is essentially created by everything around us at any time. Every digital mass media interaction produces data, from browsing to computer and online retailing to iTunes and likes on Facebook. These data are captured from multiple sources, at terrifying speed, volume and variety. But in order to extract, however, you have substantial value from them, you must have the best processing power, the proper analysis tools and, of course, the relevant skills. The purpose of this diploma thesis is to present the current state of "Big Data", developments and perspectives in decision-making in modern enterprises. Also, the subject of this diploma thesis is the study of Big Data tools and more specifically the detailed description of Hadoop and Hue, which is a web interface which is supported by Apache Hadoop and its ecosystem. Through Hue, some practical data analysis applications will be made in open data sets. These data sets will be from real businesses and more specifically will be data from Airbnb, Walmart and Yelp. Indeed, the Yelp dataset has been created as part of a competition organized by the company every year and challenges students to process the data and to create their own project, which will be evaluated by the company and can win one award. en
heal.advisorName Πόνης, Σταύρος el
heal.committeeMemberName Πόνης, Σταύρος el
heal.committeeMemberName Παναγιώτου, Νικόλαος el
heal.committeeMemberName Ναθαναήλ, Δημήτριος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Μηχανολόγων Μηχανικών. Τομέας Βιομηχανικής Διοίκησης και Επιχειρησιακής Έρευνας el
heal.academicPublisherID ntua
heal.numberOfPages 119 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής