heal.abstract |
Κατά τη διάρκεια των τελευταίων δέκα ετών, σε συνδυασμό με την αναβίωση του ενδιαφέροντος για αλγόριθμους μηχανικής μάθησης που βασίζονται κυρίως στις επαναστατικές ανακαλύψεις των νευρ- ωνικών δικτύων βαθιάς μάθησης, το πεδίο της εξερεύνησης υδρογονανθράκων έχει λάβει τεράστια ώθηση ως προς την αποδοτικότητα, την παραγωγικότητα και την εξοικονόμηση χρόνου. Το έργο της ερμηνείας σεισμικών δεδομένων, η διαδικασία δηλαδή εντοπισμού αντικειμένων ενδιαφέροντος κάτω απο την επιφάνεια της γης, μπορεί να μελετηθεί αποτελεσματικά απο τον τομέα της σημα- σιολογικής κατάτμησης (semantic segmentation), ένα πεδίο που μέχρι στιγμής παρουσιάζει πολύ ελπιδοφόρα αποτελέσματα. Ωστόσο, σε αντίθεση με τις πιο παραδοσιακές τεχνικές σημασιολογικής κατάτμησης, τα σεισ- μικά δεδομένα παρουσιάζουν ένα σημαντικό πρόβλημα με την ποσότητα των διαθέσιμων ποιοτικών δεδομένων, τα οποία είναι ένα κρίσιμο συστατικό των πιο πρόσφατων αλγορίθμων μάθησης με επίβ- λεψη (supervised learning) και η έλλειψη αυτή προέρχεται κυρίως από δύο παράγοντες. Ο πρώτος είναι το γεγονός ότι η σωστή σεισμική επισήμανση δεδομένων μπορεί να πραγματοποιηθεί σχεδόν αποκλειστικά από γεωλόγους, ειδικούς στον τομέα τους, γεγονός που καθιστά την διεργασία πιο αργή, καθώς δεν μπορεί να ανατεθεί εύκολα σε μη ειδικούς και ως εκ τούτου, ταυτόχρονα η δι- αδικασία γίνεται πολύ πιο ακριβή. Ο δεύτερος επίσης σημαντικός παράγοντας είναι ότι λόγω της ετερογένειας της γης, οι ετικέτες που δημιουργούνται από μία τοποθεσία δεν μεταφέρονται πάντα με ακρίβεια σε διαφορετικές τοποθεσίες, ακόμη και όταν αναφέρονται σε παρόμοια αντικείμενα ενδι- αφέροντος. Αυτό αντιπροσωπεύει μια πρόσθετη πρόκληση όσον αφορά τα διαθέσιμα δεδομένα και τις αντίστοιχες ετικέτες, σε σύγκριση με τις εφαρμογές για κοινά καθημερινά αντικείμενα. Ο σκοπός αυτής της διατριβής είναι να αναγνωρίσει αυτήν την έλλειψη δεδομένων, και να προσπα- θήσει να μετατοπίσει την απάντηση σε αυτό το πρόβλημα από τη κλασσική λύση μάθησης με επίβ- λεψη σε ένα νέο πολλά υποσχόμενο υποτομέα της που ονομάζεται εκπαίδευση με λίγα δεδομένα (few-shot learning). Για να αντιμετωπίσουμε αυτό το πρόβλημα στηριζόμαστε σε μια υπάρχουσα υλοποίηση μάθησης με λίγα δεδομένα, την οποία προσαρμόζουμε στις δικές μας απαιτήσεις. Η προ- τεινόμενη λύση μας περιλαμβάνει τη μετατροπή της λογικής δικτύου από δυαδική ταξινόμηση (bi- nary classification) σε ταξινόμηση πολλών κατηγοριών (multi-class classification), αντιμετώπιση των προβλημάτων που δημιουργούνται με την κατάτμιση των εικόνων μεσω της εισαγωγής ολόκληρων των ετικετών στο δίκτυο κατά τη διάρκεια της εκπαίδευσης και της παραγωγής προβλέψεων, χρησι- μοποιούμε επίσης προ-εκπαιδευμένα βάρη για την αντιμετώπιση της έλλειψης δεδομένων και τέλος, παρέχουμε μια γενική και υπολογιστικά αποδοτική προσέγγιση για την μετέπειτα επεξεργασία δε- δομένων (post processing) που μπορεί να χρησιμοποιηθεί και με άλλες υπάρχουσες σεισμικές μεθό- δους κατάτμησης. Η προτεινόμενη μέθοδος επιπλέον επιτρέπει την ελαχιστοποίηση της μεροληψίας της ̈υφής” των δεδομένων (texture bias) το οποίο δείχνει να είναι σημαντικός παράγοντας στα σεισ- μικά δεδομένα. Από όσο γνωρίζουμε αυτή είναι η πρώτη προσπάθεια επίλυσης αυτου του προβλήματος με τη χρήση αυτής της τεχνικής και τα αποτελέσματά μας μπορούν να παράξουν μεγάλη ακρίβεια σε σύγκριση με τις τρέχουσες λύσεις που χρησιμοποιούνται στον τομέα, χρησιμοποιώντας μόνο 10 παραδείγματα εκπαίδευσης. |
el |