HEAL DSpace

Αυτόματη παραγωγή εικόνων μόδας με χρήση προτροπής σε γενετικά μοντέλα μηχανικής μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αργυρού, Γεωργία el
dc.contributor.author Argyrou, Georgia en
dc.date.accessioned 2024-12-20T09:08:35Z
dc.date.available 2024-12-20T09:08:35Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/60586
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.28282
dc.rights Default License
dc.subject Prompting en
dc.subject Fashion images generation en
dc.subject Large language models en
dc.subject Knowledge injection en
dc.subject Stable diffusion en
dc.title Αυτόματη παραγωγή εικόνων μόδας με χρήση προτροπής σε γενετικά μοντέλα μηχανικής μάθησης el
dc.title Automatic generation of fashion images using prompting in generative machine learning models en
heal.type bachelorThesis
heal.classification Τεχνητή Νοημοσύνη el
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2024-07-15
heal.abstract Στο σύγχρονο τοπίο της μόδας, η σύγκλιση τεχνολογίας και δημιουργικότητας έχει δημιουργήσει νέες ευ καιρίες και αναδρομολογήσει τα πρότυπα της βιομηχανίας. Στο προσκήνιο αυτής της εξέλιξης βρίσκεται η ενσωμάτωση της υπολογιστικής όρασης και της τεχνητής νοημοσύνης, προωθώντας τη μόδα μέσα από καινο τομία, αποδοτικότητα και ακριβή αισθητική. Αυτή η διατριβή διερευνά μεθοδολογίες για τη δημιουργία εξατομικευμένων περιγραφών μόδας χρησιμοποιώντας δύο διακριτά Μεγάλα Μοντέλα Γλώσσας (LLMs) και ένα μοντέλο Stable Diffusion για τη δημιουργία εικόνων. Εστιάζοντας στην αποδοτικότητα και την προσαρμοστικότητα στη δημιουργία μόδας με τη χρήση τεχνητής νοημοσύνης, απομακρυνόμαστε από τις παραδοσιακές προσεγγίσεις και επικεντρωνόμαστε στις τεχνικές prompt ing. Κεντρικό σημείο της μεθοδολογίας μας είναι η Retrieval-Augmented Generation (RAG), εμπλουτίζοντας τα μοντέλα με περιεχόμενο από περιοδικά μόδας, ιστολόγια και άλλες πηγές για να εξασφαλίσουμε την προσαρ μογή του μοντέλου στις σύγχρονες τάσεις της μόδας. Η αξιολόγηση συνδυάζει ποσοτικές μετρήσεις όπως το CLIPscore με ποιοτική ανθρώπινη κρίση, αναδεικνύοντας τις δυνατότητες στη δημιουργικότητα, τη συνοχή και την αισθητική ελκυστικότητα σε διάφορα στυλ. Η συγκριτική ανάλυση δείχνει την αποτελεσματικότητα τεχνικών όπως η μάθηση Few-shot και η RAG με PDFs στην παραγωγή περιγραφών. Η ποιοτική αξιολόγηση μέσω αν θρώπινης αξιολόγησης αποκαλύπτει προόδους στον ρεαλισμό και την οπτική ποικιλομορφία, που υποστηρίζονται από τη μεθοδολογία Chain-of-Thought. el
heal.abstract In the contemporary landscape of fashion, the convergence of technology and creativity has catalyzed a transformative shift, ushering in new opportunities and redefining industry standards. At the forefront of this evolution lies the integration of computer vision and artificial intelligence, revolutionizing fashion through innovation, efficiency, and refined aesthetic precision. This thesis investigates methodologies for generating tailored fashion descriptions using two distinct Large Language Models (LLMs) and a Stable Diffusion model for image creation. Emphasizing efficiency and adaptability in AI-driven fashion creativity, we depart from traditional approaches and focus on prompting techniques, such as zero-shot, one-shot and few-shot learning as well as Chain-of-Thought. Central to our methodology is Retrieval-Augmented Generation (RAG), enriching models with insights from fashion mag azines, blogs, and other sources to ensure accurate and contemporary fashion representations. Evaluation combines quantitative metrics like CLIPscore with qualitative human judgment, highlighting strengths in cre ativity, coherence, and aesthetic appeal across diverse styles. Comparative analysis demonstrates the efficacy of techniques such as Few-shot learning and RAG with PDFs in producing descriptions and images tailored to specific fashion variables. Qualitative assessment reveals advancements in realism and visual diversity, supported by the Chain-of-Thought methodology. en
heal.advisorName Στάμου, Γεώργιος el
heal.committeeMemberName Βουλόδημος, Αθανάσιος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 117 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής