dc.contributor.author |
Αργυρού, Γεωργία
|
el |
dc.contributor.author |
Argyrou, Georgia
|
en |
dc.date.accessioned |
2024-12-20T09:08:35Z |
|
dc.date.available |
2024-12-20T09:08:35Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/60586 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.28282 |
|
dc.rights |
Default License |
|
dc.subject |
Prompting |
en |
dc.subject |
Fashion images generation |
en |
dc.subject |
Large language models |
en |
dc.subject |
Knowledge injection |
en |
dc.subject |
Stable diffusion |
en |
dc.title |
Αυτόματη παραγωγή εικόνων μόδας με χρήση προτροπής σε γενετικά μοντέλα μηχανικής μάθησης |
el |
dc.title |
Automatic generation of fashion images using prompting in generative machine learning models |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Τεχνητή Νοημοσύνη |
el |
heal.language |
el |
|
heal.language |
en |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2024-07-15 |
|
heal.abstract |
Στο σύγχρονο τοπίο της μόδας, η σύγκλιση τεχνολογίας και δημιουργικότητας έχει δημιουργήσει νέες ευ
καιρίες και αναδρομολογήσει τα πρότυπα της βιομηχανίας. Στο προσκήνιο αυτής της εξέλιξης βρίσκεται η
ενσωμάτωση της υπολογιστικής όρασης και της τεχνητής νοημοσύνης, προωθώντας τη μόδα μέσα από καινο
τομία, αποδοτικότητα και ακριβή αισθητική.
Αυτή η διατριβή διερευνά μεθοδολογίες για τη δημιουργία εξατομικευμένων περιγραφών μόδας χρησιμοποιώντας
δύο διακριτά Μεγάλα Μοντέλα Γλώσσας (LLMs) και ένα μοντέλο Stable Diffusion για τη δημιουργία εικόνων.
Εστιάζοντας στην αποδοτικότητα και την προσαρμοστικότητα στη δημιουργία μόδας με τη χρήση τεχνητής
νοημοσύνης, απομακρυνόμαστε από τις παραδοσιακές προσεγγίσεις και επικεντρωνόμαστε στις τεχνικές prompt
ing. Κεντρικό σημείο της μεθοδολογίας μας είναι η Retrieval-Augmented Generation (RAG), εμπλουτίζοντας
τα μοντέλα με περιεχόμενο από περιοδικά μόδας, ιστολόγια και άλλες πηγές για να εξασφαλίσουμε την προσαρ
μογή του μοντέλου στις σύγχρονες τάσεις της μόδας. Η αξιολόγηση συνδυάζει ποσοτικές μετρήσεις όπως το
CLIPscore με ποιοτική ανθρώπινη κρίση, αναδεικνύοντας τις δυνατότητες στη δημιουργικότητα, τη συνοχή και
την αισθητική ελκυστικότητα σε διάφορα στυλ. Η συγκριτική ανάλυση δείχνει την αποτελεσματικότητα τεχνικών
όπως η μάθηση Few-shot και η RAG με PDFs στην παραγωγή περιγραφών. Η ποιοτική αξιολόγηση μέσω αν
θρώπινης αξιολόγησης αποκαλύπτει προόδους στον ρεαλισμό και την οπτική ποικιλομορφία, που υποστηρίζονται
από τη μεθοδολογία Chain-of-Thought. |
el |
heal.abstract |
In the contemporary landscape of fashion, the convergence of technology and creativity has catalyzed a
transformative shift, ushering in new opportunities and redefining industry standards. At the forefront of
this evolution lies the integration of computer vision and artificial intelligence, revolutionizing fashion through
innovation, efficiency, and refined aesthetic precision.
This thesis investigates methodologies for generating tailored fashion descriptions using two distinct Large
Language Models (LLMs) and a Stable Diffusion model for image creation. Emphasizing efficiency and
adaptability in AI-driven fashion creativity, we depart from traditional approaches and focus on prompting
techniques, such as zero-shot, one-shot and few-shot learning as well as Chain-of-Thought. Central to our
methodology is Retrieval-Augmented Generation (RAG), enriching models with insights from fashion mag
azines, blogs, and other sources to ensure accurate and contemporary fashion representations. Evaluation
combines quantitative metrics like CLIPscore with qualitative human judgment, highlighting strengths in cre
ativity, coherence, and aesthetic appeal across diverse styles. Comparative analysis demonstrates the efficacy
of techniques such as Few-shot learning and RAG with PDFs in producing descriptions and images tailored
to specific fashion variables. Qualitative assessment reveals advancements in realism and visual diversity,
supported by the Chain-of-Thought methodology. |
en |
heal.advisorName |
Στάμου, Γεώργιος |
el |
heal.committeeMemberName |
Βουλόδημος, Αθανάσιος |
el |
heal.committeeMemberName |
Σταφυλοπάτης, Ανδρέας-Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
117 σ. |
el |
heal.fullTextAvailability |
false |
|