Využití velkých jazykových modelů v počítačovém vidění

DSpace Repository

Language: English čeština 

Využití velkých jazykových modelů v počítačovém vidění

Show simple item record

dc.contributor.advisor Malaník, David
dc.contributor.author Sáblík, Jan
dc.date.accessioned 2024-07-23T13:16:45Z
dc.date.available 2024-07-23T13:16:45Z
dc.date.issued 2023-11-05
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/56306
dc.description.abstract Tato diplomová práce se zabývá velkými jazykovými modely, pokročilými algoritmy pro detekci objektů a vývoji aplikací implementující tyto techniky pro platformu Android. První kapitola je zaměřena na velké jazykové modely, ve které jsou nejprve představeny základní pojmy a principy, včetně historického vývoje a současné architektury Transformer. Dále kapitola popisuje možné aplikace v počítačovém vidění, útoky a omezení. Druhá kapitola je zaměřena na zástupce moderních algoritmů pro detekci objektů, jejich rozdělení a princip. Třetí kapitola teoretické části stručně popisuje vývoj aplikací pro platformu Android. V praktické části je prezentován vývoj a testování mobilní aplikace SightSeek integrující počítačové vidění a velké jazykové modely. Ve druhé polovině praktické části je popsán proces vytváření datasetu a následné trénování klasifikačního modelu pro tuto aplikaci.
dc.format 101 s.
dc.language.iso cs
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject Velký jazykový model cs
dc.subject detekce objektů cs
dc.subject Android cs
dc.subject YOLO cs
dc.subject Large Language Model en
dc.subject object detection en
dc.subject Android en
dc.subject YOLO en
dc.title Využití velkých jazykových modelů v počítačovém vidění
dc.title.alternative Utilization of Large Language Models in Computer Vision
dc.type diplomová práce cs
dc.contributor.referee Janota, David
dc.date.accepted 2024-06-05
dc.description.abstract-translated This thesis deals with large language models, advanced object detection algorithms, and the development of applications implementing these techniques for the Android platform. The first chapter focuses on large language models, first introducing the underlying concepts and principles, including the historical development and current Transformer architecture. Next, the chapter describes possible applications in computer vision, attacks, and limitations. The second chapter focuses on modern object detection algorithms, their types, and their principles. The third chapter of the theoretical part describes the development of applications for the Android platform. The practical part presents the development and testing of the SightSeek mobile application, which integrates computer vision and a large language model. The second half of the practical part describes the dataset creation process and the subsequent training of the classification model for this application.
dc.description.department Ústav informatiky a umělé inteligence
dc.thesis.degree-discipline Softwarové inženýrství cs
dc.thesis.degree-discipline Software Engineering en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Ing.
dc.thesis.degree-program Informační technologie cs
dc.thesis.degree-program Information Technologies en
dc.identifier.stag 66773
dc.date.submitted 2024-05-03


Files in this item

Files Size Format View Description
sáblík_2024_dp.pdf 5.929Mb PDF View/Open None
sáblík_2024_op.pdf 374.6Kb PDF View/Open None
sáblík_2024_vp.pdf 148.9Kb PDF View/Open None

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account