| dc.contributor.advisor |
Šenkeřík, Roman
|
|
| dc.contributor.author |
Šošolíková, Veronika
|
|
| dc.date.accessioned |
2025-12-10T23:09:51Z |
|
| dc.date.available |
2025-12-10T23:09:51Z |
|
| dc.date.issued |
2024-10-27 |
|
| dc.identifier |
Elektronický archiv Knihovny UTB |
|
| dc.identifier.uri |
http://hdl.handle.net/10563/57750
|
|
| dc.description.abstract |
Diplomová práce se zabývá možností provozu systému Retrieval-Augmented Generation (RAG) v plně lokálním prostředí bez nutnosti odesílání dat mimo podnik. Cílem práce bylo ověřit, zda lze pro tento účel využít i dostupné menší jazykové modely. V rámci práce byla vytvořena vlastní RAG aplikace, která umožňuje načítání dokumentů ve formátu PDF, Markdown a DOCX, jejich rozdělení na chunky, vektorové vyhledávání a generování odpovědí na dotazy. Experimenty probíhaly na syntetických dokumentech simulující provozní směrnice. Testovaly se různé konfigurace systému jako formát dokumentu, strategie chunkování, embeding a jazykový model. Výsledky byly hodnoceny pomocí kvantitativních a kvalitativních metrik a statisticky zpracovány. Na základě testování byla formulována doporučení pro optimální konfiguraci RAG systému a přípravu vstupních dat. Formát Markdown se ukázal jako nejvhodnější díky své struktuře a snadné převoditelnosti do PDF s firemní šablonou. Práce dokládá, že efektivní strojové zpracování podnikové dokumentace je možné i bez využití cloudových služeb. |
|
| dc.format |
120 |
|
| dc.language.iso |
cs |
|
| dc.publisher |
Univerzita Tomáše Bati ve Zlíně |
|
| dc.rights |
Bez omezení |
|
| dc.subject |
Retrieval-Augmented Generation
|
cs |
| dc.subject |
RAG
|
cs |
| dc.subject |
jazykové modely
|
cs |
| dc.subject |
LLM
|
cs |
| dc.subject |
sémantické vyhledávání
|
cs |
| dc.subject |
embedding modely
|
cs |
| dc.subject |
vektorové databáze
|
cs |
| dc.subject |
vnitropodniková vědomostní databáze
|
cs |
| dc.subject |
lokální AI řešení
|
cs |
| dc.subject |
strategie chunkování
|
cs |
| dc.subject |
Retrieval-Augmented Generation
|
en |
| dc.subject |
RAG
|
en |
| dc.subject |
large language models
|
en |
| dc.subject |
LLM
|
en |
| dc.subject |
semantic search
|
en |
| dc.subject |
embedding models
|
en |
| dc.subject |
vector databases
|
en |
| dc.subject |
In-House knowledge database
|
en |
| dc.subject |
local AI solutions
|
en |
| dc.subject |
chunking strategy
|
en |
| dc.title |
Využití AI při získávání informací z vnitropodnikové vědomostní databáze |
|
| dc.title.alternative |
The Use of AI in Obtaining Information from an In-House Knowledge Database |
|
| dc.type |
diplomová práce |
cs |
| dc.contributor.referee |
Štěpánek, Vít |
|
| dc.date.accepted |
2025-06-19 |
|
| dc.description.abstract-translated |
This thesis explores the possibility of running a Retrieval-Augmented Generation (RAG) system in a fully local environment without sending data outside the organization. The aim was to verify whether smaller, readily available language models could be effectively used for this purpose. As part of the thesis, a custom RAG application was developed, enabling document upload in PDF, Markdown, and DOCX formats, chunking, vector-based retrieval, and response generation. Experiments were conducted using synthetic documents simulating operational guidelines. Various system configurations were tested, including document format, chunking strategy, embedding model, and language model. Results were evaluated using both quantitative and qualitative metrics and statistically processed. Based on the testing, recommendations were formulated for the optimal configuration of the RAG system and for preparing input documents. Markdown proved to be the most suitable format due to its clear structure and easy conversion to PDF using a corporate template. The thesis demonstrates that effective machine processing of enterprise documentation is achievable without relying on cloud-based services. |
|
| dc.description.department |
Ústav informatiky a umělé inteligence |
|
| dc.thesis.degree-discipline |
Softwarové inženýrství |
cs |
| dc.thesis.degree-discipline |
Software Engineering |
en |
| dc.thesis.degree-grantor |
Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky |
cs |
| dc.thesis.degree-grantor |
Tomas Bata University in Zlín. Faculty of Applied Informatics |
en |
| dc.thesis.degree-name |
Ing. |
|
| dc.thesis.degree-program |
Informační technologie |
cs |
| dc.thesis.degree-program |
Information Technologies |
en |
| dc.identifier.stag |
70155
|
|
| dc.date.submitted |
2025-05-30 |
|