Využití AI při získávání informací z vnitropodnikové vědomostní databáze

DSpace Repository

Language: English čeština 

Využití AI při získávání informací z vnitropodnikové vědomostní databáze

Show simple item record

dc.contributor.advisor Šenkeřík, Roman
dc.contributor.author Šošolíková, Veronika
dc.date.accessioned 2025-12-10T23:09:51Z
dc.date.available 2025-12-10T23:09:51Z
dc.date.issued 2024-10-27
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/57750
dc.description.abstract Diplomová práce se zabývá možností provozu systému Retrieval-Augmented Generation (RAG) v plně lokálním prostředí bez nutnosti odesílání dat mimo podnik. Cílem práce bylo ověřit, zda lze pro tento účel využít i dostupné menší jazykové modely. V rámci práce byla vytvořena vlastní RAG aplikace, která umožňuje načítání dokumentů ve formátu PDF, Markdown a DOCX, jejich rozdělení na chunky, vektorové vyhledávání a generování odpovědí na dotazy. Experimenty probíhaly na syntetických dokumentech simulující provozní směrnice. Testovaly se různé konfigurace systému jako formát dokumentu, strategie chunkování, embeding a jazykový model. Výsledky byly hodnoceny pomocí kvantitativních a kvalitativních metrik a statisticky zpracovány. Na základě testování byla formulována doporučení pro optimální konfiguraci RAG systému a přípravu vstupních dat. Formát Markdown se ukázal jako nejvhodnější díky své struktuře a snadné převoditelnosti do PDF s firemní šablonou. Práce dokládá, že efektivní strojové zpracování podnikové dokumentace je možné i bez využití cloudových služeb.
dc.format 120
dc.language.iso cs
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject Retrieval-Augmented Generation cs
dc.subject RAG cs
dc.subject jazykové modely cs
dc.subject LLM cs
dc.subject sémantické vyhledávání cs
dc.subject embedding modely cs
dc.subject vektorové databáze cs
dc.subject vnitropodniková vědomostní databáze cs
dc.subject lokální AI řešení cs
dc.subject strategie chunkování cs
dc.subject Retrieval-Augmented Generation en
dc.subject RAG en
dc.subject large language models en
dc.subject LLM en
dc.subject semantic search en
dc.subject embedding models en
dc.subject vector databases en
dc.subject In-House knowledge database en
dc.subject local AI solutions en
dc.subject chunking strategy en
dc.title Využití AI při získávání informací z vnitropodnikové vědomostní databáze
dc.title.alternative The Use of AI in Obtaining Information from an In-House Knowledge Database
dc.type diplomová práce cs
dc.contributor.referee Štěpánek, Vít
dc.date.accepted 2025-06-19
dc.description.abstract-translated This thesis explores the possibility of running a Retrieval-Augmented Generation (RAG) system in a fully local environment without sending data outside the organization. The aim was to verify whether smaller, readily available language models could be effectively used for this purpose. As part of the thesis, a custom RAG application was developed, enabling document upload in PDF, Markdown, and DOCX formats, chunking, vector-based retrieval, and response generation. Experiments were conducted using synthetic documents simulating operational guidelines. Various system configurations were tested, including document format, chunking strategy, embedding model, and language model. Results were evaluated using both quantitative and qualitative metrics and statistically processed. Based on the testing, recommendations were formulated for the optimal configuration of the RAG system and for preparing input documents. Markdown proved to be the most suitable format due to its clear structure and easy conversion to PDF using a corporate template. The thesis demonstrates that effective machine processing of enterprise documentation is achievable without relying on cloud-based services.
dc.description.department Ústav informatiky a umělé inteligence
dc.thesis.degree-discipline Softwarové inženýrství cs
dc.thesis.degree-discipline Software Engineering en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Ing.
dc.thesis.degree-program Informační technologie cs
dc.thesis.degree-program Information Technologies en
dc.identifier.stag 70155
dc.date.submitted 2025-05-30


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account