RAG, Retrieval-Augmented Generation: τι είναι, πώς δουλεύει

Επίσης γνωστό ως: Retrieval-Augmented Generation, RAG pipeline, RAG system

Σύνταξη: Μιχαήλ Στάγιας , Founder & Lead Developer, Symbols House of Brands , Δημοσιεύτηκε 2025-12-01 , Ενημερώθηκε 2026-06-10

RAG (Retrieval-Augmented Generation), Τεχνητή Νοημοσύνη | Γλωσσάρι Symbols House of Brands

Ορισμός

RAG (Retrieval-Augmented Generation) είναι τεχνική όπου ένα LLM αναζητά πρώτα σε εξωτερική βάση γνώσης τα σχετικά κομμάτια κειμένου και μετά παράγει απάντηση βασισμένη στα κομμάτια που βρήκε. Είναι ο τρόπος που φτιάχνετε chatbot ή agent που ξέρει τα δικά σας δεδομένα, εταιρικά docs, FAQs, product catalog, internal knowledge, χωρίς fine-tuning.

Πού χρησιμοποιείται

Σε εταιρικούς chatbots πάνω από internal docs ή wikis, σε customer support bots πάνω από knowledge base και product catalog, σε νομικά/ιατρικά research tools όπου χρειάζεται source attribution, σε e-commerce search που καταλαβαίνει φυσική γλώσσα ("κάτι μπλε για παραλία κάτω από €50"), και σε internal AI ops της Symbols House of Brands όπου τα LLMs έχουν πρόσβαση σε project briefs, brand guidelines και τιμοκαταλόγους πελατών.

Πλεονεκτήματα

Πολύ φθηνότερο από fine-tuning, δεν χρειάζεται custom training, μόνο indexing
Επικαιροποιείται γρήγορα, νέα δεδομένα = re-index μόνο των αλλαγμένων chunks
Source citations, μπορείτε να δείξετε ακριβώς από ποιο έγγραφο προήλθε η απάντηση
Δραστική μείωση hallucinations, το LLM βλέπει τα δεδομένα αντί να τα μαντεύει
Λειτουργεί με οποιοδήποτε LLM, switch από GPT σε Claude χωρίς re-training
Compliance-friendly, audit trail από query σε retrieved chunks σε final answer

Συνηθισμένα λάθη

Λάθος chunk size, πολύ μικρά chunks χάνουν context, πολύ μεγάλα μειώνουν retrieval precision
Δεν κάνετε re-ranking μετά το vector search, το top-5 περιέχει irrelevant chunks και η απάντηση πέφτει
Στήνετε RAG για γνώση ευρέως γνωστή, το LLM ήδη τη ξέρει, προσθέτετε latency χωρίς λόγο
Παράλειψη evaluation, δεν μετράτε retrieval recall/precision σε ελληνικό test set πριν production
Indexing χωρίς strategy, βάζετε όλα τα PDFs χωρίς cleanup, ο RAG επιστρέφει outdated ή διπλά documents

Συχνές ερωτήσεις

RAG ή fine-tuning;

RAG στο 95% των use cases: φθηνότερο, ευκολότερο update, source citations, λιγότερα hallucinations. Fine-tuning μόνο όταν χρειάζεστε ταχύτητα (latency-sensitive) ή πολύ συγκεκριμένο domain style που δεν αποτυπώνεται σε prompt instructions.

Ποιο vector database να χρησιμοποιήσω;

Pinecone για managed setup χωρίς ops. Supabase pgvector αν ήδη τρέχετε Postgres (απλό, φθηνό). Qdrant για self-hosted production. Weaviate για multi-modal (text + images). Για μικρές εφαρμογές, ακόμα και SQLite με sqlite-vss δουλεύει.

Πόσο κοστίζει ένα RAG system;

Από €1.200 για RAG πάνω σε 100 articles με managed vector DB, έως €5.000+ για production με re-ranking, evaluation pipeline και multi-source retrieval. Λειτουργικά €30-€200/μήνα ανάλογα με όγκο queries και vector DB.

Πότε δεν χρειάζομαι RAG;

Όταν η γνώση είναι ευρέως γνωστή και ήδη στην training data του LLM, για απλά FAQs με <100 ερωτήσεις (βάλτε τα στο system prompt), και όταν τα δεδομένα σας αλλάζουν τόσο συχνά που η ευθυγράμμιση index με source γίνεται πρόβλημα.

Πώς λειτουργεί στα ελληνικά;

Με σύγχρονα embedding models (OpenAI text-embedding-3, Cohere multilingual) τα ελληνικά λειτουργούν εξαιρετικά. Για ειδική ορολογία (νομική, ιατρική) χρειάζεται evaluation και πιθανώς hybrid retrieval (vector + keyword) για να πιάνει exact term matches.

Σχετικοί όροι

Τι είναι το RAG (Retrieval-Augmented Generation);