Επίσης γνωστό ως: Retrieval-Augmented Generation, RAG pipeline, RAG system
Ορισμός
RAG (Retrieval-Augmented Generation) είναι τεχνική όπου ένα LLM αναζητά πρώτα σε εξωτερική βάση γνώσης τα σχετικά κομμάτια κειμένου και μετά παράγει απάντηση βασισμένη στα κομμάτια που βρήκε. Είναι ο τρόπος που φτιάχνετε chatbot ή agent που ξέρει τα δικά σας δεδομένα, εταιρικά docs, FAQs, product catalog, internal knowledge, χωρίς fine-tuning.
Πού χρησιμοποιείται
Σε εταιρικούς chatbots πάνω από internal docs ή wikis, σε customer support bots πάνω από knowledge base και product catalog, σε νομικά/ιατρικά research tools όπου χρειάζεται source attribution, σε e-commerce search που καταλαβαίνει φυσική γλώσσα ("κάτι μπλε για παραλία κάτω από €50"), και σε internal AI ops της Symbols House of Brands όπου τα LLMs έχουν πρόσβαση σε project briefs, brand guidelines και τιμοκαταλόγους πελατών.
Πλεονεκτήματα
- Πολύ φθηνότερο από fine-tuning, δεν χρειάζεται custom training, μόνο indexing
- Επικαιροποιείται γρήγορα, νέα δεδομένα = re-index μόνο των αλλαγμένων chunks
- Source citations, μπορείτε να δείξετε ακριβώς από ποιο έγγραφο προήλθε η απάντηση
- Δραστική μείωση hallucinations, το LLM βλέπει τα δεδομένα αντί να τα μαντεύει
- Λειτουργεί με οποιοδήποτε LLM, switch από GPT σε Claude χωρίς re-training
- Compliance-friendly, audit trail από query σε retrieved chunks σε final answer
Συνηθισμένα λάθη
- Λάθος chunk size, πολύ μικρά chunks χάνουν context, πολύ μεγάλα μειώνουν retrieval precision
- Δεν κάνετε re-ranking μετά το vector search, το top-5 περιέχει irrelevant chunks και η απάντηση πέφτει
- Στήνετε RAG για γνώση ευρέως γνωστή, το LLM ήδη τη ξέρει, προσθέτετε latency χωρίς λόγο
- Παράλειψη evaluation, δεν μετράτε retrieval recall/precision σε ελληνικό test set πριν production
- Indexing χωρίς strategy, βάζετε όλα τα PDFs χωρίς cleanup, ο RAG επιστρέφει outdated ή διπλά documents
Συχνές ερωτήσεις
RAG ή fine-tuning;
Ποιο vector database να χρησιμοποιήσω;
Πόσο κοστίζει ένα RAG system;
Πότε δεν χρειάζομαι RAG;
Πώς λειτουργεί στα ελληνικά;
Σχετικοί όροι