Μετάβαση στο περιεχόμενο
210 440 8777

Γλωσσάρι, Τεχνητή Νοημοσύνη

Τι είναι το RAG (Retrieval-Augmented Generation);

RAG (Retrieval-Augmented Generation) είναι η τεχνική όπου ένα LLM αναζητά πρώτα σε εξωτερική βάση γνώσης (vector database) τα σχετικά κομμάτια κειμένου και μετά παράγει απάντηση βασισμένη σε αυτά, όχι μόνο στη γνώση εκπαίδευσής του.

Επίσης γνωστό ως: Retrieval-Augmented Generation, RAG pipeline, RAG system

RAG (Retrieval-Augmented Generation), Τεχνητή Νοημοσύνη | Γλωσσάρι Symbols House of Brands

Ορισμός

RAG (Retrieval-Augmented Generation) είναι τεχνική όπου ένα LLM αναζητά πρώτα σε εξωτερική βάση γνώσης τα σχετικά κομμάτια κειμένου και μετά παράγει απάντηση βασισμένη στα κομμάτια που βρήκε. Είναι ο τρόπος που φτιάχνετε chatbot ή agent που ξέρει τα δικά σας δεδομένα, εταιρικά docs, FAQs, product catalog, internal knowledge, χωρίς fine-tuning.

Πού χρησιμοποιείται

Σε εταιρικούς chatbots πάνω από internal docs ή wikis, σε customer support bots πάνω από knowledge base και product catalog, σε νομικά/ιατρικά research tools όπου χρειάζεται source attribution, σε e-commerce search που καταλαβαίνει φυσική γλώσσα ("κάτι μπλε για παραλία κάτω από €50"), και σε internal AI ops της Symbols House of Brands όπου τα LLMs έχουν πρόσβαση σε project briefs, brand guidelines και τιμοκαταλόγους πελατών.

Πλεονεκτήματα

  • Πολύ φθηνότερο από fine-tuning, δεν χρειάζεται custom training, μόνο indexing
  • Επικαιροποιείται γρήγορα, νέα δεδομένα = re-index μόνο των αλλαγμένων chunks
  • Source citations, μπορείτε να δείξετε ακριβώς από ποιο έγγραφο προήλθε η απάντηση
  • Δραστική μείωση hallucinations, το LLM βλέπει τα δεδομένα αντί να τα μαντεύει
  • Λειτουργεί με οποιοδήποτε LLM, switch από GPT σε Claude χωρίς re-training
  • Compliance-friendly, audit trail από query σε retrieved chunks σε final answer

Συνηθισμένα λάθη

  • Λάθος chunk size, πολύ μικρά chunks χάνουν context, πολύ μεγάλα μειώνουν retrieval precision
  • Δεν κάνετε re-ranking μετά το vector search, το top-5 περιέχει irrelevant chunks και η απάντηση πέφτει
  • Στήνετε RAG για γνώση ευρέως γνωστή, το LLM ήδη τη ξέρει, προσθέτετε latency χωρίς λόγο
  • Παράλειψη evaluation, δεν μετράτε retrieval recall/precision σε ελληνικό test set πριν production
  • Indexing χωρίς strategy, βάζετε όλα τα PDFs χωρίς cleanup, ο RAG επιστρέφει outdated ή διπλά documents

Συχνές ερωτήσεις

RAG ή fine-tuning;
RAG στο 95% των use cases: φθηνότερο, ευκολότερο update, source citations, λιγότερα hallucinations. Fine-tuning μόνο όταν χρειάζεστε ταχύτητα (latency-sensitive) ή πολύ συγκεκριμένο domain style που δεν αποτυπώνεται σε prompt instructions.
Ποιο vector database να χρησιμοποιήσω;
Pinecone για managed setup χωρίς ops. Supabase pgvector αν ήδη τρέχετε Postgres (απλό, φθηνό). Qdrant για self-hosted production. Weaviate για multi-modal (text + images). Για μικρές εφαρμογές, ακόμα και SQLite με sqlite-vss δουλεύει.
Πόσο κοστίζει ένα RAG system;
Από €1.200 για RAG πάνω σε 100 articles με managed vector DB, έως €5.000+ για production με re-ranking, evaluation pipeline και multi-source retrieval. Λειτουργικά €30-€200/μήνα ανάλογα με όγκο queries και vector DB.
Πότε δεν χρειάζομαι RAG;
Όταν η γνώση είναι ευρέως γνωστή και ήδη στην training data του LLM, για απλά FAQs με <100 ερωτήσεις (βάλτε τα στο system prompt), και όταν τα δεδομένα σας αλλάζουν τόσο συχνά που η ευθυγράμμιση index με source γίνεται πρόβλημα.
Πώς λειτουργεί στα ελληνικά;
Με σύγχρονα embedding models (OpenAI text-embedding-3, Cohere multilingual) τα ελληνικά λειτουργούν εξαιρετικά. Για ειδική ορολογία (νομική, ιατρική) χρειάζεται evaluation και πιθανώς hybrid retrieval (vector + keyword) για να πιάνει exact term matches.

Έτοιμοι να ξεκινήσουμε;

Πες μας λίγα λόγια για το έργο σου. Θα σου στείλουμε σταθερή προσφορά σε 24 ώρες.