Glossar / Begriff

    RAG (Retrieval-Augmented Generation), im AI-Kontext.

    RAG kombiniert LLM-Generierung mit Retrieval aus eigener Knowledge-Base. Statt halluzinierter Antworten zitiert das Modell aus deinen Quellen.

    Retrieval-Augmented Generation kombiniert ein Sprachmodell mit einer Such-Schicht ueber kuratierte Quellen. Der User-Prompt wird zuerst in eine Vektor-Suche geleitet, die relevante Snippets aus eigener Knowledge-Base zieht. Das Modell sieht die Snippets im Kontext und generiert eine Antwort, die nachweislich auf diesen Quellen basiert. Vorteil: weniger Halluzination, mehr Faktendichte, klare Provenance. Nachteil: zusaetzliche Latenz, Pflege der Knowledge-Base als Daueraufgabe. RAG ist heute Default-Architektur fuer enterprise-grade Chatbots und Knowledge-Assistenten.

    Beispiele aus dem Mittelstand

    • Ein Marie-Chatbot fuer eine Dental-Praxis nutzt RAG ueber die Praxis-Knowledge-Base, statt frei zu halluzinieren.
    • Ein SaaS-Support-Bot zieht aus der Dokumentation per Vector-Suche und antwortet zitierfaehig.

    Folge-Fragen

    Was unterscheidet RAG von Fine-Tuning?

    Fine-Tuning aendert das Modell selbst, RAG laesst das Modell unveraendert und liefert pro Anfrage frische Kontext-Snippets. Fine-Tuning ist statisch, RAG dynamisch.

    Welcher Vector-Database-Stack?

    Pinecone und Weaviate als Managed-Optionen. pgvector in Postgres bei DSGVO-Pflicht. Chroma fuer Prototypen.

    Wie kuratiere ich die Knowledge-Base?

    Pflicht-Owner pro Quelle, Versionierung, Loesch-Trigger bei Aenderungen. Ohne Pflege veraltet die RAG-Quelle und das Modell zitiert falsch.

    RAG (Retrieval-Augmented Generation) in der Praxis.

    Wo dieser Begriff in deinem Geschaeft konkret wird, beginnt die Arbeit. Wir nennen klar, ob die Idee in unser Studio passt.

    KI-Chatbot

    Weiter in unserem Wissens-Tree:

    KI-Chatbot fuer Dienstleister ohne Tech-Team →