Glossar / Begriff

    Vector-Database, im AI-Kontext.

    Vector-Database speichert Text-Embeddings und ermoeglicht semantische Suche statt Keyword-Match. Foundation fuer RAG und KI-Suche.

    Eine Vector-Database speichert hochdimensionale Vektor-Repraesentationen (Embeddings) von Texten, Bildern oder anderen Daten. Sucht nach semantischer Aehnlichkeit statt exaktem Keyword-Match. Bei einer User-Frage wird die Frage als Vektor kodiert und der Datenbank gegen abgelegte Vektoren verglichen. Resultate sind die Top-K aehnlichsten Eintraege. Foundation fuer RAG-Architekturen, semantische Suche, Recommendation-Engines. Bekannte Loesungen: Pinecone, Weaviate, Chroma, pgvector. Bei DSGVO-Pflicht ist pgvector in eigenem Postgres die saubere Wahl.

    Beispiele aus dem Mittelstand

    • Ein B2B-SaaS speichert seine komplette Doku als Embeddings in Pinecone und betreibt darueber semantische Hilfe-Suche.
    • Eine Anwaltskanzlei nutzt pgvector in Supabase-Postgres fuer DSGVO-konforme Mandanten-Knowledge-Base.

    Folge-Fragen

    Wie unterscheidet sich semantische Suche von Volltext-Suche?

    Volltext sucht Keyword-Matches. Semantisch sucht Bedeutung. Frage 'wie verlaengere ich den Vertrag' findet auch 'Renewal-Prozess' obwohl Keywords abweichen.

    Welche Embedding-Modelle?

    OpenAI text-embedding-3 oder Cohere embed-multilingual fuer mehrsprachig. Sentence-Transformers als Open-Source-Option mit Eigenbetrieb.

    Wie gross darf die Datenbank werden?

    Pinecone und Weaviate skalieren bis Milliarden Vektoren. pgvector bei Postgres-typischen Mengen praktikabel bis hunderttausende.

    Vector-Database in der Praxis.

    Wo dieser Begriff in deinem Geschaeft konkret wird, beginnt die Arbeit. Wir nennen klar, ob die Idee in unser Studio passt.

    Kuenstliche Intelligenz