Vector-Database, im AI-Kontext.
Vector-Database speichert Text-Embeddings und ermoeglicht semantische Suche statt Keyword-Match. Foundation fuer RAG und KI-Suche.
Eine Vector-Database speichert hochdimensionale Vektor-Repraesentationen (Embeddings) von Texten, Bildern oder anderen Daten. Sucht nach semantischer Aehnlichkeit statt exaktem Keyword-Match. Bei einer User-Frage wird die Frage als Vektor kodiert und der Datenbank gegen abgelegte Vektoren verglichen. Resultate sind die Top-K aehnlichsten Eintraege. Foundation fuer RAG-Architekturen, semantische Suche, Recommendation-Engines. Bekannte Loesungen: Pinecone, Weaviate, Chroma, pgvector. Bei DSGVO-Pflicht ist pgvector in eigenem Postgres die saubere Wahl.
Beispiele aus dem Mittelstand
- Ein B2B-SaaS speichert seine komplette Doku als Embeddings in Pinecone und betreibt darueber semantische Hilfe-Suche.
- Eine Anwaltskanzlei nutzt pgvector in Supabase-Postgres fuer DSGVO-konforme Mandanten-Knowledge-Base.
Folge-Fragen
Wie unterscheidet sich semantische Suche von Volltext-Suche?
Volltext sucht Keyword-Matches. Semantisch sucht Bedeutung. Frage 'wie verlaengere ich den Vertrag' findet auch 'Renewal-Prozess' obwohl Keywords abweichen.
Welche Embedding-Modelle?
OpenAI text-embedding-3 oder Cohere embed-multilingual fuer mehrsprachig. Sentence-Transformers als Open-Source-Option mit Eigenbetrieb.
Wie gross darf die Datenbank werden?
Pinecone und Weaviate skalieren bis Milliarden Vektoren. pgvector bei Postgres-typischen Mengen praktikabel bis hunderttausende.
Vector-Database in der Praxis.
Wo dieser Begriff in deinem Geschaeft konkret wird, beginnt die Arbeit. Wir nennen klar, ob die Idee in unser Studio passt.
Kuenstliche Intelligenz