Kurz erklärt für Studis: Embeddings, Ähnlichkeit und Retrieval – damit ChatGPT Inhalte gezielt wiederfindet.
Embeddings: Texte als Zahlen
Ein Satz wird zu einem Zahlenvektor. Ähnliche Sätze liegen nah beieinander – unabhängig von der exakten Wortwahl.
Vektorstore: die Bibliothek für Bedeutungen
Die Vektoren landen in einer Datenbank (z. B. FAISS, Pinecone). Dort können wir schnell die ähnlichsten Einträge finden.
Pipeline: Text → Embedding → Vektorstore (Index) → Query-Embedding → k-nächste Nachbarn
Warum das wichtig ist
- Bessere Antworten auf eigene Inhalte
- Robuste Suche trotz Schreibweise/Fehler
- Basis für RAG (Antworten mit Quellen)
Lernen im Flow: Dual studieren mit KI-Power
Unsere Programme verbinden Studium, Praxis und moderne AI-Workflows. Finde heraus, welcher Weg zu dir passt.
Jetzt informieren