Векторные представления и векторные БД / К первой паре / Конструирование баз данных / Лекция 16
Вышка Онлайн в Дзене
В этой лекции разбираем, что такое embeddings, зачем нужны векторные базы данных и почему vector DB — это не «память нейросети» и не замена SQL, а специализированный индекс для поиска по смысловой близости. Обсуждаем: - что такое embedding и почему это не «понимание»; - чем SQL, full-text search и vector search отличаются друг от друга; - как работает similarity search, top-k и метрики близости; - зачем нужны ANN-индексы, HNSW, IVF и quantization; - где может жить vector store: PostgreSQL + pgvector, Qdrant, Milvus, Weaviate, Chroma, - Elasticsearch/OpenSearch; - почему metadata, версии, права доступа и bounded context важны не меньше самих векторов; - зачем нужен hybrid search: dense search + full-text + filters + reranking; - что логировать для наблюдаемости и оценки качества retrieval. Полезного просмотра ✨