Как строить RAG-агента правильно: от кода до оценки качества

Аватар автора
AI.Dialogs
RAG-агент на практике — не "сделай за вечер", а как строить правильно: методология, эволюция пайплайна, промпты и измеримое качество. Именно это разбираем в третьей части серии. На демонстрационном примере RAG-агента-консультанта для бизнеса показываем: как проектировать агента с SPEC-driven подходом в Cursor, как строить системный промпт, как RAG-пайплайн эволюционирует от наивного до Agentic RAG, и как связать мониторинг в LangSmith с оценкой метрик RAGAS. ⏱ Содержание: 00:00 — Демо: RAG-агент принимает заявки и записывает на встречу 02:43 — AI-driven методология разработки в Cursor 09:10 — Архитектура ReAct-агента и выбор LangChain 12:05 — Выбор языковой модели: function calling и OpenAI-интерфейс 16:21 — Системный промпт: 5 принципов от Anthropic и OpenAI 22:05 — Инструменты агента: как описывать tools правильно 26:33 — Эволюция RAG: наивный → гибридный → Agentic RAG 33:08 — Запуск бота и отладочный режим с источниками 36:04 — LangSmith: мониторинг, трейсы и сессии 40:12 — Синтез датасетов и метрики RAGAS 45:29 — Результаты трёх экспериментов: цифры и разбор аномалий 57:08 — Итоги и анонс следующей части 🔑 Ключевые моменты: — SPEC-driven разработка в Cursor: от идеи до итераций с измеримым результатом каждого спринта — ReAct-агент на LangChain: middleware-архитектура, которая отделяет прототип от продакшна — Системный промпт: 5 принципов — роль сверху, алгоритм вместо запретов, few-shots с реальными данными — Эволюция RAG: три варианта пайплайна с числами — что...

0/0


0/0

0/0

0/0

0/0