Все статьи
AI 5 май 2026 12 мин Елена Соколова
RAG-системы: практическое руководство
Архитектура retrieval-augmented generation на примере реального проекта.
RAG (Retrieval-Augmented Generation) — это способ дать LLM доступ к вашим собственным данным без дообучения модели.
Когда нужен RAG
- База знаний компании
- Поиск по документации
- Q&A по большим корпусам текстов
- Юридические и медицинские ассистенты
Базовая архитектура
Ingestion: документы → чанки → эмбеддинги → векторная БД. Retrieval: запрос → поиск top-k чанков → передача в LLM как контекст.
Что чаще всего ломается
Слабое чанкование (теряется контекст), плохие эмбеддинги под русский язык, отсутствие reranking. На практике именно эти три фактора определяют качество ответов.