Техники и методы

RAG (Retrieval-Augmented Generation)

Генерация с подключением внешней базы знаний

RAG (Retrieval-Augmented Generation) — техника, при которой LLM дополняется внешней базой знаний. Модель сначала ищет релевантную информацию, затем генерирует ответ на её основе.

Как работает RAG:

Пользователь задаёт вопрос
Система ищет релевантные документы (retrieval)
Найденные фрагменты добавляются в контекст
LLM генерирует ответ с учётом контекста

Преимущества RAG:

Актуальная информация (не ограничена датой обучения)
Меньше галлюцинаций
Ссылки на источники
Не требует fine-tuning

RAG используется в корпоративных чат-ботах, поисковых системах, ассистентах.

Примеры использования

•Perplexity AI использует RAG для поиска
•Корпоративный чат-бот с базой знаний

Связанные термины

Эмбеддинг LLM Context