Техники и методы

RAG (Retrieval-Augmented Generation)

Генерация с подключением внешней базы знаний

RAG (Retrieval-Augmented Generation) — техника, при которой LLM дополняется внешней базой знаний. Модель сначала ищет релевантную информацию, затем генерирует ответ на её основе.

Как работает RAG:

  1. Пользователь задаёт вопрос
  2. Система ищет релевантные документы (retrieval)
  3. Найденные фрагменты добавляются в контекст
  4. LLM генерирует ответ с учётом контекста

Преимущества RAG:

  • Актуальная информация (не ограничена датой обучения)
  • Меньше галлюцинаций
  • Ссылки на источники
  • Не требует fine-tuning

RAG используется в корпоративных чат-ботах, поисковых системах, ассистентах.

Примеры использования

  • Perplexity AI использует RAG для поиска
  • Корпоративный чат-бот с базой знаний

Связанные термины