Техники и методы
RAG (Retrieval-Augmented Generation)
Генерация с подключением внешней базы знаний
RAG (Retrieval-Augmented Generation) — техника, при которой LLM дополняется внешней базой знаний. Модель сначала ищет релевантную информацию, затем генерирует ответ на её основе.
Как работает RAG:
- Пользователь задаёт вопрос
- Система ищет релевантные документы (retrieval)
- Найденные фрагменты добавляются в контекст
- LLM генерирует ответ с учётом контекста
Преимущества RAG:
- Актуальная информация (не ограничена датой обучения)
- Меньше галлюцинаций
- Ссылки на источники
- Не требует fine-tuning
RAG используется в корпоративных чат-ботах, поисковых системах, ассистентах.
Примеры использования
- •Perplexity AI использует RAG для поиска
- •Корпоративный чат-бот с базой знаний