Модели и архитектуры
LLM (Large Language Model)
Большая языковая модель — нейросеть для работы с текстом
Large Language Model (LLM) — это нейронная сеть с миллиардами параметров, обученная на огромных объёмах текста. LLM способны генерировать, анализировать и преобразовывать текст на естественном языке.
Основные характеристики LLM:
- Миллиарды параметров (GPT-4 ~1.7 триллионов)
- Обучение на терабайтах текста из интернета
- Понимание контекста и генерация связного текста
- Способность следовать инструкциям (после fine-tuning)
Примеры LLM: GPT-4, Claude, LLaMA, Gemini, YandexGPT.
Примеры использования
- •ChatGPT использует LLM GPT-4 для генерации ответов
- •Claude построен на LLM от Anthropic