Модели и архитектуры

LLM (Large Language Model)

Большая языковая модель — нейросеть для работы с текстом

Large Language Model (LLM) — это нейронная сеть с миллиардами параметров, обученная на огромных объёмах текста. LLM способны генерировать, анализировать и преобразовывать текст на естественном языке.

Основные характеристики LLM:

Миллиарды параметров (GPT-4 ~1.7 триллионов)
Обучение на терабайтах текста из интернета
Понимание контекста и генерация связного текста
Способность следовать инструкциям (после fine-tuning)

Примеры LLM: GPT-4, Claude, LLaMA, Gemini, YandexGPT.

Примеры использования

•ChatGPT использует LLM GPT-4 для генерации ответов
•Claude построен на LLM от Anthropic

Связанные термины

GPT Transformer Токены Context