Модели и архитектуры

LLM (Large Language Model)

Большая языковая модель — нейросеть для работы с текстом

Large Language Model (LLM) — это нейронная сеть с миллиардами параметров, обученная на огромных объёмах текста. LLM способны генерировать, анализировать и преобразовывать текст на естественном языке.

Основные характеристики LLM:

  • Миллиарды параметров (GPT-4 ~1.7 триллионов)
  • Обучение на терабайтах текста из интернета
  • Понимание контекста и генерация связного текста
  • Способность следовать инструкциям (после fine-tuning)

Примеры LLM: GPT-4, Claude, LLaMA, Gemini, YandexGPT.

Примеры использования

  • ChatGPT использует LLM GPT-4 для генерации ответов
  • Claude построен на LLM от Anthropic

Связанные термины