| # | Токен | Тип | ID |
|---|
gpt-tokenizer). Реальные ID, реальное число токенов.BPE (упрощённый) — учебная имитация на маленьком словаре медицинских терминов.
По словам — огромный словарь, проблема с незнакомыми словами.
По символам — универсально, но очень длинные последовательности.
Один и тот же клинический текст на русском обычно требует в 1.5-2 раза больше токенов, чем на английском. Прямое влияние на стоимость API.
Матрица ниже — это выход блока Self-Attention из архитектуры трансформера (показана под матрицей). Каждый токен (строка) «смотрит» на остальные (столбцы) и решает, насколько важна каждая связь. Сумма каждой строки = 100% (softmax).
⚠️ Это учебная симуляция, а не реальные веса модели. Реальные attention-значения существуют внутри LLM, но провайдеры API (DeepSeek, OpenAI, Claude) их не возвращают — слишком большой объём данных и закрытая архитектура. Чтобы получить настоящие веса, нужно запускать модель локально через библиотеку вроде transformers (Python) с hooks на attention-слои.
🔌 Подключение к ИИ (DeepSeek/OpenAI/Moodle Core AI) на эту матрицу не влияет — она генерируется JavaScript для демонстрации общих паттернов. API используется только во вкладках «Генерация», «Оценка», «Галлюцинации».
🧮 Как считается: для каждой клетки задаётся «логит» (предпочтение), затем по строке применяется softmax. Большие логиты после softmax дают пики 50–70%, малые — 1–3%. Каждая «голова» использует свою формулу логитов (см. описание справа). Переключайте голову ползунком, чтобы увидеть разные паттерны.
T=0.7: вероятности «смягчаются» — менее вероятные варианты тоже имеют шанс.
T=1.5+: вероятности почти выравниваются — «креативный хаос», много бессмыслицы.
Деление logits на T: ↑T = более равномерное распределение
K=1: greedy — всегда лучший вариант.
K=5–10: разумный выбор для медицины.
K=50: широкий, но шумный выбор.
P=0.9: берутся токены, покрывающие 90% вероятности.
Адаптивнее Top-K: если один токен = 95%, он единственный кандидат. Если вероятности размазаны — кандидатов много.
🔴 Без grounding (только «знания» модели)
🟢 С контекстом (RAG-style grounding)
7 классов ошибок, которые чаще всего ломают применение LLM в медицине. У каждой — конкретное решение и ссылка на демо в других вкладках.