Заметки с тегом
#ai
11 записей
- 4 мин чтения
Дообучение, RAG и reasoning — слои, а не варианты выбора
Спросили — почему мой подход лучше RAG и reasoning? Не лучше — живёт ниже них в стеке. Где какой слой работает и где ломается.
- 3 мин чтения
655 вопросов за вечер. Бенчмарк для своей же модели.
Собрал ЛИИ-Спорт-Bench-RU v0.1 — 655 экспертных вопросов по 35 видам спорта. Не один: со мной работали одиннадцать ИИ-агентов параллельно.
- 3 мин чтения
Это не камера
Сегодня собрал на бумаге продукт, которого пока нет. К вечеру стало понятно: это не камера. Это ИИ-система, в которой самое сложное работает прямо на телефоне — и эту часть я отдаю бесплатно.
- 4 мин чтения
Выложил страницу LLM-интеграции — начинаем с образования
Продуктовая страница LLM-интеграции для российских организаций. 60-90 дней до пилота. Начинаем с образования, дальше — медицина и юриспруденция.
- 2 мин чтения
Дообучил модель на уровне GPT-5.4 за 30 000₽
30 000₽, 16 часов на H200, #9 из 30 на EduBench-RU. 32B параллельно провалилась — втрое больше GPU-времени, итоговый скор хуже.
- 4 мин чтения
Как мы провалили обучение LLM чувашскому
Обучили 27B-модель русскому образованию — 94% качества Gemini 3.1. Добавили чувашский — получили катастрофу: модель забыла русский и научилась имитировать, не понимая.
- 2 мин чтения
AI-учитель для чувашского языка
Про EduBench и EduLLM — следующий шаг оказался неожиданным даже для меня.
- 1 мин чтения
EduBench-RU: 30 моделей на задачах российских учителей
Вчера за один вечер протестировал 22 нейросети на задачах для российских учителей.
- 1 мин чтения
Параллельные агенты рефакторят монорепу
5 AI-агентов переписали код за 45 минут.
- 1 мин чтения
AI-кодинг локально
Self-hosted AI для кодинга: это уже работает
- 1 мин чтения
OpenCode vs Claude Code vs Codex в 2026
OpenCode vs Claude Code vs Codex: что выбрать в 2026?