Ставка на скучный ИИ: фронтир пришёл к тому, что я строю

Я сделал скучную ставку: проверяемый ИИ. Отвечает строго по корпусу клиента, ставит ссылку на пункт, честно молчит, когда основания нет. Год назад это звучало как ниша для параноиков из права и медицины, пока все гонялись за «своим суперинтеллектом».

Недавно я пропустил через себя десятки больших интервью этого года: Хуанг, Наделла, Хассабис, голоса из Anthropic и DeepMind. Люди, которые строят сам фронтир. Никто из них не продаёт то, что продаю я. И почти каждый описывает мою ставку своими словами.

Базовая модель — товар. Хуанг сравнивает её с операционной системой: ценность в слое поверх. Стоимость инференса за два года упала в разы. Я писал это ещё весной, теперь то же говорит человек, который эти модели и продаёт.

Доверие важнее интеллекта. Внедрение буксует там, где ответу нельзя верить. Человеку ошибку прощают, машине уверенную выдумку нет. Придуманная ссылка на норму в праве или медицине не «галлюцинация», а стоп в переговорах.

Суверенность — условие, не паранойя. Вывезти данные наружу, чтобы импортировать обратно собственный интеллект, не выйдет. Право, медицина, госданные живут только внутри своего контура.

Пишу это не ради «я же говорил». Меняется сам разговор с клиентом. Раньше первые полчаса уходили на «зачем вообще проверяемый ИИ»; теперь это знают и без меня, со сцены, от самых громких имён. Остаётся один вопрос: чем докажешь.

И тут у меня есть то, чего нет у голосов со сцены, — цифра. 60 вопросов, собранных из самого корпуса: поиск находит нужное в 95% случаев, модель честно отказывается там, где основания нет, а 31B оказалась не лучше 12B (10.0 против 9.67). Платить за размер незачем. Я ведь сначала сам решил, что узкое место — поиск; замер поправил меня, «отказы» были корректными. Я доверяю замеру больше, чем своей интуиции. В этом и ставка.

Базовая модель у всех одна. Разница в слое поверх и в том, измерил ли ты его. Раньше работа была убедить, что проверяемый ИИ нужен. Теперь она другая: показать цифрой, что у меня он лучше.

Читать по теме