1 мин чтения#analytics#engineering

Данные — это сложный процент

Данные — это сложный процент.

Две недели назад я собрал базу: 22.7 миллиона событий, 497 тысяч записей статистики игроков, 27,500 матчей за 8 сезонов. Для одного продукта.

А потом за 48 часов на этой же базе собрал второй. Новая модель, новые расчёты, валидация — всё с нуля до рабочего прототипа. 100 тестов проходят. Данные те же самые.

Эксперты оценивали эту работу в 90-150 часов. Заняло ~12. Не потому что я гений, а потому что:

  1. Данные уже лежали в PostgreSQL — один JOIN, и у тебя новый продукт
  2. Claude Code — AI берёт 80% рутины, ты думаешь об архитектуре
  3. Домен я знаю 10+ лет — не надо разбираться что значат цифры

Вывод простой: инвестиция в данные окупается нелинейно. Первый продукт на базе стоит недели. Второй — часы. Третий будет ещё быстрее.

Если строишь что-то в данных — не экономь на фундаменте. Он окупится способами, которые ты сейчас даже не видишь.

Читать по теме