Обучение движков на заказ

Делаем нейросетевой AI для board games под ваш проект — от архитектуры сетей до инференса в продакшене.

Мы построили собственный движок для нард и коротких нард: нейросети учатся через self-play, оцениваются турнирами против предыдущих поколений, продвигаются в продакшен только при подтверждённом росте силы. Тот же конвейер применяем для других игр.

Ключевая компетенция — разделение фаз игры (blocking / race / asymmetric) на отдельные сети, обученные на стратифицированных позициях. Это даёт качество там, где универсальные сети теряют точность.

Технологический стек

TD-Gammon стиль

Нейросети с TD(λ) обучением. Прямое self-play без ручной разметки, миллионы партий через GPU rollout-сервер.

Multi-phase сети

Отдельная нейросеть для каждой фазы (blocking, race, asymmetric). Автоматический выбор сети по позиции.

ONNX inference

Экспорт моделей в ONNX. Инференс через ort на CPU/CUDA/OpenVINO. Десятки миллисекунд на позицию.

Распределённое обучение

Pipeline на Rust: rollout → train → tournament → promote. Демоны supervisor-системы, чекпоинты в БД.

Эквити и аналитика

Готовая инфраструктура для PR-rating, equity-loss, классификации ходов. Подключается к движку one-to-one.

Production-ready

От self-play до прод-инференса в одном flow. Реальный продакшен в нашем приложении уже год.

Как работаем

Discovery: разбираем правила вашей игры, фаз, специфики оценочной функции.
Архитектура сетей: входы, фазы, выходы, размеры — итерируем на маленьких прогонах.
Self-play training: запускаем generation chain на GPU, мониторим прогресс через турниры.
Promote и интеграция: финальные модели → ONNX → ваш inference-стек.
Поддержка: новые поколения сетей, тонкая настройка, доработка под edge cases.

Обсудить проект

Опишите игру, желаемые сроки и ожидаемое использование (consumer-приложение, исследование, встраивание). Свяжемся в течение пары рабочих дней.