Обучение движков на заказ
Делаем нейросетевой AI для board games под ваш проект — от архитектуры сетей до инференса в продакшене.
Мы построили собственный движок для нард и коротких нард: нейросети учатся через self-play, оцениваются турнирами против предыдущих поколений, продвигаются в продакшен только при подтверждённом росте силы. Тот же конвейер применяем для других игр.
Ключевая компетенция — разделение фаз игры (blocking / race / asymmetric) на отдельные сети, обученные на стратифицированных позициях. Это даёт качество там, где универсальные сети теряют точность.
Технологический стек
TD-Gammon стиль
Нейросети с TD(λ) обучением. Прямое self-play без ручной разметки, миллионы партий через GPU rollout-сервер.
Multi-phase сети
Отдельная нейросеть для каждой фазы (blocking, race, asymmetric). Автоматический выбор сети по позиции.
ONNX inference
Экспорт моделей в ONNX. Инференс через ort на CPU/CUDA/OpenVINO. Десятки миллисекунд на позицию.
Распределённое обучение
Pipeline на Rust: rollout → train → tournament → promote. Демоны supervisor-системы, чекпоинты в БД.
Эквити и аналитика
Готовая инфраструктура для PR-rating, equity-loss, классификации ходов. Подключается к движку one-to-one.
Production-ready
От self-play до прод-инференса в одном flow. Реальный продакшен в нашем приложении уже год.
Как работаем
- Discovery: разбираем правила вашей игры, фаз, специфики оценочной функции.
- Архитектура сетей: входы, фазы, выходы, размеры — итерируем на маленьких прогонах.
- Self-play training: запускаем generation chain на GPU, мониторим прогресс через турниры.
- Promote и интеграция: финальные модели → ONNX → ваш inference-стек.
- Поддержка: новые поколения сетей, тонкая настройка, доработка под edge cases.
Обсудить проект
Опишите игру, желаемые сроки и ожидаемое использование (consumer-приложение, исследование, встраивание). Свяжемся в течение пары рабочих дней.