Инженерный манифест

Архитектура reliability-first для количественного исполнения: детерминированное состояние, устойчивый I/O и примитивы операционной безопасности.

Надежность — первоклассная фича

Принципы

  • Local-first безопасность: чувствительный контекст стратегий и ключи — по возможности на устройстве пользователя.
  • Детерминированное восстановление: четкие инварианты и воспроизводимые переходы состояния.
  • Атомарная запись: никаких частичных файлов; согласованность даже при сбоях.
  • Наблюдаемость: heartbeat, watchdog и строгие границы ошибок.
Thread Watchdog

Непрерывный контроль здоровья критических циклов. Обнаруживает зависания, применяет таймауты и запускает контролируемое восстановление.

Atomic Write

Модель write-then-swap защищает конфигурации и отчеты от повреждений при падении процесса или отключении питания.

Orphan Recovery

Выявляет “сиротские” состояния/процессы после разрыва соединения и восстанавливает согласованный runtime-снимок.

Thread Watchdog

Супервизор для критических контуров (data feed, signal engine, order pipeline). Проверяет heartbeat, фиксирует “stalls” и инициирует восстановление с проверкой инвариантов.

# Watchdog loop (упрощенно) while True: for worker in critical_workers: if now() - worker.last_heartbeat > timeout_s: quarantine(worker) restart(worker, max_attempts=3) sleep(30)
  • Детект зависаний по heartbeat
  • Карантин для деградации/аномалий
  • Безопасный рестарт со валидацией состояния
  • Событийный трейл без утечек секретов
30s
Интервал health-check
Макс. попыток рестарта
Deterministic
Постура восстановления

Гарантии Atomic Write

Для конфигураций, каталогов и отчетов применяется паттерн write-then-swap: артефакт либо полностью записан, либо остается прежним.

# Atomic write (идея) def atomic_write(payload, path): tmp = path + ".tmp" with open(tmp, "wb") as f: f.write(payload) f.flush() fsync(f) rename(tmp, path)
  • Устойчивость к сбоям и отключению питания
  • Защита от частичных/битых файлов
  • Согласованное восстановление после рестарта
  • Воспроизводимые переходы состояния
0%
Частичных записей
ACID-like
Согласованность артефактов
Replayable
Состояние системы

Orphan Recovery

После reconnection система сверяет открытые ордера/позиции, восстанавливает согласованный снимок и предотвращает дублирование намерений при нестабильной сети.

5s
Цель reconciliation
24/7
Мониторинг
Idempotent
Intent ордеров

Поток восстановления

  • Запрос состояния биржи (ордера, позиции, балансы)
  • Сравнение с последним persisted runtime-снимком
  • Разрешение конфликтов (cancel/replace) с safety-check
  • Продолжение исполнения только после проверки инвариантов

Security Posture

Минимальные привилегии и local-first хранение секретов. Используйте trade-only ключи, IP-ограничения и зашифрованное хранилище. Логи и экспорт остаются аудит-пригодными и не раскрывают ключи.

Гигиена ключей
  • Trade-only permissions (без выводов)
  • IP allowlist / ограничения
  • Ротация ключей и минимизация поверхности
Аудит и наблюдаемость
  • Никаких секретов в логах/экспортах
  • Ясные error boundaries для incident review
  • Детерминированное состояние для трассировки

Rule Engine: примеры

Иллюстративные фрагменты: как задаются сигналы и подтверждения.

# Trend gate example if adx > 25 and rsi < 70: return "ALLOW_LONG", 0.9 return "NO_TRADE", 0.0

Фильтр предпочитает направленные режимы (ADX) и избегает перегретых входов (RSI).

# Momentum confirmation if macd > signal and prev_macd <= prev_signal: return "BUY", 0.7 if macd < signal and prev_macd >= prev_signal: return "SELL", 0.7

События пересечения добавляют структуру смене импульса и остаются легко интерпретируемыми.

# MTF confirmation concept signals = [analyze("15m"), analyze("1h"), analyze("4h")] if majority(signals) == "BULLISH": return "CONFIRMED" return "WEAK"

MTF-подтверждение снижает ложные срабатывания, требуя согласованности между режимами.

Operational Metrics

Высокоуровневые индикаторы надежности и качества.

99.9%
Цель по uptime
<1ms
Цель по UI latency
626/626
Тесты пройдены
0
Критические инциденты