跳到主内容
SigmaFi
§ 技术 CWS · 基础设施 · 韧性

会自己进化的
研究引擎。

CWS——Coding Workflow System——是我们的四层栈,从市场直觉一路走到成交订单。每一层都为复利而设计:研究反哺生产,生产反哺研究。

§ 01 — 论点

量化的瓶颈, 不再是想法。

约束并不在于"想出假设"——好研究员加现代大语言模型,每天产出的假设远超任何团队的审阅能力。 真正的瓶颈在那条闭环:干净的测试、合理的压力、公平的仓位、诚实的监控、优雅的退役。

CWS 把这条闭环当作产品。我们工程的对象是这个系统本身,而不是上面跑的具体策略。 策略来来去去,闭环却在持续复利。

§ 02 — CWS 的三重奏

三个引擎, 一条反馈回路。

01 / 03

AI 编码与策略生成

harness 化的 LLM agent 阅读最新文献、生成信号、写实现、跑单测、迭代。一年的量化体力活,被压缩成一周。

02 / 03

ETL 与弹性算力

对接交易所、数据厂商、另类数据源的持续抽取与归一化。GPU/CPU 调度按截止日期分配算力,而不是按团队。

03 / 03

研究管线与强化学习

强化学习不仅作用于策略,也作用于元系统自身:算力花在哪、哪个市场值得重审、哪条策略该退役。

§ 03 — 研究方法

管线学会 改写自己。

量化研究员先把一条策略要走的完整管线亲手搭出来——取数、清洗、特征、回测、定仓、执行。 这条管线就是教学大纲。其中每一个能被清晰界定的子问题,都被建模成一个自包含模块: 显式的 IO 契约、验收测试、自己的 settings 与 skill 注册表。

一个 supervisor AI 持续观察这些模块在真实工作中产生的执行轨迹, 从历史里挖盲点与被错过的捷径,然后向出问题的模块写补丁——改它的 settings、扩它的 skill。 相同的任务在相同数据上以 ablation 方式复跑, 只有当 Δ 越过噪声底线时,补丁才被接受上线。

  1. STEP 01

    专家管线

    量化研究员亲手画出从想法到实盘的完整路径——这条管线就是 SigmaFi 真实出货的标准流程。

  2. STEP 02

    模块化分解

    管线里每个能被清晰界定的子问题,都变成一个自包含模块:显式 IO、验收测试、自己的 settings 与 skill 注册表,可独立迭代。

  3. STEP 03

    Supervisor AI

    元 agent 收集所有真实工作中产生的执行轨迹,挖失败模式与被错过的捷径,然后向出问题的模块写补丁——改它的 settings、扩它的 skill。

  4. STEP 04

    Ablation 复跑

    打了补丁的模块在相同数据上复跑同一任务,与基线轨迹做比特级对比。Δ 越过噪声底线才上线,否则丢弃。

自迭代模块数

约 120

横跨整条管线

Ablation / 周

约 800

Supervisor 自发起

补丁采纳率

约 31%

Δ 越过噪声底线

想法 → 实盘

6 天

中位数,CWS 化之后

§ 04 — 架构

四层架构, 全部可比特级重放。

从研究员敲下一个假设,到一笔订单到达交易所撮合引擎——四层架构, 由同一支团队拥有,每晚都对当日真实流量进行端到端重放。

  1. L4 LAYER

    研究界面

    围绕 CWS 构建的 notebook + IDE。研究员描述一个假设,harness 自动扫描文献、起草信号、排入向量化回测队列。

    • σ-shell
    • Notebook
    • 策略 DSL
    • Harness agent
  2. L3 LAYER

    计算与数据平面

    PB 级行情与另类数据湖、GPU + CPU 集群、确定性回测、容量感知调度。同一份存储同时支撑研究与实盘。

    • Tick 归档
    • GPU 集群
    • Replay 引擎
    • Feature store
  3. L2 LAYER

    执行与风险

    内核旁路网络、自研交易所接入层、低延迟 OMS,以及一个独立运行的风险系统——按策略硬限额、全局熔断都在它手上。

    • Adapter
    • OMS
    • 智能路由
    • 风险核心
  4. L1 LAYER

    可观测与重放

    所有外部交互按比特捕获。昨天整天的真实流量,可以在数分钟内对候选策略重放——我们因此敢上线。

    • Lineage
    • Tracing
    • 比特级重放
    • Audit

§ 05 — 工程

延迟是 一项设计选择。

我们曾在 Getco 的工程师把订单路径的每一纳秒都摆在台面上。 慢路径用可读的 Rust,热路径用手调的 C++,再叠 FPGA offload——每一道权衡都是显式的。

Tick-to-Trade

< 200 μs

内部热路径

OMS p99

< 1.2 ms

跨区域

Replay 吞吐

> 1 Tb/h

比特级

回测 / 日

约 4,000 次

向量 + tick

语言

Rust · C++ · Py

局部 Mojo

区域

HKG · TYO · NYC

Active-active

§ 06 — 韧性

无聊的基础设施, 平静的交易台。

  • 确定性重放

    所有外部交互都按纳秒时戳完整捕获。昨天的真实交易日,可以在数分钟内对一个代码改动重放。

  • Active-active 多区域

    香港是锚点,东京与纽约是镜像。容灾切换每周在低影响窗口演练。

  • 独立的风险

    风险核心跑在独立的基础设施、独立的发布节奏、独立的 oncall。任何策略都不能绕过它。

  • 默认审计

    订单世系、模型版本、数据版本与参数值,全部写入只追加的账本。

工程师把它造出来, 工程师也应该来跑它。

在招职位