§ 技术 CWS · 基础设施 · 韧性

会自己进化的
研究引擎。

CWS——Coding Workflow System——是我们的四层栈，从市场直觉一路走到成交订单。每一层都为复利而设计：研究反哺生产，生产反哺研究。

§ 01 — 论点

量化的瓶颈，不再是想法。

约束并不在于"想出假设"——好研究员加现代大语言模型，每天产出的假设远超任何团队的审阅能力。真正的瓶颈在那条闭环：干净的测试、合理的压力、公平的仓位、诚实的监控、优雅的退役。

CWS 把这条闭环当作产品。我们工程的对象是这个系统本身，而不是上面跑的具体策略。策略来来去去，闭环却在持续复利。

§ 02 — CWS 的三重奏

三个引擎，一条反馈回路。

01 / 03

AI 编码与策略生成

harness 化的 LLM agent 阅读最新文献、生成信号、写实现、跑单测、迭代。一年的量化体力活，被压缩成一周。

02 / 03

ETL 与弹性算力

对接交易所、数据厂商、另类数据源的持续抽取与归一化。GPU/CPU 调度按截止日期分配算力，而不是按团队。

03 / 03

研究管线与强化学习

强化学习不仅作用于策略，也作用于元系统自身：算力花在哪、哪个市场值得重审、哪条策略该退役。

§ 03 — 研究方法

管线学会改写自己。

量化研究员先把一条策略要走的完整管线亲手搭出来——取数、清洗、特征、回测、定仓、执行。这条管线就是教学大纲。其中每一个能被清晰界定的子问题，都被建模成一个自包含模块：显式的 IO 契约、验收测试、自己的 settings 与 skill 注册表。

一个 supervisor AI 持续观察这些模块在真实工作中产生的执行轨迹，从历史里挖盲点与被错过的捷径，然后向出问题的模块写补丁——改它的 settings、扩它的 skill。相同的任务在相同数据上以 ablation 方式复跑，只有当 Δ 越过噪声底线时，补丁才被接受上线。

STEP 01

专家管线

量化研究员亲手画出从想法到实盘的完整路径——这条管线就是 SigmaFi 真实出货的标准流程。
STEP 02

模块化分解

管线里每个能被清晰界定的子问题，都变成一个自包含模块：显式 IO、验收测试、自己的 settings 与 skill 注册表，可独立迭代。
STEP 03

Supervisor AI

元 agent 收集所有真实工作中产生的执行轨迹，挖失败模式与被错过的捷径，然后向出问题的模块写补丁——改它的 settings、扩它的 skill。
STEP 04

Ablation 复跑

打了补丁的模块在相同数据上复跑同一任务，与基线轨迹做比特级对比。Δ 越过噪声底线才上线，否则丢弃。

自迭代模块数

约 120

横跨整条管线

Ablation / 周

约 800

Supervisor 自发起

补丁采纳率

约 31%

Δ 越过噪声底线

想法 → 实盘

6 天

中位数，CWS 化之后

§ 04 — 架构

四层架构，全部可比特级重放。

从研究员敲下一个假设，到一笔订单到达交易所撮合引擎——四层架构，由同一支团队拥有，每晚都对当日真实流量进行端到端重放。

L4 LAYER

研究界面

围绕 CWS 构建的 notebook + IDE。研究员描述一个假设，harness 自动扫描文献、起草信号、排入向量化回测队列。
- σ-shell
- Notebook
- 策略 DSL
- Harness agent
L3 LAYER

计算与数据平面

PB 级行情与另类数据湖、GPU + CPU 集群、确定性回测、容量感知调度。同一份存储同时支撑研究与实盘。
- Tick 归档
- GPU 集群
- Replay 引擎
- Feature store
L2 LAYER

执行与风险

内核旁路网络、自研交易所接入层、低延迟 OMS，以及一个独立运行的风险系统——按策略硬限额、全局熔断都在它手上。
- Adapter
- OMS
- 智能路由
- 风险核心
L1 LAYER

可观测与重放

所有外部交互按比特捕获。昨天整天的真实流量，可以在数分钟内对候选策略重放——我们因此敢上线。
- Lineage
- Tracing
- 比特级重放
- Audit

§ 05 — 工程

延迟是一项设计选择。

我们曾在 Getco 的工程师把订单路径的每一纳秒都摆在台面上。慢路径用可读的 Rust，热路径用手调的 C++，再叠 FPGA offload——每一道权衡都是显式的。

Tick-to-Trade

< 200 μs

内部热路径

OMS p99

< 1.2 ms

跨区域

Replay 吞吐

> 1 Tb/h

比特级

回测 / 日

约 4,000 次

向量 + tick

语言

Rust · C++ · Py

局部 Mojo

区域

HKG · TYO · NYC

Active-active

§ 06 — 韧性

无聊的基础设施，平静的交易台。

确定性重放

所有外部交互都按纳秒时戳完整捕获。昨天的真实交易日，可以在数分钟内对一个代码改动重放。
Active-active 多区域

香港是锚点，东京与纽约是镜像。容灾切换每周在低影响窗口演练。
独立的风险

风险核心跑在独立的基础设施、独立的发布节奏、独立的 oncall。任何策略都不能绕过它。
默认审计

订单世系、模型版本、数据版本与参数值，全部写入只追加的账本。

工程师把它造出来，工程师也应该来跑它。

在招职位

会自己进化的研究引擎。

量化的瓶颈， 不再是想法。

三个引擎， 一条反馈回路。

AI 编码与策略生成

ETL 与弹性算力

研究管线与强化学习

管线学会 改写自己。

专家管线

模块化分解

Supervisor AI

Ablation 复跑

四层架构， 全部可比特级重放。

研究界面

计算与数据平面

执行与风险

可观测与重放

延迟是 一项设计选择。

无聊的基础设施， 平静的交易台。

确定性重放

Active-active 多区域

独立的风险

默认审计

工程师把它造出来， 工程师也应该来跑它。