AI 编码与策略生成
harness 化的 LLM agent 阅读最新文献、生成信号、写实现、跑单测、迭代。一年的量化体力活,被压缩成一周。
CWS——Coding Workflow System——是我们的四层栈,从市场直觉一路走到成交订单。每一层都为复利而设计:研究反哺生产,生产反哺研究。
§ 01 — 论点
约束并不在于"想出假设"——好研究员加现代大语言模型,每天产出的假设远超任何团队的审阅能力。 真正的瓶颈在那条闭环:干净的测试、合理的压力、公平的仓位、诚实的监控、优雅的退役。
CWS 把这条闭环当作产品。我们工程的对象是这个系统本身,而不是上面跑的具体策略。 策略来来去去,闭环却在持续复利。
§ 02 — CWS 的三重奏
harness 化的 LLM agent 阅读最新文献、生成信号、写实现、跑单测、迭代。一年的量化体力活,被压缩成一周。
对接交易所、数据厂商、另类数据源的持续抽取与归一化。GPU/CPU 调度按截止日期分配算力,而不是按团队。
强化学习不仅作用于策略,也作用于元系统自身:算力花在哪、哪个市场值得重审、哪条策略该退役。
§ 03 — 研究方法
量化研究员先把一条策略要走的完整管线亲手搭出来——取数、清洗、特征、回测、定仓、执行。 这条管线就是教学大纲。其中每一个能被清晰界定的子问题,都被建模成一个自包含模块: 显式的 IO 契约、验收测试、自己的 settings 与 skill 注册表。
一个 supervisor AI 持续观察这些模块在真实工作中产生的执行轨迹, 从历史里挖盲点与被错过的捷径,然后向出问题的模块写补丁——改它的 settings、扩它的 skill。 相同的任务在相同数据上以 ablation 方式复跑, 只有当 Δ 越过噪声底线时,补丁才被接受上线。
量化研究员亲手画出从想法到实盘的完整路径——这条管线就是 SigmaFi 真实出货的标准流程。
管线里每个能被清晰界定的子问题,都变成一个自包含模块:显式 IO、验收测试、自己的 settings 与 skill 注册表,可独立迭代。
元 agent 收集所有真实工作中产生的执行轨迹,挖失败模式与被错过的捷径,然后向出问题的模块写补丁——改它的 settings、扩它的 skill。
打了补丁的模块在相同数据上复跑同一任务,与基线轨迹做比特级对比。Δ 越过噪声底线才上线,否则丢弃。
自迭代模块数
约 120
横跨整条管线
Ablation / 周
约 800
Supervisor 自发起
补丁采纳率
约 31%
Δ 越过噪声底线
想法 → 实盘
6 天
中位数,CWS 化之后
§ 04 — 架构
从研究员敲下一个假设,到一笔订单到达交易所撮合引擎——四层架构, 由同一支团队拥有,每晚都对当日真实流量进行端到端重放。
围绕 CWS 构建的 notebook + IDE。研究员描述一个假设,harness 自动扫描文献、起草信号、排入向量化回测队列。
PB 级行情与另类数据湖、GPU + CPU 集群、确定性回测、容量感知调度。同一份存储同时支撑研究与实盘。
内核旁路网络、自研交易所接入层、低延迟 OMS,以及一个独立运行的风险系统——按策略硬限额、全局熔断都在它手上。
所有外部交互按比特捕获。昨天整天的真实流量,可以在数分钟内对候选策略重放——我们因此敢上线。
§ 05 — 工程
我们曾在 Getco 的工程师把订单路径的每一纳秒都摆在台面上。 慢路径用可读的 Rust,热路径用手调的 C++,再叠 FPGA offload——每一道权衡都是显式的。
Tick-to-Trade
< 200 μs
内部热路径
OMS p99
< 1.2 ms
跨区域
Replay 吞吐
> 1 Tb/h
比特级
回测 / 日
约 4,000 次
向量 + tick
语言
Rust · C++ · Py
局部 Mojo
区域
HKG · TYO · NYC
Active-active
§ 06 — 韧性
所有外部交互都按纳秒时戳完整捕获。昨天的真实交易日,可以在数分钟内对一个代码改动重放。
香港是锚点,东京与纽约是镜像。容灾切换每周在低影响窗口演练。
风险核心跑在独立的基础设施、独立的发布节奏、独立的 oncall。任何策略都不能绕过它。
订单世系、模型版本、数据版本与参数值,全部写入只追加的账本。