A3 (Scaling Laws)

A3(Scaling Laws)

在固定计算预算下,用少量“试验预算”构建 scaling law,并预测 1e19 FLOPs 下的 compute-optimal 模型规模与超参。它不要求你真的训练模型,而是通过一个“训练 API”查询不同配置的最终 loss,然后用这些结果拟合与外推。

1) 整体设定与交付物

设定(你在做什么)

## 2) Part A:Scaling Laws Review(Chinchilla IsoFLOPs 复现题,5分)

这是一个“热身+校准”任务:用给定的合成数据复现 IsoFLOPs 方法。

任务:chinchilla_isoflops(5 points)

3) Part B:Constructing Scaling Laws(主任务,50分)

用“训练 API”设计试验、拟合 scaling law、并预测 \(1e19\) FLOPs 下最优模型大小与训练超参。

任务:scaling_laws(50 points)

### 训练 API(写代码调用)

API 的核心 endpoint:GET /loss,输入一个配置 → 返回 losstotal_flops_used

可调超参范围(你会在试验设计里 sweep):

还有两个辅助 endpoint:

能力点

4) 训练细节“透明化”任务(用于做合理假设)

给了训练 run 的固定细节(让你理解 loss 的生成机制与超参影响),例如:

能力点:理解你拟合出来的 scaling law “对应的是哪套训练 recipe”。

一句话总结:A3 包含哪些任务类型?

  1. 复现 IsoFLOPs 的标准套路(小题):从合成 runs 里找到 \(N_{\text{opt}}(C)\)\(D_{\text{opt}}(C)\) 并拟合 power law,再外推到更大预算。
  2. 主任务:预算受限的实验设计 + 拟合 scaling law + 预测 1e19 FLOPs 最优配置:写代码调用训练 API、控制 2e18 预算、给出可复现方法论与最终预测,并按预测效果计分。