1. DORA 四键:速度必须与稳定对望
DORA(DevOps Research and Assessment)研究反复验证:高绩效组织并非“要么快要么稳”,而是在部署频率、变更前置时间上表现更好, 同时在变更失败率、恢复时间上也不差——有时甚至更好。 解读时要分层:按服务、按团队、按环境;对比自己上周往往比横向攀比更有意义。
# DORA metric names (English) — define measurement points in your VCS / CI / incident tool
# deployment_frequency
# lead_time_for_changes
# change_failure_rate
# time_to_restore_service
# Add: unit (hours vs days), scope (service vs org), environment (prod only)
2. 价值流:先看见“等待”,再谈自动化
价值流图把增值时间与等待时间分开:评审排队、环境申请、变更审批常常比编码更拖后腿。 改造顺序建议:可视化 WIP → 减少批量 → 消除单点审批 → 自动化重复劳动。 选一个试点团队做出端到端样板,再横向复制——比全公司同时换工具失败率低一个数量级。
3. 协作拓扑与平台:谁和谁说话,决定交付速度
Team Topologies 提醒我们:流式对齐团队贴近业务价值;平台团队提供自助能力而非工单工厂; 赋能团队短期嵌入传授技能。错误模式是:平台组变成唯一瓶颈,或业务团队各自造轮子。 成功的平台把内部客户当产品用户:SLA、文档、迁移路径齐全(参见第 69 章 IDP)。
4. 文化建设:度量治不了的部分
心理安全:敢说“我不确定”“我搞砸了”,事故才能被快速曝光。 无责复盘追问系统与流程,不追个人道德;Westrum模型里“生成型(generative)”组织把信息当作资源而非权力筹码。 这些听起来“软”,却直接决定 DORA 里恢复时间与变更失败率——因为人敢不敢拉闸、敢不敢回滚,取决于会不会被秋后算账。
| Pitfall | Symptom | Healthier alternative |
|---|---|---|
| Ranking teams by DORA | gaming, hiding incidents | cohort trends + qualitative stories |
| One big transformation | fatigue, rollback culture | pilot + explicit learnings |
| Tools-first mandate | low adoption | co-design with stream teams |
5. 本章清单
- 能解释 DORA 四项指标及其联动解读,警惕指标扭曲。
- 会用价值流视角发现等待浪费,并排序改造动作。
- 理解平台/流式/赋能团队的分工与反模式。
- 能把心理安全、无责复盘与交付指标联系起来表述。
- 下一章:终章——从“能交付”到“可持续交付”的专家路线。