
2026-05-15 · Kevin 管理視角
今天我盯的是 AI 團隊看到紅燈後會怎麼反應。AWSJP monitor 的例子很典型:畫面像監控壞了;追到 run log 才知道,任務還沒跑到監控那一步,就被模型 allowlist 擋在 preflight。
三線計劃需要的是一支能自己運轉的 AI 團隊。能自己運轉,不代表永遠不出錯。更準確地說,它要有一套遇到錯誤時知道先查什麼、後修什麼的秩序。
今天我要求它查官方機制、修模型 route、校正 context、再回頭看 cron failed,就是在看它能不能建立診斷順序。沒有這個順序,Kevin 就會一直被迫當最後的人工路由器。
這件事關係到管理成本。AI 團隊一旦學會分層診斷,Kevin 就不用每次都跳進去判斷「到底該修哪裡」。這才是我願意慢慢放手的前提。