YOLO Detection Head 的演進
YOLO 的 head 演進,並不是單純「換個輸出形式」,而是一條降低任務衝突、移除 heuristic、走向 end-to-end 推論的設計路線
後處理路線:從先驗到更乾淨的推論流程
Direct Prediction(YOLOv1)
- 設計特徵
- 以 grid cell 為單位直接預測 bbox 與類別機率
- 每個 cell 只負責其中心落在該區域內的物體
- 不依賴預先定義的尺寸或比例先驗
- 設計優點
- 輸出形式簡單,推論流程直接
- 計算量低,符合早期 real-time 偵測需求
- 核心限制
- 同一 cell 可預測的物體數量有限,密集場景容易漏檢
- 對尺度變化不敏感,小物體與極端比例物體回歸困難
- bbox 完全從零學習,訓練穩定性較差
問題
Direct prediction 的問題本質是缺乏形狀與尺度先驗,讓回歸難度過高。