卷積神經網路 (Convolutional Neural Network, CNN)
影像輸入設計:Flatten 方法的問題與反思
基本步驟
- 影像縮放 (Rescale):將圖片統一成固定大小(如 100 × 100),。
- 獨熱向量 (One-hot Vector):表示類別,維度長度決定可辨識的種類數量。
- 模型優化:通過 Softmax 後,追求預測值與正確標籤間的 Cross Entropy 最小化。

將圖片輸入到模型中
- 影像表示:彩色影像為三維張量 (Tensor),包含寬、高及 R G B 三個通道 (Channel)。
- 直覺思路:直接展平 (Flatten) 為向量輸入。
- 問題:參數量過大。如 100×100×3 輸入配 1000 個神經元,第一層即需 個權重,大幅增加 Overfitting 風險。
