Introduction
A Novel Table Tennis Stroke Recognition Method Using The Bimodal Deep Neural Networks with Skeletal-Temporal Transformer and Racket Geometric Features
本研究提出一種結合 SkateFormer 骨架時序轉換器 與 SlowFast ResNet 影像模型 的雙模態深度神經網路,並額外引入 球拍幾何特徵(面積與中心座標),以提升桌球擊球動作的辨識準確度。 方法能同時捕捉骨架的時序結構、影像的紋理場景,以及球拍在動作邊界判斷中的關鍵作用。 實驗結果顯示,在自建桌球擊球資料集上,本方法的 F1-score 達 96.2%; 在 JHMDB 公開資料集上亦取得 83.8% 的 F1-score,相較 HIT Network 提升 1.7%,展現穩定泛化能力。 結果驗證了多模態融合的互補性,以及幾何特徵在動作辨識任務中的價值,顯示其於智慧體育分析的應用潛力。
Table Tennis Referee System Using Multimodal Deep Learning
本研究提出一套桌球自動裁判系統,透過多模態深度學習結合 RGB 影像與骨架姿態資訊進行擊球事件偵測與裁判判斷。 系統首先利用 YOLOv7 進行球、選手與球桌的偵測,並結合姿態估測以捕捉人體關節動作;接著,藉由雙模態動作辨識模型與球軌跡特徵,辨識發球與來回擊球過程,準確標定每一分的開始與結束時間。 為捕捉複雜的人-物互動,模型引入 跨注意力機制,建構選手-物件及手部-球之關聯,並結合時序與模態融合模組提升分類精度。 實驗結果顯示,本方法能有效提升比賽影片分析之準確性與實用性,展現智慧裁判於桌球競技場域中的應用潛力。
Table Tennis Trajectory Landing Point and Speed Analysis System
本研究提出一套桌球軌跡落點與球速分析系統,利用 YOLOv7 偵測並追蹤高速運動的球體,透過中心點連接重建完整飛行軌跡。 系統結合拋物線運動擬合與誤差閾值判斷,自動辨識球的落點,並藉由透視轉換將落點映射至標準桌面,實現有效與無效彈跳的判定。 進一步,本研究統計落點分佈並生成熱圖,以分析戰術特徵,並根據彈跳點距離與影格時間計算球速,提供速度趨勢與分布視覺化。 該系統不僅在 2024 SPORTS DATA IDEAthon 榮獲全國優等獎,更成功應用於 全大運即時轉播,展現其於智慧體育比賽分析中的實務價值與推廣潛力。
AI Powered Table Tennis Scoring System with Ball Launcher
本研究提出一套 AI 自動計分系統,結合 YOLOv7 物件偵測與 軌跡管理機制,針對高速桌球進行即時追蹤、落點定位與擊球分類。 系統透過 多特徵加權軌跡關聯策略(IoU、運動方向、距離、長寬比),在多球與高速環境下仍能保持穩定追蹤。 當偵測到球軌跡偏離拋物線時,系統自動判斷為落點事件,並藉由 透視轉換將落點精準映射至桌面,最終將擊球結果分類為 有效擊球、錯 誤落點、出界或漏擊。 實驗於智慧桌球教室進行驗證,結果顯示本方法在 58.1 FPS 的速度下可即時完成追蹤與分類,並支援比賽式計分模擬。 此系統榮獲 ITAOI 2025 最佳論文獎,展現其於智慧訓練與自動裁判應用中的高效能與實用價值。
Enhancing UNet3+ Robustness with Weight Perturbation
本研究提出一種基於 權重擾動(weight perturbation) 的訓練策略,以提升 UNet3+ 在語意分割任務中的穩健性。 方法透過三階段流程(權重複製、噪聲注入、權重回復),於訓練過程中對模型權重注入受控的高斯雜訊,模擬硬體層級或低精度運算下的干擾。 實驗結果顯示,經擾動訓練的 UNet3+ 模型在推論過程中仍能維持高準確度,證明其對噪聲條件具有更強的適應力。 此研究不僅驗證了權重擾動策略對深度分割模型的強化效果,也為後續在 姿態估測、多模態學習與 大型語言模型(LLMs) 的延伸應用提供潛在方向。
Exploiting Minimal Distance for Automatic Weighted Color Transfer
本研究提出一種基於 最小距離原則 的 自動加權色彩轉移方法,透過 動態權重調整機制 自動分配 RGB 通道的重要性,以提升轉換結果的真實感與一致性。 方法結合 四種距離度量(Correlation、Chi-Square、Intersection、Bhattacharyya)與 四種色差評估標準(CIE76、CIE94、CIEDE2000、CMC84),在轉換過程中同時兼顧細節保留與目標色彩特徵。 實驗結果顯示,本方法在多資料集與場景下均能有效改善傳統色彩轉移中常見的失真與不自然問題,提升圖像的 視覺品質與色彩一致性。 未來研究將著重於演算法優化與智慧權重策略,並探索其於 風格遷移、增強現實 等影像處理領域的應用潛力。
Image Encryption and Data Embedding Using Transformation Techniques
本研究提出一套結合 影像加密 與 資料隱藏 的整合方法,利用 GWMRDH 演算法 將秘密訊息嵌入灰階影像後,透過 通道前向置換 與 矩形轉換 (RT) 加密 強化影像安全性。 在解密階段,系統則依序進行 逆 RT 解密、通道逆置換 與 訊息提取,完整還原原始訊息與影像。 實驗顯示,該方法能有效兼顧 高資訊隱匿容量 與 影像品質(PSNR 達 87.7),展現出良好的抗攻擊性與可逆性。 研究不僅驗證了整合式嵌密與加密技術的可行性,也為未來在 彩色影像、異構尺寸影像 以及更廣泛的 資訊安全應用 奠定基礎。