今日的生成式 AI 厲害在哪裡?
從「專才工具」演進為「通才工具人」
- 過去的 AI (專才):如舊版的 Google 翻譯,功能單一,僅能執行特定任務。
- 今日的 AI (通才):如 ChatGPT、Gemini、Claude 等模型,本身沒有特定功能,但能根據使用者的指令執行多樣化任務。

GPT-4 的全面能力
- 相比 GPT-3.5,GPT-4 具備更強大的功能,包括讀取檔案、辨識圖片、網路搜尋及畫圖。
- 執行程式:GPT-4 像工程師一樣,能自己寫程式並自動執行,直接提供結果給使用者。

使用心法與溝通藝術
- 轉換思維:不要問 ChatGPT 能做什麼(工具思維),而要問「你想要 ChatGPT 幫你做什麼」。
- Prompt Engineering:這是一門人類與 AI 溝通的藝術,透過「巧妙設計」指令來引導模型輸出滿意的答案。

評估通才模型的挑戰
- 無標準答案:對於通才模型,同一要求可能有截然不同的解決方法,難以判定好壞(如「哈哈 100 次」的測試)。
- 犯錯與幻覺:模型有時會犯錯或產生幻覺,往往是因為它「努力嘗試協助」而非拒絕回答;如果模型一律回答「無法回答」,雖不犯錯但對人類無用。

安全性與防禦機制
- 行為限制:模型內建防禦機制,避免說出髒話、歧視或抄襲內容。
- 繞過技術:使用者可能透過特定技巧(如要求模型扮演特定角色)來騙過模型,讓其輸出受限內容。
- 政治正確:模型有時會過度追求政治正確,導致輸出結果偏離現實需求。
![]() | ![]() |
|---|---|
| 防止說出有害的內容 | 透過技巧繞過限制 |
強化與自定義模型的兩大路徑
- 思路一:改變自己 (Prompt Engineering):模型函數固定不動,透過更換問法、提供清楚指令或額外資訊來獲得更好的輸出。
- 思路二:訓練自己 的模型:調整開源模型(如 LLaMA)的參數。這如同幫機器做「大腦手術」,技術門檻高且可能在修復舊問題時製造出新問題。
![]() | ![]() |
|---|---|
| Prompt Engineering | 訓練自己的模型 |



