跳至主要内容

今日的生成式 AI 厲害在哪裡？

從「專才工具」演進為「通才工具人」

過去的 AI (專才)：如舊版的 Google 翻譯，功能單一，僅能執行特定任務。
今日的 AI (通才)：如 ChatGPT、Gemini、Claude 等模型，本身沒有特定功能，但能根據使用者的指令執行多樣化任務。

where-generative-ai-excels

GPT-4 的全面能力

相比 GPT-3.5，GPT-4 具備更強大的功能，包括讀取檔案、辨識圖片、網路搜尋及畫圖。
執行程式：GPT-4 像工程師一樣，能自己寫程式並自動執行，直接提供結果給使用者。

gpt-4

使用心法與溝通藝術

轉換思維：不要問 ChatGPT 能做什麼（工具思維），而要問「你想要 ChatGPT 幫你做什麼」。
Prompt Engineering：這是一門人類與 AI 溝通的藝術，透過「巧妙設計」指令來引導模型輸出滿意的答案。

what-you-want-chatgpt-to-do

評估通才模型的挑戰

無標準答案：對於通才模型，同一要求可能有截然不同的解決方法，難以判定好壞（如「哈哈 100 次」的測試）。
犯錯與幻覺：模型有時會犯錯或產生幻覺，往往是因為它「努力嘗試協助」而非拒絕回答；如果模型一律回答「無法回答」，雖不犯錯但對人類無用。

how-to-evaluate-models

安全性與防禦機制

行為限制：模型內建防禦機制，避免說出髒話、歧視或抄襲內容。
繞過技術：使用者可能透過特定技巧（如要求模型扮演特定角色）來騙過模型，讓其輸出受限內容。
政治正確：模型有時會過度追求政治正確，導致輸出結果偏離現實需求。


防止說出有害的內容	透過技巧繞過限制

強化與自定義模型的兩大路徑

思路一：改變自己 (Prompt Engineering)：模型函數固定不動，透過更換問法、提供清楚指令或額外資訊來獲得更好的輸出。
思路二：訓練自己的模型：調整開源模型（如 LLaMA）的參數。這如同幫機器做「大腦手術」，技術門檻高且可能在修復舊問題時製造出新問題。


Prompt Engineering	訓練自己的模型

從「專才工具」演進為「通才工具人」
GPT-4 的全面能力
使用心法與溝通藝術
評估通才模型的挑戰
安全性與防禦機制
強化與自定義模型的兩大路徑