MAR 31, 202611 分鐘閱讀gemini

Gemini 提示詞完整攻略:從四元素公式到進階策略,一篇搞懂 Google 官方的 Prompting 心法

大部分人用 Gemini 的方式,跟用 Google 搜尋沒兩樣。但 Google 官方其實有一套完整的 Prompt 設計方法論,從最基礎的「四元素公式」到進階的結構化策略,差別不是 10%,是整個輸出品質的維度不同。

prompt_gemini_101_small

這篇整合了 Google Workspace with Gemini 官方指南和 Gemini 官方 Prompt Engineering 文件的核心內容,濃縮成一份你可以隨時翻閱的實戰手冊。


核心框架:四元素公式

Google 官方在 Workspace 指南中提出的這套邏輯,同樣適用於 Gemini App。一個高品質的 Prompt 應該包含四個元素:

four_elements_formula

角色(Persona) — 你想讓 Gemini 扮演誰?

你是一位有十年經驗的日本旅遊達人

任務(Task) — 具體要做什麼?

幫我規劃一個五天四夜的東京行程

背景(Context) — 提供必要的細節或限制

兩個大人帶一個三歲小孩,預算中等,不想每天走太多路

格式(Format) — 輸出的樣子

用表格呈現,每天列出景點、交通方式和預估花費

四個元素不一定每次都要齊全,但元素越完整,Gemini 的輸出就越精準。把它想像工作時:你說「寫個電郵」跟說「用專業但友善的語氣,幫我寫一個電郵跟進上星期個的客戶會議訂單,提醒對方週五前回覆報價」,出來的東西完全不同。

vague_vs_precise_email

輸入類型:不只是「問問題」

Google 官方將 Prompt 的輸入分成四種類型,理解這個分類能幫你更精準地下指令:

問題型(Question):直接提問,讓 Gemini 回答

花店如果專賣乾燥花,取什麼名字好?列出 5 個選項。

任務型(Task):指定一個動作讓 Gemini 執行

列出露營必帶的 5 樣物品,用簡單清單呈現。

實體型(Entity):提供資料讓 Gemini 分類或處理

將以下物品分類為「大」或「小」:大象、老鼠、蝸牛

補全型(Completion):給出部分內容,讓 Gemini 接續完成

有效欄位:cheeseburger, hamburger, fries, drink。 訂單:給我一個起司漢堡和薯條 輸出:

補全型特別強大 — 你不用寫一堆指令解釋格式,直接用一個範例告訴 Gemini「照這個模式來」,它就會自動對齊。


進階技巧一:Few-shot 範例引導

Zero-shot 就是直接問,不給例子。Few-shot 則是在 Prompt 中附上幾個範例,讓 Gemini 從中學習模式。

Google 官方的建議是:永遠都附上 few-shot 範例。 有時候幾個好例子甚至比寫一堆指令更有效。

舉個例子:你想讓 Gemini 選出「比較簡潔」的那個解釋。如果直接問,它可能選比較詳細的。但如果你先給兩組「問題 → 解釋 → 答案」的範例,每次都選簡短版,Gemini 就會抓到模式,自動選簡短的。

注意事項:

  • 範例格式要一致(XML tag、空格、換行都算)
  • 不要塞太多,避免 overfitting
  • 範例要多元,不要都是同一種情境

實例:讓 Gemini 幫產品寫一句標語

Zero-shot(直接問):

幫這個產品寫一句廣告標語:一款專為遠端工作者設計的降噪耳機

Gemini 可能回你一句很長、很正式的句子,像是「為遠端工作者量身打造的極致降噪體驗,讓您專注不受干擾」。不是不對,但不是你要的風格。

Few-shot(附上範例):

幫產品寫一句廣告標語,風格參考以下範例:

產品:一款給登山客用的輕量水壺
標語:少一克負擔,多一步山路。

產品:一款幫自由工作者管帳的 App
標語:記帳不再是你的加班。

產品:一款專為遠端工作者設計的降噪耳機
標語:

這次 Gemini 會抓到模式 — 短句、對比、有記憶點 — 輸出可能變成「世界靜音,工作開麥」。同一個任務,差的不是一個形容詞,是整個輸出方向。


進階技巧二:加入 Context

很多人以為 Gemini 什麼都知道。它知道很多,但不知道你的情境。提供 context 是讓輸出從「通用」變「精準」的關鍵。

Google 官方的範例很直白:問「WiFi 斷了怎麼辦」,Gemini 給你一般性建議。但如果你把路由器的故障排除指南貼進去,再加上「根據以下文字回答」的指令,輸出就會完全對準你的實際狀況。

在 Workspace 場景中,這個優勢更明顯 — Gmail 裡的 Gemini 能直接讀到你的信件內容,Docs 裡的 Gemini 看得到整份文件。它已經有你的 context,你只需要告訴它「拿這些 context 做什麼」。
實例:讓 Gemini 回覆一封客戶投訴信

沒有 Context:

幫我回覆一封客戶投訴信,語氣要專業但有同理心。

Gemini 只能給你一封泛用模板:「感謝您的來信,我們非常重視您的意見⋯⋯」。正確,但毫無針對性。

附上 Context:

以下是一封客戶投訴信,請幫我寫一封回覆。
語氣要專業但有同理心,並提供具體的解決方案。
[客戶投訴信內容]
我在 3/15 下單了訂單編號 #TW-20250315,商品是藍色 M 號外套,
但 3/22 收到的是紅色 L 號。我已經等了一週,客服電話都打不通。
這是我第二次遇到出貨錯誤,非常失望。

這次 Gemini 的回覆會直接提到訂單編號、具體出錯的商品、針對「客服打不通」道歉,並提出換貨或退款方案。同樣一個「回覆投訴信」的任務,有沒有 Context 的差距不是 10%,是能不能直接拿去用的差別。


進階技巧三:拆解複雜任務

prompt_chaining_pipeline

碰到複雜需求,不要一個 Prompt 塞到底。Google 官方建議三種拆法:

拆指令:每個步驟獨立成一個 Prompt,根據情境選擇執行哪個。

串聯 Prompt:把任務拆成連續步驟,前一步的輸出當下一步的輸入。像工廠流水線,每個環節專注做一件事。

聚合回應:對不同部分的資料分別處理,最後彙整結果。例如先分析上半年數據,再分析下半年,最後合併成完整報告。

實例:幫公司寫一份季度業績報告

一個 Prompt 塞到底(常見做法):

幫我寫一份 Q1 業績報告,包含營收分析、跟去年同期比較、
各產品線表現、客戶滿意度變化、下季度展望,
用專業語氣,附上圖表建議,控制在 2000 字內。

Gemini 不是做不到,但塞太多需求在一個 Prompt,它只能每個部分都蜻蜓點水。營收分析可能只有兩句話,展望部分變成空泛的「我們將持續努力」。

拆法一:拆指令 — 根據情境選執行哪個

把不同用途的版本拆成獨立 Prompt,需要哪個就執行哪個:

Prompt A(給管理層):用這份數據寫一段 200 字的業績摘要,重點放在 YoY 成長率和利潤率變化
Prompt B(給全公司):用這份數據寫一封 All-hands 公告,語氣正面,強調團隊成果
Prompt C(給投資人):用這份數據寫一段 IR 簡報的開場白,強調市場定位和成長動能

同一份數據,不同受眾,不同 Prompt。不用每次都從頭寫一個萬用版。

拆法二:串聯 Prompt — 流水線接力

前一步的輸出直接餵給下一步:

Prompt 1:以下是 Q1 的原始銷售數據。請整理成一份結構化的數據摘要,
包含各產品線營收、MoM 變化、top 3 和 bottom 3 產品。
Prompt 2:根據以下數據摘要 [貼上 Prompt 1 的輸出],
寫出「營收分析」和「產品線表現」兩個段落,語氣專業。
Prompt 3:根據以下分析內容 [貼上 Prompt 2 的輸出],
寫一段 300 字的「下季度展望」,
基於數據趨勢提出 2-3 個具體建議。

每一步只做一件事,品質比一次塞到底高很多。

拆法三:聚合回應 — 分頭處理再合併
不同部分各自處理,最後彙整:

Prompt A:分析這份 Q1 營收數據,產出 300 字的營收分析段落
Prompt B:分析這份客戶滿意度調查結果,產出 300 字的客戶分析段落
Prompt C:分析這份市場競爭資料,產出 300 字的市場趨勢段落
最終 Prompt:以下是三段分析 [貼上 A+B+C 的輸出],
請整合成一份完整的 Q1 業績報告,
確保段落之間邏輯連貫,並補上一段總結。

適合資料來源不同、需要各自分析的情境。先拆開做到最好,再合在一起。


Gemini App 專屬功能技巧

除了文字 Prompt,Gemini App 有幾個獨特功能值得善用:

多模態輸入(Multimodal) — 直接上傳圖片讓 Gemini 分析,這是純文字做不到的事。幾個日常場景:

拍下餐廳菜單,搭配 Prompt:

這份菜單有哪些素食選項?幫我推薦兩道適合不吃辣的人的菜

拍下家電的錯誤代碼畫面:

這台洗衣機顯示的錯誤碼是什麼意思?我應該怎麼處理?

截圖一封看不太懂的英文信件:

這封 email 在說什麼?對方的語氣是友善還是在抱怨?

圖片生成方面,官方建議用「描述性敘述」而非關鍵字堆砌。與其寫「貓、太空、賽博龐克」,不如寫「一隻戴著太空頭盔的橘貓漂浮在霓虹紫的星際空間中」。

Gemini Live(語音模式) — 語音互動不需要像文字那樣嚴謹結構化,反而更適合對話式引導:

我現在有個想法,你幫我腦力激盪一下,我說一句你反駁一句

這種「即興對打」的用法,在 brainstorming 階段特別有效。


Prompt 迭代:寫不好很正常

Google 官方直接告訴你:Prompt engineering 是迭代的過程。第一版寫不好是常態。

prompt_iteration_cycle

三個迭代方向:

換說法 — 同一個意思,不同的措辭會得到不同結果。「怎麼做派?」和「給我一份派的食譜」和「推薦一個好的派食譜」,三句話意思一樣但結果可能差很多。

換任務類型 — 如果 Gemini 不聽你的分類指令,試試改成選擇題格式。從開放式改成封閉式,模型的回應會更受控。

換內容順序 — 把範例、context、指令的排列順序調一調。有時候把指令放最後反而比放最前面效果好。


Gemini 3 的結構化 Prompt

Gemini 3 對結構化指令的理解更好。Google 官方推薦用 XML 標籤或 Markdown 標題來組織 Prompt:

XML 風格:

plaintext
<role>
你是一位有幫助的助手。
</role>

<constraints>
1. 保持客觀
2. 引用來源
</constraints>

<context>
[在這裡放入背景資料]
</context>

<task>
[在這裡放入具體需求]
</task>

Markdown 風格:

plaintext
# 身份
你是一位資深解決方案架構師。

# 限制
- 不使用外部套件
- 僅限 Python 3.11+ 語法

# 輸出格式
回傳一個程式碼區塊。

結構化的好處是讓模型清楚區分「哪些是指令」「哪些是資料」「哪些是任務」,不會搞混。


隨身小抄:CLEAR 原則

最後附上一套 Google 內部推薦的記憶口訣,方便你隨時對照:

clear_principles_cheatsheet

C — Concise(簡潔有力) 不要寫廢話。每一句都應該有存在的理由。

L — Logical(邏輯清晰) 指令的順序要合理,不要跳來跳去。

E — Explicit(指令明確) 不要讓 Gemini 猜。你想要表格就說表格,想要三點就說三點。

A — Adaptive(持續調整) 看到輸出不滿意?改 Prompt 再來一次。Prompt Engineering 的核心就是迭代。

R — Relevant(提供相關背景) Context 越具體,輸出越精準。


總結

寫好 Prompt 不需要什麼天賦,需要的是方法論和持續迭代。記住四元素公式(角色、任務、背景、格式)作為起點,善用 few-shot 範例引導輸出,碰到複雜任務就拆解,然後不斷根據結果調整。

最重要的一點:Prompt 寫得好不好,差的不是一個形容詞,是整個思考框架。希望這篇能成為你隨時翻閱的參考手冊。


本文整合自 Google 官方 Prompt Design Strategies 文件及 Google Workspace with Gemini 提示詞指南。