有哪些可以在网上做兼职的网站,关于网站建设的英文书籍,今天刚刚发生的新闻事故,设计培训班大概多少钱11 Prompt 工程进阶#xff1a;Few-shot 与 Chain-of-Thought
前10节总结 后10节展望
在前 10 节#xff0c;我们已经完成了 AI 产品经理的入门阶段#xff1a;
1–3#xff1a;理解了大模型的基本概念、Token、Prompt 基础#xff1b;4–5#xff1a;体验了本地部…11 Prompt 工程进阶Few-shot 与 Chain-of-Thought
前10节总结 后10节展望
在前 10 节我们已经完成了 AI 产品经理的入门阶段
1–3理解了大模型的基本概念、Token、Prompt 基础4–5体验了本地部署与 API 调用6–8掌握了 RAG 技术链路Embedding 向量数据库让模型学会查资料9学会了评估 AI 产品的效果10写出了第一份 AI 产品 PRD。
可以说这 10 节我们已经完成了从 “知道 AI 是什么” → “能跑起来一个 Demo” → “能写出产品文档” 的过程。
接下来的 第 11–20 节我们进入 进阶阶段
深入 Prompt 工程Few-shot、Chain-of-Thought、模板化构建完整的 RAG 系统并做优化检索、向量库、评估平台体验多轮对话、流式输出、Web Demo学习如何把技术和 具体行业场景教育、电商、金融 结合。今天第 11 节是第二阶段的开篇我们要学习的内容是 Prompt 工程进阶技巧。为什么要学习 Prompt 工程
在第一阶段的实验中你可能发现
有时候模型回答很棒但有时候答得完全跑偏问题稍微复杂一点答案就不靠谱同一个问题不同次回答可能差别很大。
这说明大模型的表现 高度依赖 Prompt提示词。
就像和人交流如果你说得含糊对方可能乱猜但如果你举例说明、逐步解释对方往往理解得更准确。Prompt 工程就是学习“如何和模型对话”让它表现得更稳定、更符合需求。
今天我们重点看两种方法
Few-shot少样本提示通过给模型一些“示范”让它模仿Chain-of-Thought思维链提示要求模型“逐步推理”而不是只给最终答案。一、核心概念零基础友好解释
1. Zero-shot vs Few-shot
Zero-shot零样本不给示例直接问问题。Few-shot少样本先给几个示例让模型模仿示例风格或推理方式。
2. Chain-of-Thought思维链
直译让模型“展示推理过程”。作用尤其适合逻辑推理、数学题、复杂业务流程可以显著提升准确率。二、实践对比实验
Python 示例
from openai import OpenAIclient OpenAI(base_urlhttp://127.0.0.1:11434/v1, api_keyollama)def ask(prompt):resp client.chat.completions.create(modeldeepseek-r1,messages[{role: user, content: prompt}],temperature0.2)return resp.choices[0].message.content# Zero-shot
q1 小明有12个苹果给了朋友3个然后又买了5个现在有多少个苹果
print(Zero-shot 回答)
print(ask(q1))# Few-shot
q2 示例
Q: 小红有10个橙子吃了2个还剩多少
A: 她还剩 8 个橙子。Q: 小王有7支笔送人2支还剩多少
A: 他还剩 5 支笔。现在请回答
Q: 小明有12个苹果给了朋友3个然后又买了5个现在有多少个苹果
A:
print(\nFew-shot 回答)
print(ask(q2))# Chain-of-Thought
q3 请逐步推理
小明有12个苹果给了朋友3个然后又买了5个现在有多少个苹果
print(\nChain-of-Thought 回答)
print(ask(q3))预期结果
在学术定义中三种方式本应区别如下
Zero-shot只给结果Few-shot模仿示例风格更统一CoT逐步推理展示步骤特别说明为什么 DeepSeek R1 三种方式都输出了推理过程
如果你用 DeepSeek R1 跑实验可能会发现
Zero-shot / Few-shot / CoT 的回答里都有 think 部分模型总是自动展示推理过程。
这是因为
DeepSeek R1 是“推理增强模型”被设计成默认生成思维链即使用户没有要求。这是它的特性不代表 Zero-shot / Few-shot / CoT 的概念无效。在代码里你可以通过正则去掉 think 部分得到更接近“标准差异”的对比结果。换句话说概念依然正确但模型行为会因实现不同而有所差异。三、产品经理思考
1. 为什么 PM 要懂 Few-shot 和 CoT
交互设计决定用户是“一问一答”还是用模版Few-shot。控制风格通过 Few-shot 可以固定回答口吻礼貌、专业、简洁。保证准确率涉及逻辑推理的任务必须要求模型展示思维链。
2. 模型行为差异要注意有些模型简洁GPT-3.5Zero-shot 只给答案。有些模型“话多”DeepSeek R1会自动展示推理过程。在 PRD 中要写清楚
是否要展示推理过程给用户是否只在后台保留便于调试是否需要清理 think 标签让用户只看到最终答案3. 案例
教育产品学生问数学题 → 用 CoT 提示强制展示步骤。客服机器人用 Few-shot 保证礼貌统一。企业助手可以保留 think 作为调试日志但前端只展示结果。四、小结
Few-shot通过示例提升模型模仿能力。Chain-of-Thought通过逐步推理提升逻辑准确性。DeepSeek R1 默认输出思维链这是它的特性不影响我们理解概念。PM 角度Prompt 工程是“产品体验的调节阀”不同模型行为差异本身也是产品设计的考量点。