Prompt-Learning与提示工程

上下文学习（In-Context Learning）

概念

上下文学习（In-Context Learning，ICL）是大语言模型的一种涌现能力，模型不需要参数更新，只需要在输入中提供任务描述和几个示例，就能生成正确输出。

$\text{输入} = \text{任务描述} + \text{示例} + \text{测试问题} \rightarrow \text{模型直接输出答案}$

核心特点

零样本/少样本：不需要微调，只需要自然语言描述任务
参数不变：模型参数保持冻结，不进行梯度更新
依赖大模型：是大模型的涌现能力，小模型效果很差
基于预训练知识：模型利用预训练学到的知识完成任务，示例只是帮助理解任务格式

为什么ICL能工作？

几种解释：

隐式微调假说：ICL在模型注意力中隐式地学到了任务映射
分布匹配假说：预训练中见过类似的序列模式，只需要匹配模式就能生成正确答案
组合性假说：模型将示例中的输入输出组合能力泛化到新样本

Zero-shot / Few-shot Prompting

Zero-shot Prompting（零样本提示）

不给示例，直接用自然语言描述任务让模型回答
适合简单任务，大模型已经有很强的零样本能力

示例：

请将以下中文翻译成英文：
我爱人工智能。

Few-shot Prompting（少样本提示）

在prompt中给出几个输入输出示例，让模型学习任务模式
比零样本效果更好，适合复杂任务

示例：

这是一个情感分类任务：

输入：这部电影真好看，我非常喜欢。
输出：积极

输入：这个产品质量太差了，浪费钱。
输出：消极

输入：今天天气不错，适合出去游玩。
输出：

优缺点

方式	优点	缺点
Zero-shot	不需要示例，使用方便	复杂任务效果差
Few-shot	效果好，不需要训练	占用更多上下文长度，受最大序列长度限制

CoT Prompting（思维链提示）

概念

CoT（Chain-of-Thought）提示就是让模型一步步输出思考过程，再给出最终答案，能显著提升复杂推理任务（数学、逻辑）的效果。

标准prompt vs CoT prompt：

标准prompt：

Roger有5个网球，他又买了两罐，每罐有3个网球。现在Roger一共有多少个网球？

CoT prompt：

Roger有5个网球，他又买了两罐，每罐有3个网球。现在Roger一共有多少个网球？
让我们一步步思考，先计算新买来多少个，再算总数。

为什么CoT有效？

分解复杂问题，让模型逐步推理，而不是直接跳答案
给模型更多计算步骤，相当于增加了"思考时间"
便于检查错误，每一步都可以验证

CoT变体

Self-Consistency：生成多个不同的CoT路径，然后投票选出最常见的答案，效果更好。

Tree of Thoughts（ToT）：像树一样搜索多种思考路径，可以回退，比单链CoT更灵活。

Graph of Thoughts：进一步扩展为图结构，更灵活组织思考。

提示工程技巧

1. 清晰明确

用明确的自然语言描述任务要求
避免模糊不清的表述
指定输出格式（JSON、列表、段落等）

不好：

给我讲点关于AI的东西。

好：

请用300字介绍人工智能的三大发展阶段，要求分点说明。

2. 提供示例

Few-shot模式给出输入输出示例，让模型快速理解任务格式
示例覆盖边界情况，减少错误

3. 思维引导

对于推理任务，使用CoT提示让模型分步思考
"让我们一步步解决这个问题"

4. 角色设定

给模型设定角色，引导输出风格：

你现在是一个经验丰富的Python老师，用通俗易懂的语言给初学者讲解概念，避免太专业的术语。

5. 限制和约束

明确告诉模型什么不能做，输出范围是什么：

只能使用提供的上下文信息回答问题，如果上下文没有相关信息，请直接说"我不知道"，不要编造。

6. 结构化提示

使用分隔符区分不同部分，让模型更容易理解：

使用###分隔不同部分
使用XML标签<input>...</input>包裹输入

7. 迭代优化

效果不好时，分析错误原因，改进prompt
逐步增加要求，不要一次放太多要求

提示学习 vs 提示工程

维度	提示学习（Prompt Learning）	提示工程（Prompt Engineering）
定义	可学习prompt参数的微调方法	人工设计prompt的技巧
参数更新	学习连续prompt向量	不更新模型参数
目标	提高下游任务效果	更好地激发模型能力
典型方法	Prefix-tuning、P-tuning、Prompt Tuning	CoT、Few-shot、ICL

面试常见问题

Q: 什么是In-Context Learning，和微调有什么区别？

A：上下文学习是大模型的涌现能力，通过在prompt中给出任务描述和示例，模型不需要参数更新就能完成任务。微调需要更新模型参数，而上下文学习不需要任何参数更新，完全依赖模型预训练知识和prompt中的示例。

Q: 为什么思维链（CoT）能提高推理能力？

A：复杂推理问题需要多步计算，CoT让模型分步输出思考过程，相当于把复杂问题分解成多个子问题，模型每一步只需要解决一个子问题，降低了难度。同时，分步思考增加了计算量，让模型有更多"思考时间"，最终结果更准确。

Q: Few-shot提示的限制是什么？

A：主要限制是上下文长度，每个示例都占用token，示例越多，占用越长，受模型最大序列长度限制，不能放太多示例。另外，示例分布如果不好，效果也会受影响。

Q: 提示学习（Prompt Tuning）解决了什么问题？

A：传统人工设计prompt对结果非常敏感，一点变化就可能导致效果大幅波动，而且人工搜索优质prompt成本很高。提示学习通过反向传播学习连续prompt向量，自动找到最优prompt，不需要人工设计。同时只训练prompt参数，不更新整个模型，参数高效，避免灾难性遗忘。

Q: 你会给提示工程新手什么建议？

A：

从简单开始，逐步复杂，先清楚描述任务再逐步添加约束
多试几次，不同表述效果差别很大
复杂任务用few-shot给出示例比单纯文字描述效果好
推理任务一定要加CoT提示，让模型分步思考
明确输出格式要求，模型更容易生成符合要求的结果
善用角色设定，得到符合预期风格的输出

Prompt-Learning与提示工程

上下文学习（In-Context Learning）

概念

$\text{输入} = \text{任务描述} + \text{示例} + \text{测试问题} \rightarrow \text{模型直接输出答案}$

核心特点

零样本/少样本：不需要微调，只需要自然语言描述任务
参数不变：模型参数保持冻结，不进行梯度更新
依赖大模型：是大模型的涌现能力，小模型效果很差
基于预训练知识：模型利用预训练学到的知识完成任务，示例只是帮助理解任务格式

为什么ICL能工作？

几种解释：

隐式微调假说：ICL在模型注意力中隐式地学到了任务映射
分布匹配假说：预训练中见过类似的序列模式，只需要匹配模式就能生成正确答案
组合性假说：模型将示例中的输入输出组合能力泛化到新样本

Zero-shot / Few-shot Prompting

Zero-shot Prompting（零样本提示）

不给示例，直接用自然语言描述任务让模型回答
适合简单任务，大模型已经有很强的零样本能力

示例：

请将以下中文翻译成英文：
我爱人工智能。

Few-shot Prompting（少样本提示）

在prompt中给出几个输入输出示例，让模型学习任务模式
比零样本效果更好，适合复杂任务

示例：

这是一个情感分类任务：

输入：这部电影真好看，我非常喜欢。
输出：积极

输入：这个产品质量太差了，浪费钱。
输出：消极

输入：今天天气不错，适合出去游玩。
输出：

优缺点

方式	优点	缺点
Zero-shot	不需要示例，使用方便	复杂任务效果差
Few-shot	效果好，不需要训练	占用更多上下文长度，受最大序列长度限制

CoT Prompting（思维链提示）

概念

CoT（Chain-of-Thought）提示就是让模型一步步输出思考过程，再给出最终答案，能显著提升复杂推理任务（数学、逻辑）的效果。

标准prompt vs CoT prompt：

标准prompt：

Roger有5个网球，他又买了两罐，每罐有3个网球。现在Roger一共有多少个网球？

CoT prompt：

Roger有5个网球，他又买了两罐，每罐有3个网球。现在Roger一共有多少个网球？
让我们一步步思考，先计算新买来多少个，再算总数。

为什么CoT有效？

分解复杂问题，让模型逐步推理，而不是直接跳答案
给模型更多计算步骤，相当于增加了"思考时间"
便于检查错误，每一步都可以验证

CoT变体

Self-Consistency：生成多个不同的CoT路径，然后投票选出最常见的答案，效果更好。

Tree of Thoughts（ToT）：像树一样搜索多种思考路径，可以回退，比单链CoT更灵活。

Graph of Thoughts：进一步扩展为图结构，更灵活组织思考。

提示工程技巧

1. 清晰明确

用明确的自然语言描述任务要求
避免模糊不清的表述
指定输出格式（JSON、列表、段落等）

不好：

给我讲点关于AI的东西。

好：

请用300字介绍人工智能的三大发展阶段，要求分点说明。

2. 提供示例

Few-shot模式给出输入输出示例，让模型快速理解任务格式
示例覆盖边界情况，减少错误

3. 思维引导

对于推理任务，使用CoT提示让模型分步思考
"让我们一步步解决这个问题"

4. 角色设定

给模型设定角色，引导输出风格：

你现在是一个经验丰富的Python老师，用通俗易懂的语言给初学者讲解概念，避免太专业的术语。

5. 限制和约束

明确告诉模型什么不能做，输出范围是什么：

只能使用提供的上下文信息回答问题，如果上下文没有相关信息，请直接说"我不知道"，不要编造。

6. 结构化提示

使用分隔符区分不同部分，让模型更容易理解：

使用###分隔不同部分
使用XML标签<input>...</input>包裹输入

7. 迭代优化

效果不好时，分析错误原因，改进prompt
逐步增加要求，不要一次放太多要求

提示学习 vs 提示工程

维度	提示学习（Prompt Learning）	提示工程（Prompt Engineering）
定义	可学习prompt参数的微调方法	人工设计prompt的技巧
参数更新	学习连续prompt向量	不更新模型参数
目标	提高下游任务效果	更好地激发模型能力
典型方法	Prefix-tuning、P-tuning、Prompt Tuning	CoT、Few-shot、ICL

面试常见问题

Q: 什么是In-Context Learning，和微调有什么区别？

Q: 为什么思维链（CoT）能提高推理能力？

Q: Few-shot提示的限制是什么？

Q: 提示学习（Prompt Tuning）解决了什么问题？

Q: 你会给提示工程新手什么建议？

A：

从简单开始，逐步复杂，先清楚描述任务再逐步添加约束
多试几次，不同表述效果差别很大
复杂任务用few-shot给出示例比单纯文字描述效果好
推理任务一定要加CoT提示，让模型分步思考
明确输出格式要求，模型更容易生成符合要求的结果
善用角色设定，得到符合预期风格的输出

大模型面试

大模型面试

Prompt-Learning与提示工程

Prompt-Learning与提示工程

上下文学习（In-Context Learning）

概念

核心特点

为什么ICL能工作？

Zero-shot / Few-shot Prompting

Zero-shot Prompting（零样本提示）

Few-shot Prompting（少样本提示）

优缺点

CoT Prompting（思维链提示）

概念

为什么CoT有效？

CoT变体

提示工程技巧

1. 清晰明确

2. 提供示例

3. 思维引导

4. 角色设定

5. 限制和约束

6. 结构化提示

7. 迭代优化

提示学习 vs 提示工程

面试常见问题

Q: 什么是In-Context Learning，和微调有什么区别？

Q: 为什么思维链（CoT）能提高推理能力？

Q: Few-shot提示的限制是什么？

Q: 提示学习（Prompt Tuning）解决了什么问题？

Q: 你会给提示工程新手什么建议？

Prompt-Learning与提示工程

Prompt-Learning与提示工程

上下文学习（In-Context Learning）

概念

核心特点

为什么ICL能工作？

Zero-shot / Few-shot Prompting

Zero-shot Prompting（零样本提示）

Few-shot Prompting（少样本提示）

优缺点

CoT Prompting（思维链提示）

概念

为什么CoT有效？

CoT变体

提示工程技巧

1. 清晰明确

2. 提供示例

3. 思维引导

4. 角色设定

5. 限制和约束

6. 结构化提示

7. 迭代优化

提示学习 vs 提示工程

面试常见问题

Q: 什么是In-Context Learning，和微调有什么区别？

Q: 为什么思维链（CoT）能提高推理能力？

Q: Few-shot提示的限制是什么？

Q: 提示学习（Prompt Tuning）解决了什么问题？

Q: 你会给提示工程新手什么建议？