什么是 思维链( Chain-of-Thought)?
它是一种提升 提示词 (Prompt) 性能的非常有效的技巧。通过思维链,从而鼓励大模型模仿人类思维的推理步骤来处理复杂的任务,从而可以提到更准确的答案,尤其是一些复杂的数学逻辑问题。
简而言之,它是描述模型如何通过一系列的步骤来生成回答的一种技巧。
关于思维链的运用,有以下几种方法:
1、零样本 CoT(Zero-shot CoT)
2、少样本 CoT (Few-shot CoT)
3、自洽性 CoT (CoT-SC)
4、分步骤执行
我们逐个来看下。
零样本 CoT (Zero-shot CoT)
关于零样本CoT,最有效的提示词技巧就是,通过在提示词末尾加上类似 让我们逐步思考 (Let’s think step by step), 通过这种方式可以鼓励大模型逐步思考,更准确的处理复杂问题。
比如:关于汉堡和炸鸡哪个热量更高的问题。
不使用零样本 CoT:
使用零样本 CoT 后,答案更加全面。
少样本 CoT (Few-shot CoT)
少样本 CoT , 主要是通过提供较少的几个例子,大模型基于提供的案例进行总结出规则,并按照规则来提供答案。
我们可以使用这种技巧来写文章、文案,写好评。当然也可以来解题:
可以看到,我们提供少量样例,大模型总结规则后也给出了正确答案。
自洽性 CoT (CoT-SC)
总结
当我们想要针对简单的提示词得到更加全面的答案时,可以考虑零样本 CoT。如果不想用文字总结规则,可以提供少量例子,让大模型自己总结并进行模仿,这就是 少样本 CoT。
当我们想要从不同维度思考后的答案中找到最优解时,自洽性 CoT 是个不错的选择。然后,面临解决复杂任务时,拆解成更详细的步骤,可以得到更优质的答案。