Zero-Shot Prompts

在基础篇里的推理场景,我提到了 Zero-Shot Prompting 的技术,本章会详细介绍它是什么,以及使用它的技巧。

介绍

Zero-Shot Prompting 是一种自然语言处理技术,可以让计算机模型根据提示或指令进行任务处理。各位常用的 ChatGPT 就用到这个技术。

传统的自然语言处理技术通常需要在大量标注数据上进行有监督的训练,以便模型可以对特定任务或领域进行准确的预测或生成输出。相比之下,Zero-Shot Prompting 的方法更为灵活和通用,因为它不需要针对每个新任务或领域都进行专门的训练。相反,它通过使用预先训练的语言模型和一些示例或提示,来帮助模型进行推理和生成输出。

举个例子,我们可以给 ChatGPT 一个简短的 prompt,比如 描述某部电影的故事情节,它就可以生成一个关于该情节的摘要,而不需要进行电影相关的专门训练。

缺点

但这个技术并不是没有缺点的:

  1. Zero-Shot Prompting 技术依赖于预训练的语言模型,这些模型可能会受到训练数据集的限制和偏见。比如在使用 ChatGPT 的时候,它常常会在一些投资领域,使用男性的「他」,而不是女性的「她」。那是因为训练 ChatGPT 的数据里,提到金融投资领域的内容,多为男性。
  2. 尽管 Zero-Shot Prompting 技术不需要为每个任务训练单独的模型,但为了获得最佳性能,它需要大量的样本数据进行微调。像 ChatGPT 就是一个例子,它的样本数量是过千亿。
  3. 由于 Zero-Shot Prompting 技术的灵活性和通用性,它的输出有时可能不够准确,或不符合预期。这可能需要对模型进行进一步的微调或添加更多的提示文本来纠正。

技巧 7:Zero-Shot Chain of Thought

基于上述的第三点缺点,研究人员就找到了一个叫 Chain of Thought 的技巧。

这个技巧使用起来非常简单,只需要在问题的结尾里放一句 Let‘s think step by step (让我们一步步地思考),模型输出的答案会更加准确。

这个技巧来自于 Kojima 等人 2022 年的论文 Large Language Models are Zero-Shot Reasoners。在论文里提到,当我们向模型提一个逻辑推理问题时,模型返回了一个错误的答案,但如果我们在问题最后加入 Let‘s think step by step 这句话之后,模型就生成了正确的答案:

ZeroShotChainOfThought001.png

论文里有讲到原因,感兴趣的朋友可以去看看,我简单解释下为什么(🆘 如果你有更好的解释,不妨反馈给我):

  1. 首先各位要清楚像 ChatGPT 这类产品,它是一个统计语言模型,本质上是基于过去看到过的所有数据,用统计学意义上的预测结果进行下一步的输出(这也就是为什么你在使用 ChatGPT 的时候,它的答案是一个字一个字地吐出来,而不是直接给你的原因,因为答案是一个字一个字算出来的)。
  2. 当它拿到的数据里有逻辑,它就会通过统计学的方法将这些逻辑找出来,并将这些逻辑呈现给你,让你感觉到它的回答很有逻辑。
  3. 在计算的过程中,模型会进行很多假设运算(不过暂时不知道它是怎么算的)。比如解决某个问题是从 A 到 B 再到 C,中间有很多假设。
  4. 它第一次算出来的答案错误的原因,只是因为它在中间跳过了一些步骤(B)。而让模型一步步地思考,则有助于其按照完整的逻辑链(A > B > C)去运算,而不会跳过某些假设,最后算出正确的答案。

按照论文里的解释,零样本思维链涉及两个补全结果,左侧气泡表示基于提示输出的第一次的结果,右侧气泡表示其收到了第一次结果后,将最开始的提示一起拿去运算,最后得出了正确的答案:

ZeroShotChainOfThought002.png

这个技巧,除了用于解决复杂问题外,还适合生成一些连贯主题的内容,比如写长篇文章、电影剧本等。

但需要注意其缺点,连贯不代表,它就一定不会算错,如果其中某一步骤算错了,错误会因为逻辑链,逐步将错误积累,导致生成的文本可能出现与预期不符的内容。

另外,根据 Wei 等人在 2022 年的论文表明,它仅在大于等于 100B 参数的模型中使用才会有效。如果你使用的是小样本模型,这个方法不会生效。


2023-04-12 更新(感谢qq-740943515分享): 根据 Yongchao Zhou 等人的最新论文,更好的 prompt 是:

  1. Let's work this out in a step by step way to be sure we have the right answer.

在吴恩达的 ChatGPT Prompt Engineering 课程中,有提到一个这个技巧的另一种用法,不仅仅只是让 AI 按步骤行事,还会告知 AI 每一步要做什么。比如这个案例(注意这个是 python 代码):

  1. prompt_2 = f"""
  2. Your task is to perform the following actions:
  3. 1 - Summarize the following text delimited by
  4. <> with 1 sentence.
  5. 2 - Translate the summary into French.
  6. 3 - List each name in the French summary.
  7. 4 - Output a json object that contains the
  8. following keys: french_summary, num_names.
  9. Use the following format:
  10. Text: <text to summarize>
  11. Summary: <summary>
  12. Translation: <summary translation>
  13. Names: <list of names in Italian summary>
  14. Output JSON: <json with summary and num_names>
  15. Text: <{text}>
  16. """

简单解释下这个代码:

  1. 开头是让 AI 按照 1 ~ 4 步运行
  2. 然后再让 AI 根据特定格式输出内容

最后 AI 的输出是这样的:

  1. Summary: Jack and Jill go on a quest to fetch water, but misfortune strikes and they tumble down the hill, returning home slightly battered but with their adventurous spirits undimmed.
  2. Translation: Jack et Jill partent en quête d'eau, mais la malchance frappe et ils dégringolent la colline, rentrant chez eux légèrement meurtris mais avec leurs esprits aventureux intacts.
  3. Names: Jack, Jill
  4. Output JSON: {"french_summary": "Jack et Jill partent en quête d'eau, mais la malchance frappe et ils dégringolent la colline, rentrant chez eux légèrement meurtris mais avec leurs esprits aventureux intacts.", "num_names": 2}

上述的案例只是将任务拆解,能让 AI 生成的结果更加符合要求,这个方法同样能提升 AI 的回答准确性,比如这个案例:

  1. Determine if the student's solution is correct or not.
  2. Question:
  3. I'm building a solar power installation and I need help working out the financials.
  4. Land costs $100 / square foot
  5. I can buy solar panels for $250 / square foot
  6. I negotiated a contract for maintenance that will cost \
  7. me a flat $100k per year, and an additional $10 / square foot
  8. What is the total cost for the first year of operations
  9. as a function of the number of square feet.
  10. Student's Solution:
  11. Let x be the size of the installation in square feet.
  12. Costs:
  13. Land cost: 100x
  14. Solar panel cost: 250x
  15. Maintenance cost: 100,000 + 100x
  16. Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000

AI 的回答是「The student’s solution is correct」。但其实学生的答案是错误的,应该 360x + 100,000,我们将 prompt 调整成这样:

  1. prompt = f"""
  2. Your task is to determine if the student's solution \
  3. is correct or not.
  4. To solve the problem do the following:
  5. - First, work out your own solution to the problem.
  6. - Then compare your solution to the student's solution \
  7. and evaluate if the student's solution is correct or not.
  8. Don't decide if the student's solution is correct until
  9. you have done the problem yourself.
  10. Use the following format:
  11. Question:
  12. ###
  13. question here
  14. ###
  15. Student's solution:
  16. ###
  17. student's solution here
  18. ###
  19. Actual solution:
  20. ###
  21. steps to work out the solution and your solution here
  22. ###
  23. Is the student's solution the same as actual solution \
  24. just calculated:
  25. ###
  26. yes or no
  27. ###
  28. Student grade:
  29. ###
  30. correct or incorrect
  31. ###
  32. Question:
  33. ###
  34. I'm building a solar power installation and I need help \
  35. working out the financials.
  36. - Land costs $100 / square foot
  37. - I can buy solar panels for $250 / square foot
  38. - I negotiated a contract for maintenance that will cost \
  39. me a flat $100k per year, and an additional $10 / square \
  40. foot
  41. What is the total cost for the first year of operations \
  42. as a function of the number of square feet.
  43. ###
  44. Student's solution:
  45. ###
  46. Let x be the size of the installation in square feet.
  47. Costs:
  48. 1. Land cost: 100x
  49. 2. Solar panel cost: 250x
  50. 3. Maintenance cost: 100,000 + 100x
  51. Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000
  52. ###
  53. Actual solution:
  54. """

本质上,也是将任务分拆成多步,这次 AI 输出的结果是这样的(结果就是正确的了):

  1. Let x be the size of the installation in square feet.
  2. Costs:
  3. 1. Land cost: 100x
  4. 2. Solar panel cost: 250x
  5. 3. Maintenance cost: 100,000 + 10x
  6. Total cost: 100x + 250x + 100,000 + 10x = 360x + 100,000
  7. Is the student's solution the same as actual solution just calculated:
  8. No
  9. Student grade:
  10. Incorrect

下一章我们会结合 Few-Shot Chain of Thought 来详细讲讲逻辑链的限制。