使用微调 GPT-3.5 和密度链方法创建更智能的摘要
了解如何使用 Instructor 将迭代方法(如密度链 Chain Of Density)蒸馏到一个单一的微调模型中
在本文中,我们将指导你使用 Instructor 实现原始的密度链方法,然后展示如何蒸馏 GPT 3.5 模型,使其能够匹配 GPT-4 的迭代摘要能力。使用这些方法,我们将延迟降低了 20 倍,成本降低了 50 倍,并保持了实体密度。
到最后,你将得到一个 GPT 3.5 模型(使用 Instructor 强大的工具进行了微调),其生成的摘要效果可与密度链方法媲美 [Adams et al. (2023)]。一如既往,所有代码都可以在我们仓库的 examples/chain-of-density
文件夹中找到,供你参考。