订阅我们的新闻通讯，获取更新和技巧¶

AI 工程师主题演讲：Pydantic 是你所需的一切

如果你的验证逻辑可以像人类一样学习和适应，但又能以软件的速度运行呢？这就是验证的未来，而且它已经到来。

验证是可靠软件的支柱。但传统方法是静态的、基于规则的，并且无法适应新的挑战。本文探讨了如何使用 Pydantic 和 Instructor 等 Python 库，将动态的、机器学习驱动的验证引入到你的软件堆栈中。我们使用符合如下所示结构的验证函数来验证这些输出。

def validation_function(value):
    if condition(value):
        raise ValueError("Value is not valid")
    return mutation(value)

准备好深入探索使用 Python 函数微调特定任务语言模型的世界。我们将探讨 instructor.instructions 如何简化此过程，使你想要蒸馏的任务更高效、更强大，同时保留其原有功能和向后兼容性。

如果你想查看完整示例，请访问 examples/distillation

随着大型语言模型 (LLM) 的出现，检索增强生成 (RAG) 成为了热门话题。然而，在过去一年中帮助初创公司将 LLM 集成到其堆栈的过程中，我注意到获取用户查询、对其进行嵌入，然后直接搜索向量存储的模式实际上只是演示软件。

什么是 RAG？

检索增强生成 (RAG) 是一种使用 LLM 生成响应的技术，但它使用搜索后端来增强生成。在过去一年中，使用文本嵌入与向量数据库相结合的方式是我见过的最流行的社交化方法。

所以，让我们从检查我所谓的“傻瓜式”RAG 模型开始——这是一个比你想象的更基础的设置。

语言模型取得了显著发展。有效使用它们通常需要复杂的框架。本文讨论了 Instructor 如何使用 Pydantic 简化此过程。