跳到内容

Instructor 指南集

我们的指南集展示了如何使用 Instructor 通过结构化输出解决实际问题。每个示例都包含完整的代码和解释,以帮助您在自己的项目中实现类似的解决方案。

文本处理

分类示例

示例 描述 用例
单一分类 对单个类别进行基本分类 内容分类
多重分类 处理多个分类类别 多标签文档标记
基于 Enum 的分类 使用 Python 枚举进行结构化分类 标准化分类体系
批量分类 高效处理多个项目 大批量文本处理
使用 LangSmith 进行批量分类 使用 LangSmith 进行批量处理 性能监控
本地分类 无需外部 API 的分类 离线处理

信息提取

示例 描述 用例
实体解析 识别并消除实体的歧义 名称标准化
联系信息 提取结构化联系信息 CRM 数据录入
PII 数据脱敏 检测并脱敏敏感信息 隐私合规
引用提取 准确提取格式化引用 学术研究
行动项 从文本中提取任务 会议跟进
搜索查询处理 构建复杂的搜索查询 搜索增强

文档处理

示例 描述 用例
文档分割 将文档分割成有意义的部分 长篇内容分析
规划和任务 将复杂查询分解为子任务 项目管理
知识图谱生成 从文本中创建关系图 信息可视化
构建知识图谱 构建和查询知识图谱 语义数据建模
密度链 实现迭代式摘要 内容提炼

多模态示例

视觉处理

示例 描述 用例
表格提取 将图像表格转换为结构化数据 数据录入自动化
使用 GPT-4 提取表格 高级表格提取 复杂表格处理
收据信息 从收据图片中提取数据 费用管理
幻灯片内容提取 将幻灯片转换为结构化文本 演示文稿分析
图片到广告文案 从图片生成广告文本 营销自动化
YouTube 短视频分析 从视频片段中提取信息 内容审核

多模态处理

示例 描述 用例
Gemini 多模态 处理文本、图像和其他数据 混合媒体分析

数据工具

数据库集成

示例 描述 用例
SQLModel 集成 将 AI 生成的数据存储在 SQL 数据库中 持久化存储
Pandas DataFrame 在 Pandas 中处理结构化数据 数据分析

流式传输和处理

示例 描述 用例
部分响应流式传输 实时流式传输部分结果 交互式应用
自我批评和纠正 实现自我评估 质量提升

API 集成

示例 描述 用例
内容审核 实现内容过滤 信任与安全
使用批量 API 优化成本 降低 API 成本 生产效率
少样本学习 在提示词中使用上下文示例 性能调优

可观测性与追踪

示例 描述 用例
Langfuse 追踪 开源 LLM 工程 可观测性与调试

部署选项

模型提供商

示例 描述 用例
Groq 云 API 高性能推理 低延迟应用
Mistral/Mixtral 模型 开源模型集成 成本效益部署
IBM watsonx.ai 企业级 AI 平台 商业应用

本地部署

示例 描述 用例
Ollama 集成 本地开源模型 注重隐私的应用

保持更新

订阅我们的新闻通讯,获取关于新功能和使用技巧的更新

寻找更系统的学习?查看我们的教程系列获取分步指南。