Instructor 指南集¶
我们的指南集展示了如何使用 Instructor 通过结构化输出解决实际问题。每个示例都包含完整的代码和解释,以帮助您在自己的项目中实现类似的解决方案。
文本处理¶
分类示例¶
| 示例 | 描述 | 用例 |
|---|---|---|
| 单一分类 | 对单个类别进行基本分类 | 内容分类 |
| 多重分类 | 处理多个分类类别 | 多标签文档标记 |
| 基于 Enum 的分类 | 使用 Python 枚举进行结构化分类 | 标准化分类体系 |
| 批量分类 | 高效处理多个项目 | 大批量文本处理 |
| 使用 LangSmith 进行批量分类 | 使用 LangSmith 进行批量处理 | 性能监控 |
| 本地分类 | 无需外部 API 的分类 | 离线处理 |
信息提取¶
| 示例 | 描述 | 用例 |
|---|---|---|
| 实体解析 | 识别并消除实体的歧义 | 名称标准化 |
| 联系信息 | 提取结构化联系信息 | CRM 数据录入 |
| PII 数据脱敏 | 检测并脱敏敏感信息 | 隐私合规 |
| 引用提取 | 准确提取格式化引用 | 学术研究 |
| 行动项 | 从文本中提取任务 | 会议跟进 |
| 搜索查询处理 | 构建复杂的搜索查询 | 搜索增强 |
文档处理¶
| 示例 | 描述 | 用例 |
|---|---|---|
| 文档分割 | 将文档分割成有意义的部分 | 长篇内容分析 |
| 规划和任务 | 将复杂查询分解为子任务 | 项目管理 |
| 知识图谱生成 | 从文本中创建关系图 | 信息可视化 |
| 构建知识图谱 | 构建和查询知识图谱 | 语义数据建模 |
| 密度链 | 实现迭代式摘要 | 内容提炼 |
多模态示例¶
视觉处理¶
| 示例 | 描述 | 用例 |
|---|---|---|
| 表格提取 | 将图像表格转换为结构化数据 | 数据录入自动化 |
| 使用 GPT-4 提取表格 | 高级表格提取 | 复杂表格处理 |
| 收据信息 | 从收据图片中提取数据 | 费用管理 |
| 幻灯片内容提取 | 将幻灯片转换为结构化文本 | 演示文稿分析 |
| 图片到广告文案 | 从图片生成广告文本 | 营销自动化 |
| YouTube 短视频分析 | 从视频片段中提取信息 | 内容审核 |
多模态处理¶
| 示例 | 描述 | 用例 |
|---|---|---|
| Gemini 多模态 | 处理文本、图像和其他数据 | 混合媒体分析 |
数据工具¶
数据库集成¶
| 示例 | 描述 | 用例 |
|---|---|---|
| SQLModel 集成 | 将 AI 生成的数据存储在 SQL 数据库中 | 持久化存储 |
| Pandas DataFrame | 在 Pandas 中处理结构化数据 | 数据分析 |
流式传输和处理¶
| 示例 | 描述 | 用例 |
|---|---|---|
| 部分响应流式传输 | 实时流式传输部分结果 | 交互式应用 |
| 自我批评和纠正 | 实现自我评估 | 质量提升 |
API 集成¶
| 示例 | 描述 | 用例 |
|---|---|---|
| 内容审核 | 实现内容过滤 | 信任与安全 |
| 使用批量 API 优化成本 | 降低 API 成本 | 生产效率 |
| 少样本学习 | 在提示词中使用上下文示例 | 性能调优 |
可观测性与追踪¶
| 示例 | 描述 | 用例 |
|---|---|---|
| Langfuse 追踪 | 开源 LLM 工程 | 可观测性与调试 |
部署选项¶
模型提供商¶
| 示例 | 描述 | 用例 |
|---|---|---|
| Groq 云 API | 高性能推理 | 低延迟应用 |
| Mistral/Mixtral 模型 | 开源模型集成 | 成本效益部署 |
| IBM watsonx.ai | 企业级 AI 平台 | 商业应用 |
本地部署¶
| 示例 | 描述 | 用例 |
|---|---|---|
| Ollama 集成 | 本地开源模型 | 注重隐私的应用 |
保持更新¶
订阅我们的新闻通讯,获取关于新功能和使用技巧的更新
寻找更系统的学习?查看我们的教程系列获取分步指南。