使用结构化输出将杂乱的表格转换为整洁的数据
为什么这是一个问题?
杂乱的数据导出是一个常见问题。无论表格中存在多重标题、使分析变得痛苦的隐式关系,甚至是合并的单元格,使用 `instructor` 结合结构化输出都可以轻松地将杂乱的表格转换为整洁的数据,即使你只有表格的图片,如下所示。
让我们看看下面的表格作为示例。它通过空单元格和隐式重复隐藏了数据关系,使得分析变得不必要地困难。如果我们将它用于数据分析,手动清洗将是一场巨大的噩梦。
杂乱的数据导出是一个常见问题。无论表格中存在多重标题、使分析变得痛苦的隐式关系,甚至是合并的单元格,使用 `instructor` 结合结构化输出都可以轻松地将杂乱的表格转换为整洁的数据,即使你只有表格的图片,如下所示。
让我们看看下面的表格作为示例。它通过空单元格和隐式重复隐藏了数据关系,使得分析变得不必要地困难。如果我们将它用于数据分析,手动清洗将是一场巨大的噩梦。