跳到内容

数据分析

使用结构化输出将杂乱的表格转换为整洁的数据

为什么这是一个问题?

杂乱的数据导出是一个常见问题。无论表格中存在多重标题、使分析变得痛苦的隐式关系,甚至是合并的单元格,使用 `instructor` 结合结构化输出都可以轻松地将杂乱的表格转换为整洁的数据,即使你只有表格的图片,如下所示。

让我们看看下面的表格作为示例。它通过空单元格和隐式重复隐藏了数据关系,使得分析变得不必要地困难。如果我们将它用于数据分析,手动清洗将是一场巨大的噩梦。