Python: Data Manipulation: Tabular Data Manipulation

onlyice 7th March 2019 at 9:01am

对于以行为基础的数据(比如 list,CSV,SQL,Excel),有几个库可以处理。

Pandas

Pandas 应该是数据分析领域最专业、最强大的库之一。还没有深入了解,先不说太多。

Tablib

Tablib(GitHub | 文档)是一个可以处理多种格式数据的方便的库。它可以将数据从 CSV, JSON, YAML, XLSX 等格式随意转换,接口简单易懂,使用方便。

缺点是不够专业。看过它的内部实现,每一行的数据是以类似 tuple 的形式存在,但是对于缺失值没有处理(Pandas 这方面做得好),这要求你的数据必需是规范的。