JSON (JavaScript Object Notation):
一种轻量级的数据交换格式,易于人阅读和编写,也易于机器解析和生成。
常用于存储图像数据集的元数据、标注信息等。
XML (eXtensible Markup Language):
一种标记语言,允许用户自定义标签,用于描述数据的结构和内容。
在一些早期的数据集中,如PASCAL VOC,XML被用来存储图像的标注信息。
CSV (Comma-Separated Values):
一种简单的文件格式,用于存储表格数据,其中每个字段通常由逗号分隔。
常用于存储图像的基本信息,如文件路径、类别标签等。
YAML (YAML Ain't Markup Language):
一种用于配置文件的语言,支持复杂的数据结构,易于阅读和编写。
有时用于存储数据集的配置信息。
Pickle:
Python特有的数据序列化格式,可以将Python对象序列化存储到文件中。
常用于存储大型数据集或模型参数。
HDF5 (Hierarchical Data Format version 5):
一种用于存储和组织大量数据的文件格式。
在