总结

Overview

这个文档中包含了 datasets 的相关方法。

datasets可以读取一些单字数据集,比如 MeterData 这种由 xml, json, *.png 组成的数据集。

数据集文件结构

一般一个 MeterData 的数据集组成形式如下,我们以 M10L1XL 为例:

M10L1XL
├── 2018-11-23-12-16-01.jpg
├── 2018-11-24-13-06-01.jpg
├── 2018-11-24-13-11-01.jpg
├── 2018-11-24-13-16-01.jpg
├── 2018-11-24-13-21-01.jpg
├── 2018-11-24-13-26-01.jpg
├── 2018-11-24-13-31-01.jpg
├── baocun # 标签文件,数值
├── config # 标签文件,用于 detection
├── coor_all_img_np # 没有根据 config 切割的文件
├── Digit # 似乎与 digit 相同
├── id # 编号。每个数据集都有对应的 id,用于 track。
├── ImageSets # 单个数字的分割
├── ImageSets_block_zoom # blocked images
├── ImageSets_seg # 通过单子分割的np文件
├── Numpy_block_zoom # 已经切割的 np
├── Numpy_seg # 单字分割的数据文件
├── x_history.npy
├── x_test_history.npy
├── x_train_history.npy
├── y_history.npy
├── y_test_history.npy
└── y_train_history.npy

config 文件夹中的内容

total files:

  • ['block.xml', 'type.xml', 'res.xml', 'valid.xml']

  • block: 读数范围

  • res: 单个读数的数据和位置

绘图功能

为了能够更方便的查看标注位置,我们提供了绘图功能。

./src/meterviewer/img/draw.py 中提供了绘图功能。

可以在仪表图片上展示相关区域。