Що таке формат HDF5?

Ієрархічний формат даних версії 5 (HDF5) — це формат файлу з відкритим кодом, який підтримує великі, складні, різнорідні дані. HDF5 використовує структуру, схожу на «каталог файлів», яка дозволяє організовувати дані у файлі багатьма різними структурованими способами, як це можна зробити з файлами на комп’ютері.

На відміну від файлів CSV або JSON, які містять звичайний текст, HDF5 — це двійковий формат файлу. Це означає, що інформація, яка там зберігається, закодована більш складним способом, і її неможливо показати чи відредагувати за допомогою простого текстового редактора.

Специфікація формату файлу HDF5 визначає, як абстрактні об'єкти (наприклад, групи та набори даних) представлені у вигляді заголовків, блоків B-дерева та інших елементів. Бібліотека HDF5 реалізує операції для запису об’єктів HDF5 у лінійний формат і читання з лінійного формату для створення об’єктів HDF5.

HDF5 дозволяє зменшити розмір файлу даних шляхом стиснення повторюваних значень. Це дозволяє читати та записувати ваші дані набагато швидше, ніж якби ви зберігали дані як файли ASCII (звичайний текст). GMS може читати та записувати файли HDF5, а також зберігає власні файли HDF5 разом з іншими файлами даних MODFLOW.

Специфікація та реалізація продовжують підтримуватися та розвиватися, але HDF5, здається, не отримав широкого поширення (деякі, можливо, великі та важливі, нішеві додатки не витримують).