pyhdf

HDF(Hierarchical Data Format)は、階層型データ構造を持つファイルフォーマット。科学技術のデータを扱うのによく使われるらしい。でも馴染みが無い。現在リリースされているバージョンHDF4(HDF Release 4)とHDF5(HDF Release 5)のフォーマットは完全に異なるため、互換性はないらしい。

What is HDF?

ファイルの中のデータが階層構造になっていて、最下位は、計算データか何かデータの集合体で、、最上位は、HDFファイルのデータをハンドリングするユーティリティやらアプリケーションやらがある。それらの間には、APIやらデータインターフェースのライブラリが格納されている(らしい)。ファイルの中に収められているのがデータだけでなく、それらデータをハンドリングするツールも。
自己解決というか、自分で自分の処理ができてしまうようなものか。データが大きくなるとファイル容量が心配なのだが。
そのファイルハンドリングができるのが、pyhdf(HDF4対応だが)。