並列タイトル等Performance study of IUGONET metadata management system
タイトル(掲載誌)宇宙航空研究開発機構研究開発報告: 宇宙科学情報解析論文誌: 第2号 = JAXA Research and Development Report: Journal of Space Science Informatics Japan Volume 2
一般注記本論文では,大学間連携プロジェクト「超高層大気長期変動の全球地上ネットワーク観測・研究」(IUGONET) において、作成されたメタデータの受付やメタデータ・データベースへの登録を行っている「メタデータ登録・管理システム」のメタデータ登録処理に関する性能試験の結果について報告する.メタデータ登録・管理システムは,フリーのバージョン管理ソフトウェアであるGit を利用したメタデータ受付部と,そこからメタデータ・データベースへメタデータを登録するメタデータインポート部の,2つの処理部で構成される.この2つの処理部の性能を評価するために,実際に作成・登録されたメタデータを用いて,物理マシンおよび仮想マシン上に構築したLinux 環境のそれぞれについて,メタデータの処理速度を計測した.その結果,Git によるメタデータ受付部は物理マシンか仮想マシンかに依らず,メタデータ総数が500 万件レベルまで増えても数分以内で処理が完了するのに対して,メタデータインポート部は処理時間が数時間から数十時間とかなり長くなり,特に検索エンジンであるLucene のインデックス更新については,物理マシンにおける実行速度が仮想マシンのそれより約4 倍高速であることがわかった.メタデータインポート部を物理マシン上に実装した場合,メタデータ総数500 万件では,新規登録メタデータ数10 万件につき5 時間弱プラスLucene インデックス更新で21 時間ほど処理時間がかかると見積もられる.
This paper reports on the benchmark test of the metadata management system developed by the Inter-university Upper atmosphere Global Observation NETwork (IUGONET) project. The IUGONET metadata management system consists of the metadata reception module based on file repositories of Git, which is a widely-used version control software, and the metadata import module to register metadata to the metadata database using the DSpace commands. We made the performance assessments for these two modules in terms of the processing speed for registering/importing metadata both on a native Linux platform and a virtualized Linux platform. As a result, the metadata reception module processes properly even millions of registered metadata within several minutes at most, showing roughly the similar performance for the native and virtualized platform. On the other hand, the metadata import module needs much longer processing times of several to a few tens of hours for the same amount of metadata. As compared with the virtualized platform, the native platform gives a four times faster speed for updating indices for the built-in search engine based on Lucene. From a perspective of the regular operation of the metadata management system, the metadata import module runs more efficiently on the native Linux platform and it is estimated by our performance test that it takes about 5 hours to newly import 10(exp5) metadata files and subsequently takes about 21 hours to update the Lucene indices for the registered metadata of 5× 10(exp6) in total.
形態: カラー図版あり
Physical characteristics: Original contains color illustrations
資料番号: AA0061914008
レポート番号: JAXA-RR-12-006
連携機関・データベース国立情報学研究所 : 学術機関リポジトリデータベース(IRDB)(機関リポジトリ)
提供元機関・データベース宇宙航空研究開発機構 : 宇宙航空研究開発機構リポジトリ