Alternative TitleStudy on Indexing Technology for M2M Data
Note (General)近年の通信機器小型化やネットワークインフラストラクチャの大容量化・低料金化により, M2M(Machine to Machine),すなわち機器間の通信を用いたアプリケーションが普及しつつある.さらに,個々の M2M アプリケーションを独立に実装していたのでは,費用や実装期間が大きくなってしまうため,共通機能,あるいはデバイスデータそのものを共有化する,水平統合型プラットフォームの必要性が認識されつつある.本研究では,M2M の更なる普及を促進するため,水平統合型プラットフォームの基本機能であるデータ検索機能の実現を目指すこととした.大規模データに対する効率的な検索には,インデックスが必要不可欠である.また,扱うデータや検索クエリに応じて,適切なインデックスは異なる.そこで,M2M アプリケーションの M2M データ検索クエリに適したインデキシング技術を確立することを,本研究の目的とした.水平統合型プラットフォームの検索機能においては,大量のデータを蓄積しながら,大量の検索処理を実行するため,挿入性能,検索性能ともに高速性とスケール性が求められる.各 M2M アプリケーションは種類によって様々な検索条件により検索を行うが,各検索条件が用いられる頻度を正確に予測することはできず,また頻度は動的に変化すると考えられるため,どのような検索をどれほど効率的に処理可能とすべきかを事前に決めることは困難である.従って,入力データや検索要求の変化にもある程度柔軟に対応可能な負荷追従性が求められると考えられる.本研究ではまず,M2M アプリケーションの検索要求について検討・整理した.その結果, 5つの検索パターンが存在することが判明し,特にデバイスの「 ID 」と測定時刻を示す「時間」の 2つの次元(属性)を指定する検索条件を用いた 2次元検索クエリが多く用いられることが分かった.しかしながら,従来のインデキシング技術で対応できない検索クエリという観点からは,本論文中では「その他の多次元検索型」と分類したパターン,すなわち多様な M2M データに対する多様な多次元検索クエリが,従来のインデキシング技術では前述した要件,すなわち高速性,スケール性,負荷追従性を実現できない検索要求であることが分かった. M2M データは,「 ID 」や「時間」,「場所」など多数の次元(属性)を含み,多次元検索クエリは,複数の次元について条件指定した検索クエリである.「その他の多次元検索型」をさらに分類すると,多次元完全一致検索と多次元範囲検索に分けることができる.多次元完全一致検索とは,「『 2014 年製』の『X社』の『赤い』『カバン』」を検索条件とする検索クエリのように,モノ・コトに関する複数の属性情報を指定する検索である.多次元範囲検索とは,「『関東地方』で『現在』の積載量が『0.5t 以下』のトラックのリスト」を検索条件とする検索クエリのように,時空間やセンサデータ等,複数次元の値範囲を指定する検索である.多完全一致検索,多次元範囲検索いずれの検索においても, 1次元インデックスを用いて中間解を取得し,中間解に対して残りの次元についてフィルタリングを行う従来手法では中間解が膨大になり高速化できない.また多次元範囲検索については,多数の多次元インデックスを用いる従来手法もあるが,インデックスの構築・保持コストが高くスケール性に乏しい.そこで,多次元完全一致検索に対する新しいインデキシング技術として,準候補キーインデキシング技術を提案した.準候補キーインデキシング技術は,複数の属性情報を指定した検索条件(AND条件)に対しても高速に検索結果を返却できるよう, AND条件とそれに該当する検索結果も予めインデックスに入れておく手法である.ただし, AND条件は組合せの数だけ存在し,その数は爆発してしまうため,必要以上に多くの AND条件をインデキシングしないで済むよう,インデキシングすべき AND条件の選択手法を考案した点が本技術の重要な部分である.評価の結果,AND条件においても M2Mデータ数に関わらず高速な検索が実現でき,またインデキシングのための通信量や記憶量は M2Mデータ数に対して logオーダとなり,スケール性があることを確認した.また M2Mデータの更新に追従して,インデキシングする AND条件を適応的に変化させていくアルゴリズムを考案した.また多次元範囲検索に対する新しいインデキシング技術として, UBI-Tree 技術を提案した. UBI-Tree 技術は,従来の多次元範囲検索用インデキシング技術である R-Tree を拡張し,多様なデータ,多様な範囲条件にも対応可能とする手法である.評価の結果,従来技術に比べ,高速な多次元範囲検索が可能であることを確認した.さらに,変化する負荷に対応できるよう,検索クエリの履歴に応じてデータの分類方法を変化させていく Load-Adaptive UBI-Tree技術を提案した.評価の結果,頻繁に用いられる検索クエリの処理効率を向上させ,平均レスポンスタイムやスループットを向上させることができることを確認した.また,UBI-Tree 技術にスケール性を持たせるため,新しい負荷分散手法として Dynamic-Help Methodを提案した.評価の結果,増加していく負荷に対してスケールすることを確認した.以上のように本研究では,水平統合型プラットフォームの検索機能における多次元検索を効率化する要素技術として, 2つの新しいインデキシング技術を確立することができた.今後,実用化していくためには,他のインデキシング技術,他の機能を含めた水平統合型プラットフォームとしてのトータルな設計,本格実装,実証実験による有効性確認を行っていく必要があると考えられる.
2014
Collection (particular)国立国会図書館デジタルコレクション > デジタル化資料 > 博士論文
Date Accepted (W3CDTF)2018-01-02T17:18:43+09:00
Data Provider (Database)国立国会図書館 : 国立国会図書館デジタルコレクション