著者・編者新納, 浩幸 / 佐々木, 稔
SHINNOU, Hiroyuki / SASAKI, Minoru
並列タイトル等Fast method of word sense disambiguation using information retrieval technique
ジョウホウ ケンサク シュホウ ヲ リヨウ シタ ゴギ ハンベツ モンダイ ノ コウソク カイホウ
一般注記application/pdf
テクニカルレポート
自然言語処理の個々の問題を分類問題として定式化し,帰納学習の手法を用いて解決するというアプローチは,大きな成功をおさめている.問題に対する精度は,学習により得られる分類規則の精度に依存する.そして分類規則の精度を高めるために,近年,アンサンブル学習が研究されている.アンサンブル学習とは,複数の学習手法を組み合わせ,それらの判別結果を総合して最終的な判別を行う手法であり,単独の学習手法よりも高い精度が得られる.しかしアンサンブル学習には,学習時間と判別時間の点で問題があり,ある程度の精度を出し,しかも高速な学習と判別が可能な帰納学習手法が望まれる.そこで本論文では情報検索手法を利用した分類手法を提案する.k-最近傍法と類似の手法であり,学習時間をほとんど要しない.SENSEVAL2の辞書タスクによる実験では, 本手法は決定リストやNaive Bayesと同程度の精度を出し,判別時間も同程度であった.一方,学習時間に関しては5〜10倍高速であった.また決定リスト,Naive Bayes及び本手法によるアンサンブル学習により,個々の学習手法の判別精度を上回る精度が得られた.
Many problems in natural language processing can be converted into classification problems, and be solved by an inductive learning method. This strategy has been very successful. Accuracy for the target problem depends on the learned classifier, so an effective learning method is desired. Against this background, ensemble learning is actively researched. Ensemble learning combines some learning methods, and outperforms each learning method. However, ensemble learning has the problem that it needs much learning time and much classifying time. Therefore, a fast method in learning and classifying is desired. In this paper, we propose the fast learning method which uses information retrieval method. The proposed method is similar to k Nearest Neighbor, and so need little learning time. In experiment,we applied our method to Japanese dictionary task of SENSEVAL2. Precision and classifying time of our method was as the same level as the decision list and Naive Bayes. On the other hand, leaning time was 5 - 10 times faster than them. Moreover, ensemble learning composed of the decision list, Naive Bayes and our method outperformed each method.
著作権情報情報処理学会
本文データは学協会の許諾に基づきCiNiiから複製したものである
連携機関・データベース国立情報学研究所 : 学術機関リポジトリデータベース(IRDB)(機関リポジトリ)