本文へ移動
規格・テクニカルリポート類

SRLを利用した規則ベースの感染症用語抽出

規格・テクニカルリポート類を表すアイコン

SRLを利用した規則ベースの感染症用語抽出

資料種別
規格・テクニカルリポート類
著者
新納, 貴志ほか
出版者
一般社団法人電子情報通信学会
出版年
2009-10-09
資料形態
デジタル
ページ数・大きさ等
-
NDC
-
詳細を見る

資料に関する注記

一般注記:

出版タイプ: VoR我々は感染症情報をWeb上から集めて提示するBioCasterシステムを構築している.感染症情報は各国のローカルニュースに速報が出ることが予測されることから英語のみならず日本語を含めたアジア言語での開発を進めている.核となる技術は感染症に関する用語を記事から見つける用語抽出である...

書店で探す

全国の図書館の所蔵

国立国会図書館以外の全国の図書館の所蔵状況を表示します。

所蔵のある図書館から取寄せることが可能かなど、資料の利用方法は、ご自身が利用されるお近くの図書館へご相談ください

その他

  • 岡山大学学術成果リポジトリ

    デジタル
    連携先のサイトで、学術機関リポジトリデータベース(IRDB)(機関リポジトリ)が連携している機関・データベースの所蔵状況を確認できます。

書誌情報

この資料の詳細や典拠(同じ主題の資料を指すキーワード、著者名)等を確認できます。

デジタル

資料種別
規格・テクニカルリポート類
著者・編者
新納, 貴志
竹内, 孔一
ナイジェル, コリアー
出版年月日等
2009-10-09
出版年(W3CDTF)
2009-10-09
並列タイトル等
Bio-medical Term Extraction with Morpho-Syntactic Rules on Simple Rule Language
タイトル(掲載誌)
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号年月日等(掲載誌)
109 234
掲載巻
109
掲載号
234
掲載ページ
1-5
ISSN(掲載誌)
ISSN : 0913-5685
本文の言語コード
jpn
対象利用者
一般
一般注記
出版タイプ: VoR
我々は感染症情報をWeb上から集めて提示するBioCasterシステムを構築している.感染症情報は各国のローカルニュースに速報が出ることが予測されることから英語のみならず日本語を含めたアジア言語での開発を進めている.核となる技術は感染症に関する用語を記事から見つける用語抽出であるが,既存の手法では学習データを利用した統計的学習モデルを利用して構築した.しかしながら,新たな病気など学習データに無い用語が現れた際うまく獲得できないことが予測されるため規則に基づく用語抽出システムの構築を行う.規則ベースで用語を抽出するシステムとしてSRL(Simple Rule Language)が公開されており,ユーザは語構成ならびに文脈を規則で記述することで用語を抽出できる.そこで本研究では感染症情報に必要な用語についてどのようにSRL上で定義できるかについて明らかにする.
Simple rule language, rule-based term extraction, bio-medical terms, Disease surveillance system Bio-medical term extraction is a key technology for a surveillance system of epidemic disease news from the Web. In the previous work we applied statistical learning model to extract terms from the Web site. The previous approach is good at extracting terms with high precision rates; however it is weak at extracting new terms that do not exist in the training data. Since we usually have new disease names a new term extraction approach with high coverage for unknown or low-frequent terms is needed. Recently, Simple rule Language (SRL), a rule-based word extraction language, is freely available. The SRL also has an developing environment called SRL editor. Thus we are constructing rules of bio-medical terms on the several language (such as English, Japanese, Thai and Vietnam) for the multilingual disease surveillance system. In this manuscript we confirm how we construct rules to extract Japanese bio-medical terms from Japanese news articles.
オンライン閲覧公開範囲
インターネット公開
著作権情報
一般社団法人電子情報通信学会
連携機関・データベース
国立情報学研究所 : 学術機関リポジトリデータベース(IRDB)(機関リポジトリ)
提供元機関・データベース
岡山大学 : 岡山大学学術成果リポジトリ