本文へ移動

Audio-Visual Tracking System for Multi-Modal Interface

記事を表すアイコン

Audio-Visual Tracking System for Multi-Modal Interface

国立国会図書館請求記号
Z16-810
国立国会図書館書誌ID
5877832
資料種別
記事
著者
Omitry Zotkinほか
出版者
東京 : 画像電子学会
出版年
2001
資料形態
掲載誌名
画像電子学会誌 = The journal of the Institute of Image Electronics Engineers of Japan : visual computing, devices & communications 30(4) (通号 153) 2001
掲載ページ
p.452~463
詳細を見る

全国の図書館の所蔵

国立国会図書館以外の全国の図書館の所蔵状況を表示します。

所蔵のある図書館から取寄せることが可能かなど、資料の利用方法は、ご自身が利用されるお近くの図書館へご相談ください

その他

書誌情報

この資料の詳細や典拠(同じ主題の資料を指すキーワード、著者名)等を確認できます。

資料種別
記事
著者・編者
Omitry Zotkin
Kazuhiko Takahashi
Tatsuo Yotsukura 他
タイトル(掲載誌)
画像電子学会誌 = The journal of the Institute of Image Electronics Engineers of Japan : visual computing, devices & communications
巻号年月日等(掲載誌)
30(4) (通号 153) 2001
掲載巻
30
掲載号
4
掲載通号
153
掲載ページ
452~463
掲載年月日(W3CDTF)
2001
ISSN(掲載誌)
0285-9831
ISSN-L(掲載誌)
0285-9831
出版事項(掲載誌)
東京 : 画像電子学会
出版地(国名コード)
JP
本文の言語コード
eng
NDLC
対象利用者
一般
所蔵機関
国立国会図書館
請求記号
Z16-810
連携機関・データベース
国立国会図書館 : 国立国会図書館雑誌記事索引
書誌ID(NDLBibID)
5877832
整理区分コード
632

デジタル

要約等
In this paper, a front end system which uses audio and video information to track the people or other sound sources in the ordinary room has developed. The microphone array is used for determining the spatial location of the sound; the active video camera acquires the image of the area where the sound is detected, detects the people in the image by using skin color and can zoom and track a speaker. Several add-ons to the system include various visualization tools such as on-screen displays of waveforms, correlation plots, spectrum plots, spatial acoustic energy distribution, running time-frequency acoustic energy plots, and the possibility of real-time beamforming with real-time output to the headphones. The system can be used as a front-end for the non-encumbering human-computer interaction by video and audio means.
DOI
10.11371/iieej.30.452
オンライン閲覧公開範囲
インターネット公開
連携機関・データベース
科学技術振興機構 : J-STAGE

デジタル

要約等
In this paper, a front end system which uses audio and video information to track the people or other sound sources in the ordinary room has developed. The microphone array is used for determining the spatial location of the sound; the active video camera acquires the image of the area where the sound is detected, detects the people in the image by using skin color and can zoom and track a speaker. Several add-ons to the system include various visualization tools such as on-screen displays of waveforms, correlation plots, spectrum plots, spatial acoustic energy distribution, running time-frequency acoustic energy plots, and the possibility of real-time beamforming with real-time output to the headphones. The system can be used as a front-end for the non-encumbering human-computer interaction by video and audio means.
連携機関・データベース
国立情報学研究所 : CiNii Research
提供元機関・データベース
Japan Link Center
雑誌記事索引データベース
CiNii Articles
書誌ID(NDLBibID)
5877832
NII論文ID
10010070462