Audio-Visual Tracking System for Multi-Modal Interface
デジタルデータあり(科学技術振興機構)
すぐに読む
J-STAGE
全国の図書館の所蔵
国立国会図書館以外の全国の図書館の所蔵状況を表示します。
所蔵のある図書館から取寄せることが可能かなど、資料の利用方法は、ご自身が利用されるお近くの図書館へご相談ください
その他
J-STAGE
デジタルCiNii Research
検索サービスデジタル連携先のサイトで、CiNii Researchが連携している機関・データベースの所蔵状況を確認できます。
書誌情報
この資料の詳細や典拠(同じ主題の資料を指すキーワード、著者名)等を確認できます。
- 資料種別
- 記事
- 著者・編者
- Omitry ZotkinKazuhiko TakahashiTatsuo Yotsukura 他
- タイトル(掲載誌)
- 画像電子学会誌 = The journal of the Institute of Image Electronics Engineers of Japan : visual computing, devices & communications
- 巻号年月日等(掲載誌)
- 30(4) (通号 153) 2001
- 掲載巻
- 30
- 掲載号
- 4
- 掲載通号
- 153
- 掲載ページ
- 452~463
- 掲載年月日(W3CDTF)
- 2001
- ISSN(掲載誌)
- 0285-9831
- ISSN-L(掲載誌)
- 0285-9831
- 出版事項(掲載誌)
- 東京 : 画像電子学会
- 出版地(国名コード)
- JP
- 本文の言語コード
- eng
- NDLC
- 対象利用者
- 一般
- 所蔵機関
- 国立国会図書館
- 請求記号
- Z16-810
- 連携機関・データベース
- 国立国会図書館 : 国立国会図書館雑誌記事索引
- 書誌ID(NDLBibID)
- 5877832
- 整理区分コード
- 632
- 要約等
- In this paper, a front end system which uses audio and video information to track the people or other sound sources in the ordinary room has developed. The microphone array is used for determining the spatial location of the sound; the active video camera acquires the image of the area where the sound is detected, detects the people in the image by using skin color and can zoom and track a speaker. Several add-ons to the system include various visualization tools such as on-screen displays of waveforms, correlation plots, spectrum plots, spatial acoustic energy distribution, running time-frequency acoustic energy plots, and the possibility of real-time beamforming with real-time output to the headphones. The system can be used as a front-end for the non-encumbering human-computer interaction by video and audio means.
- DOI
- 10.11371/iieej.30.452
- オンライン閲覧公開範囲
- インターネット公開
- 連携機関・データベース
- 科学技術振興機構 : J-STAGE
- 要約等
- In this paper, a front end system which uses audio and video information to track the people or other sound sources in the ordinary room has developed. The microphone array is used for determining the spatial location of the sound; the active video camera acquires the image of the area where the sound is detected, detects the people in the image by using skin color and can zoom and track a speaker. Several add-ons to the system include various visualization tools such as on-screen displays of waveforms, correlation plots, spectrum plots, spatial acoustic energy distribution, running time-frequency acoustic energy plots, and the possibility of real-time beamforming with real-time output to the headphones. The system can be used as a front-end for the non-encumbering human-computer interaction by video and audio means.
- DOI
- 10.11371/iieej.30.452
- 連携機関・データベース
- 国立情報学研究所 : CiNii Research
- 提供元機関・データベース
- Japan Link Center雑誌記事索引データベースCiNii Articles
- 書誌ID(NDLBibID)
- 5877832
- NII論文ID
- 10010070462