本資料は、掲載誌(URI)等のリンク先にある学位授与機関のWebサイトやCiNii Dissertationsから、本文を自由に閲覧できる場合があります。
博士論文
国立国会図書館館内限定公開
収録元データベースで確認する
国立国会図書館デジタルコレクション
デジタルデータあり
マイクロタスク型クラウドソーシングを用いた大規模データ処理における精度向上手法ならびにシステム開発と運用に関する研究
- 国立国会図書館永続的識別子
- info:ndljp/pid/10370807
国立国会図書館での利用に関する注記
資料に関する注記
一般注記:
- クラウドソーシングはCrowd(群衆) + Sourcing(調達) の造語であり,「企業,組織が,自社もしくはアウトソースの人材により実施していた業務を,よりオープンかつ不特定多数のCrowd(群衆) から人材を集め実施すること」と定義されている.このようなクラウドソーシング技術は,大規模データの...
書店で探す
障害者向け資料で読む
目次
2023-12-08 再収集
書店で探す
障害者向け資料で読む
書誌情報
この資料の詳細や典拠(同じ主題の資料を指すキーワード、著者名)等を確認できます。
デジタル
- 資料種別
- 博士論文
- 著者・編者
- 芦川, 将之Masayuki, Asikawa
- 出版年月日等
- 2017-03-24
- 出版年(W3CDTF)
- 2017-03-24
- 授与機関名
- 電気通信大学
- 授与年月日
- 2017-03-24
- 授与年月日(W3CDTF)
- 2017-03-24
- 報告番号
- 甲第898号
- 学位
- 博士(工学)
- 博論授与番号
- 甲第898号
- 本文の言語コード
- jpn
- 対象利用者
- 一般
- 一般注記
- クラウドソーシングはCrowd(群衆) + Sourcing(調達) の造語であり,「企業,組織が,自社もしくはアウトソースの人材により実施していた業務を,よりオープンかつ不特定多数のCrowd(群衆) から人材を集め実施すること」と定義されている.このようなクラウドソーシング技術は,大規模データの解析や構築などを低コストで行うことが可能であり様々な分野や用途で利用されている.しかしその特性上,処理速度の速さや低コストの利点に対して処理結果の精度においては専門家による処理よりも劣るため問題視されており,様々な精度向上手法が研究されている.それらの研究では作業(タスク) を処理する作業者(ワーカー) が不特定多数ということもあり,安易に低品質なワーカーを排除する傾向がある. しかし,その利用範囲の拡大に従いワーカーの数も増大しており,将来的にクラウドソーシングにおける作業が社会における一つの就労形態となることが予想される.そのような傾向にあるにもかかわらず,現状のクラウドソーシングではワーカーに対する安易な排除が中心となり,育成や労働環境の改善と言ったサポートが十分であるとは言い難い.これらの問題はクラウドソーシング市場自体の縮小にもつながりかねない.これらの問題に対応するためには,クラウドソーシング運用において通常の労働環境と同様に人材(ワーカー)のマネジメントや育成が重要になってくると予想される. 我々はこのようなクラウドソーシングの精度問題において,ワーカーのフィルタリングと教育の二つの手法の組み合わせで対応を行っている.ワーカーのフィルタリングで適材適所な作業環境を用意し,その上で低品質なワーカーを高品質なワーカーへと成長させるべく教育を行う. しかし従来のクラウドソーシングサービスでは我々の提唱するフィルタリングや段階的教育を実現するには外部のサービスが提供している機能の範囲では十分ではなく,外部のサービスに新規の機能を追加することも難しいという問題がある.我々はこれらの問題を解決するために,独自のクラウドソーシングシステム(PCSS) を構築し,システム内にて精度向上手法を適用することで問題の解決を試みている.PCSS は2011 年から運用を継続しており,1853 万個のタスクを処理した実績を持っている. PCSS におけるワーカーのフィルタリングは事前フィルタリング,動的フィルタリング,結果フィルタリング,推測フィルタリングという4 つの独自のフィルタリングの組み合わせで行われている.その過程でワーカーの各タスクに対する特性の解析を行い,適したタスクのアロケーション,または不適なタスクからの排除などを行う.また,その過程で低品質であることが判明したワーカーに対し,ワーカーがタスクを処理する過程で適切な学習タスクをこなすことで能力を向上させる段階的な学習方式を提案する.このような段階的な学習法式としては,学習支援システム(Intelligent tutoring system,ITS) における学習モデルをベイジアンネットワークによって表現する研究[Ueno 00] が提案されており,その有効性が示されている.我々はこのベイジアンネットワークを用いた段階的学習手法のマイクロタスク型クラウドソーシングへの適用を提案する.具体的な手法として,まずワーカーのタスク処理結果からベイジアンネットワークを用いてタスク間の関係性の解析を行う.次にタスクを処理することで段階的な学習が可能となるような学習タスクを自動生成する.これによってワーカーの能力の育成を狙う. さらに,これらのフィルタリングを実装したPCSS を用いて知識処理研究に必要な語彙の収集を行った.Web クローラを用いて5.2 億ページのWeb データの収集を行い,そこから形態素解析で得られた語彙候補に対してPCSS でノイズ除去,読み仮名などのデータ付与を行なうことで14 万語の未知語を得ることに成功した. この語彙収集の課程で行ったクラウドソーシング処理において,ワーカーのフィルタリングを行うことにより精度が32.4 ポイント上昇していることを確認した.また,同様に低品質な結果の多いタスクに対して学習タスクの算出を行ったところ,9 種類のタスクに対して合計31 種類の学習タスクを導出することが出来た.また,この導出された学習タスクを用いて低品質なワーカーに学習させ,改善効果を測定したところ平均7.8 ポイントの改善効果が確認できた.比較対象として決定木でも学習タスクを導出したが,ベイジアンネットワークを用いて導出した学習タスクよりも効果が低いことが確認できた. このようにクラウドソーシングにおいても適切なワーカーマネジメントと育成を行うことで,安易にワーカーを排除すること無く高精度なデータ処理結果を高速かつ低コストで取得することが可能であることを示すことが出来た.2016
- 国立国会図書館永続的識別子
- info:ndljp/pid/10370807
- コレクション(共通)
- コレクション(障害者向け資料:レベル1)
- コレクション(個別)
- 国立国会図書館デジタルコレクション > デジタル化資料 > 博士論文
- 収集根拠
- 博士論文(自動収集)
- 受理日(W3CDTF)
- 2017-07-03T04:10:06+09:00
- 作成日(W3CDTF)
- 2017-04-24
- 記録形式(IMT)
- application/pdf
- オンライン閲覧公開範囲
- 国立国会図書館内限定公開
- デジタル化資料送信
- 図書館・個人送信対象外
- 遠隔複写可否(NDL)
- 可
- 連携機関・データベース
- 国立国会図書館 : 国立国会図書館デジタルコレクション