"Random forests"

共変量シフト適応に基づくrandom forestsの並列分散学習

本論文では,MapReduceの枠組を用いて大規模データからrandom forestsを学習する新しい手法を提案する.Random forestsは,多数の決定木によって構成され,かつそれぞれの決定木を独立に学習することができるため,並列分散処理に非常に適した機械学習手法である.しかし,random forestsの学習をナイーブに並列分散化すると,それぞれの決定木を学習するために利用可能な学習データが少量となるため,しばしば過学習を引き起こす.本論文で提案する手法は,この過学習の問題を,以下 …