2

Photometric classification of the HSC transients through machine learning

The advancement of technology has resulted in a rapid increase in supernova (SN) discoveries. The Subaru/Hyper Suprime-Cam (HSC) transient survey, conducted from fall 2016 through spring 2017, yielded 1824 SN candidates. This gave rise to the need …

The Hyper Suprime-Cam SSP transient survey in COSMOS: Overview

We present an overview of a deep transient survey of the COSMOS field with the Subaru Hyper Suprime-Cam (HSC). The survey was performed for the 1.77 deg$^2$ ultra-deep layer and 5.78 deg$^2$ deep layer in the Subaru Strategic Program over 6- and …

SNS上で拡散するwebニュース説明文の調査と自動選択

SNSの隆盛によりニュースを取り巻く環境は大きく変化している.新聞やテレビから一方的に配信される記事を受け取るのではなく,膨大な情報で溢れるSNS上から関心のある記事を選択して購読する新たなニュースの読まれ方が生まれている.この変化により,ニュースメディアはSNS上で記事を読者に対して効果的にアピールする必要に迫られている.その一方で,刺激的な言葉を用いてむやみに拡散させるのではなく,記事を正確に説明し,その内容に興味をもつ読者に記事を届ける必要がある.本研究では,ニュース配信者がニュース消費者 …

共変量シフト適応に基づくrandom forestsの並列分散学習

本論文では,MapReduceの枠組を用いて大規模データからrandom forestsを学習する新しい手法を提案する.Random forestsは,多数の決定木によって構成され,かつそれぞれの決定木を独立に学習することができるため,並列分散処理に非常に適した機械学習手法である.しかし,random forestsの学習をナイーブに並列分散化すると,それぞれの決定木を学習するために利用可能な学習データが少量となるため,しばしば過学習を引き起こす.本論文で提案する手法は,この過学習の問題を,以下 …

ソーシャルキュレーションデータを用いた画像コンテクストマイニング

本論文では,画像を扱うソーシャルキュレーションサービスの1つであるPinterestの画像データから,共通するコンテクストを持つ画像群を自動的に発見する手法を提案する.ソーシャルキュレーションは,日本語では一般に「まとめサイト」とも呼ばれ,キュレーターと呼ばれる人間が既存コンテンツを人手で収集・選択した結果を編集コンテンツ群として共有する仕組みである.その結果として得られた編集コンテンツ群は,通常のSNS上のコンテンツとは異なり,キュレーターにとって不要なコンテンツが除去され,キュレーターの意図 …

Creating stories from socially curated microblog messages

Social media such as microblogs have become so pervasive such that it is now possible to use them as sensors for real-world events and memes. While much recent research has focused on developing automatic methods for filtering and summarizing these …

Large-scale cross-media analysis and mining from socially curated contents

The major interest of the current social network service (SNS) developers and users are rapidly shifting from conventional text-based (micro)blogs such as Twitter and Facebook to multimedia contents such as Flickr, Snapchat, MySpace and Tumblr. …

非負制約下における複合行列分解とそのソーシャルメディア解析への応用

行列分解には,観測行列に含まれる零要素の割合が大きくなるにつれて低ランク近似の汎化性能が低下する問題がある.本稿では,この問題を解決するための統計的機械学習アプローチとして複合非負値行列因子分解(Non-negative Multiple Matrix Factorization: NM2F)を提案する.NM2F は,観測行列と2つの補助行列の間に共通の潜在構造を仮定し,これらの行列を同時に分解する.本稿では,NM2F を非負値行列因子分解(Non-negative Matrix …

画像検索でのユーザ行動を利用した大規模画像アノテーション

本論文では,画像検索サーバのログを利用することで,画像そのものから得られる特徴量等の情報を一切用いずに,web上の画像とそれに関連するテキストタグを全自動・大量かつ高精度に収集し,画像マルチラベル分類のための大規模データセットを構築する方法を提案する.特に,画像検索のランキング学習などで広く用いられる画像のクリックログだけではなく,クエリ投入やページ遷移など検索サーバへのアクセスログから得られる様々な情報を有効活用する.これらの情報を併用することにより,クリックログのみからでは得られなかったクリ …

Computational Models of Human Visual Attention and Their Implementations: A Survey

We humans are easily able to instantaneously detect the regions in a visual scene that are most likely to contain something of interest. Exploiting this pre-selection mechanism called visual attention for image and video processing systems would make …