Convolutional Neural Network
画像認識を席巻した、Convolutional Neural Network (CNN) ですが、これの振る舞いって、どこまで理解されているのでしょうか?
CNNの構造は、一見単純です。なぜなら、畳み込みというのは、画像処理のフィルタと同じですから。ただ、CNNのややこしいところは、そのフィルタがたくさんあって、次の層では、フィルタ数分だけ厚みのある画像が得られるということ。この画像は、通常の意味でのフィルタとは考えにくく、どちらかと言うと、三次元ボクセルデータのような気がします。
ということは、ボクセルデータの可視化手法が使えるのですが、なぜかCNNの隠れ層を、このような可視化をした事例にお目にかかりません。この可視化を、学習の過程で時系列に行い、動画を作ると、CNNにおける学習の仕組みが何かしら分かるのでないでしょうか。それとも、そんな単純な話ではない?
よくある図は、全てのフィルタをタイル状に並べたものです。でもこれだと、三次元的構造が把握できないです。
CNNの構造は、一見単純です。なぜなら、畳み込みというのは、画像処理のフィルタと同じですから。ただ、CNNのややこしいところは、そのフィルタがたくさんあって、次の層では、フィルタ数分だけ厚みのある画像が得られるということ。この画像は、通常の意味でのフィルタとは考えにくく、どちらかと言うと、三次元ボクセルデータのような気がします。
ということは、ボクセルデータの可視化手法が使えるのですが、なぜかCNNの隠れ層を、このような可視化をした事例にお目にかかりません。この可視化を、学習の過程で時系列に行い、動画を作ると、CNNにおける学習の仕組みが何かしら分かるのでないでしょうか。それとも、そんな単純な話ではない?
よくある図は、全てのフィルタをタイル状に並べたものです。でもこれだと、三次元的構造が把握できないです。
スポンサーサイト