「t-SNEは何次元のデータを可視化できる? 」AIクイズscikit-learn編【第2問】
アイブン
3Picks
コメント
注目のコメント
t-SNE(t-Distributed Stochastic Neighbor Embedding)はトロント大学のヒントン教授が開発した次元削減アルゴリズムで、設問の問いに「可視化」とあるように、高次元データを2-3次元に落とし込むというものです。ということは・・・
https%3A%2F%2Flvdmaaten.github.io%2Fpublications%2Fpapers%2FJMLR_2008.pdf
データ点同士の「距離」を変換前と後でそれぞれ条件付き確率で表現した後、その「距離」同士ができるだけ近くなるように、それらの「距離」同士の「近さ」を対称性をもたせる変換したKLダイバージェンスで表現し、高次元側のデータポイントの距離分布を正規分布、低次元側のデータポイントの距離分布をスチューデントt-分布を仮定してモデリングするということをやっています。