画像生成AIが「トレパク」していた? 学習画像と“ほぼ同じ”生成画像を複数特定 米Googleなどが調査
コメント
注目のコメント
トレパクとは違いますね。
そもそも、トレパクとは他社が著作権等を保有するものをトレースし、自分のオリジナルであることを主張する行為です。Diffusion model (拡散モデル)を始めとする生成アルゴリズムは、「オリジナル」であることを主張しませんし、むしろトレーニングデータの分布依存なので学習データに近いものが出てくることは想像に難くありません。学習データからできるだけ遠くなるように制約をつけるとか、もしくは類似画像検索でヒットしないことを確かめるとか、別のアプローチが有効そうです。
ちなみに、自分の写真が学習データ(LAION-5B)に使われているか検索・チェックするサービスも登場しているようです。利用は自己責任で。
Have I Been Trained?
https://haveibeentrained.com/各所から法的に訴えられているStability AIにとっては不利な情報ですが、学習したデータをそのまま生成する可能性があること自体が悪いとは言えないでしょう。問題はそれを使う人が権利侵害をしてしまうかどうか、例えばこの人の写真を使って広告に貼り付けたりすれば問題になりますね。