新着Pick
88Picks
Pick に失敗しました

人気 Picker
word2vec, doc2vecなどの単語・文章の分散表現 (特徴量化)の学習には、Wikipediaが積極的にデータを公開していることもあり、よく使われるのですが。。。
AIで作ったデータをAIが学習する、なんてことになると現時点ではおかしなことになりそう。おかしなこととは、例えば学習データを増やしているのに一向に精度が高くならないなどのことを指します。
事実の更新の視点だと5段階で4との事ですが、この精度が高まり主観なく事実のみが更新され続けていくとすると、Wikipediaへの訪問頻度も高まりそうですね。
Wikipediaが人の手を離れる第一歩かな。。。
人類が絶滅しても更新し続けたりして。。。
>将来的にAIの精度が向上すれば、たとえばインターネット上の新しい情報から自動的にフェイク成分を除去し、記事を書き換える

と予測されていますが、自動的にフェイク成分を混ぜていく可能性もある訳で、Wikipediaの内容を鵜呑みにしている人が一定数いる以上、こうやってAIが人間を支配し始めるのかなと感じざるを得ませんね。
やめて。Wikiのデータは人の手で作る資産。そこには想定外の お宝データを含むので、AIの安直な平均化は お宝を汚すかの様です。AIは精々プルリクエスト位にしておいて欲しい。
Wikiではない所でこの技術が使われると生産性が上がる領域もありそうだな。