近年特に盛り上がりを見せているディープ・ラーニングによる画像認識。このGIFでは映像に何が写っているか?を自動記述しています。サンプルにはアニメAKIRAやCNNニュースが使われていますが、AKIRAのような非日常的な映像はまだまだ苦手なようで「a pair of scissors and a pair of scissors」なんて言っております。しかしニュース映像の認識率はなかなかのものです。
ライブラリはPython+オープンソースのNeuralTalkがベース、さらにNeuralTalkAnimatorにて動画対応したもの。
莫大なCPUパワーと大量のサンプルがあれば、どんどん賢くなって認識率は上がっていく訳ですが、そう遠くない未来には、一枚の写真から信じられない情報を引き出してくれそうです。