あさの畑

ランニングや自転車の記事、書評記事、人工知能や深層学習に関する記事、興味があること全部詰め込みブログです

【勉強記録】『画像認識』(原田達也著, 機械学習プロフェッショナルシリーズ) 難しすぎ…

勉強の記録です。

数日かけてようやく『画像認識』(原田達也著, 機械学習プロフェッショナルシリーズ)を読み終えました。

 

とは言え、内容が難しくて全然理解できなかったです。

 

内容紹介

とりあえず内容紹介をします。

第1章 画像認識の概要

第2章 局所特徴

第3章 統計的特徴抽出

第4章 コーディングとプーリング

第5章 分類

第6章 畳み込みニューラルネットワーク

第7章 物体検出

第8章 インスタンス認識と検索

第9章 さらなる話題

という構成です。

 

本文中には適宜図や表でまとめられており、体系的にまとめようという工夫は感じられます。しかし、数式もかなり多めです。

 

感想

数学を勉強しているような気分でした(笑)。機械学習を勉強していくにつれてだんだんと「あーやっぱり、数学が必要だな、、、」と思いつつあったのですが、この本も数式が多くて、個人的にはかなり難しかったです。

 

(僕は、機械学習の勉強を始めて1カ月半ぐらいで、大した知識もないまま深層学習で画像認識をやってみたので、そもそもまだまだ勉強不足であることは否めませんが…。)

 

画像認識に興味があって「もっと勉強したい!」と思い、手に取ったのですが、初心者には難易度が高めであったのかもしれないです。

 

「まえがき」には

画像認識に関する普遍的な知識をできる限り体系的にまとめ、画像認識の包括的な入門書として本書を執筆しました。

と書かれているのに…。

どこが入門書じゃい!

って感じです。

 

もっと具体的に、、、

第1章、第6章、第7章、第9章はしっかり読みました。それでも理解度は7割程度でしょうか。そのほかの章に関しては半分ぐらいしかわかりませんでした(泣)

 

第1章で画像認識の全体的なことがわかったのは良かったです。また、自分で深層学習で画像認識をしていたため、第6章は読みやすかったです。

(こちらの記事で詳しく書いているのでよろしければぜひ!→Deep Learningを用いた樹皮画像による樹種同定(Keras, CNN, 転移学習, VGG16)

 

興味を持ったところ

難しい難しいとは言っていますが、おもしろそうなことや今後自分でやってみたいこともいろいろありました。

 

まず1つ目は、「セマンティックセグメンテーション」です。「画像内の物体クラスとその輪郭まで正確に推定すること」だと書かれています。

物体検出の進化系みたい(?)だと感じました。学習のさせ方など具体的なことはあまり書かれておらずまだわからないことだらけですが、一度自分でやってみたいです。

 

もう1つが、「GAN」です。これは画像を生成するんですね。これもめちゃくちゃ面白そうなのでぜひ自分でやってみたいと思いました。

 

今後に向けて

・「セマンティックセグメンテーション」と「GAN」について勉強する

・根本的に数学の勉強をする

といった感じです。まだまだ勉強することがいっぱいです。

 

 

この前、「エンジニアは一生勉強中だからプロフィールは「〇〇勉強中」ではなく「エンジニア」と言い切ったほうがいい」というようなことをどなたかがTwitterで言っておられました。

 

一生勉強中なんですね…。まあそれも悪くないような。