深層学習による画像認識の基礎作品一覧
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 CNNとViTによる画像認識を本格的に学ぶために! 本書は、深層学習(ディープラーニング)に基づく2つの技術、畳込みニューラルネットワーク(CNN)とVision Transformer(ViT)を通して、画像認識の基礎を実践例とともに解説するものです。 画像認識技術は、顔認証や異常検知など、現代社会に欠かせない技術として広く応用されており、研究開発も盛んに行われています。本書では、確かな理解のもとに画像認識技術の研究開発が可能となるよう、前半において理論的な基盤(深層学習の基本事項、畳込みニューラルネットワーク(CNN)、Vision Transformer(ViT))を、紙数を割いてわかりやすく解説していきます。また後半では、画像認識の基本的手法である物体検出と領域分割、学習データの大規模化に欠かせない自己教師あり学習を実例とともに解説し、最終章では今後ますます重要になると見込まれるVision and Languageのマルチモーダル処理を詳細に扱います。 全体を通して、擬似コードなどでアルゴリズムを把握できるようにしたほか、Python(PyTorch)のサンプルコードも用意し、読者自身が手を動かして画像認識を実践することができるようにしました。 第1章 画像認識の概要 第2章 深層学習の基礎 第3章 畳込みニューラルネットワーク 第4章 Vision Transformer(ViT) 第5章 物体検出 第6章 領域分割 第7章 自己教師あり学習 第8章 画像と自然言語