作品一覧

  • CVIMチュートリアル1 Vision and Language/Visual SLAM/CMOSイメージセンサ/微分可能レンダリング
    -
    1巻3,960円 (税込)
    本書は、情報処理学会CVIM(コンピュータビジョンとイメージメディア)研究会主催で開催されたチュートリアル講演をもとに書かれた『コンピュータビジョン最前線』Winter 2021~Autumn 2022の連載記事「ニュウモン」4編をまとめたものである。新たに必要となった加筆・修正を施し単行本化した。 本書により、深層学習のブレークスルーにより新しい原理・技術が続々と提案され、日々進化し続けているコンピュータビジョン分野で話題の技術・アルゴリズムについて、原理から実践場面における実装までを体系的に学ぶことができる。 ・イマドキノバーチャルヒューマン:XR分野におけるバーチャルヒューマンにかかわる技術の中でも、人間の全身構造や形状の把握に主眼を置いた代表的な研究について紹介。今後の見通しについても触れる。 【論文フカヨミ】 ・フカヨミオープンワールド物体検出:筆者らがECCV2022で提案したオープンワールド物体検出のための手法LDETについて解説。既存手法の欠点を克服するためのデータ拡張、および学習フレームワークを提案し、さらなる発展についても言及。 ・フカヨミマルチフレーム超解像:シングルイメージ超解像を含む超解像分野全体の概観から始め、マルチフレーム超解像に関する最新の研究について紹介。 ・フカヨミ深層単画像カメラ校正:1枚の入力画像のみで歪みと傾きを高精度に校正する深層単画像カメラ校正の研究動向を紹介し、高精度な深層単画像カメラ校正を実現した論文をフカヨミ。 【チュートリアル】 ・ニュウモンAutoML:深層学習のためのAutoMLとして、ニューラル構造探索(NAS)とハイパーパラメータ最適化(HPO)について、代表的な手法を取り上げて解説。 その他、漫画「訳わかめフューチャー」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。

    試し読み

    フォロー
  • Vision Transformer入門
    -
    ※PDF版をご希望の方は Gihyo Digital Publishing (https://gihyo.jp/dp/ebook/2022/978-4-297-13059-6)も合わせてご覧ください。 自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて,ディープラーニングではスタンダードとなっているRNN,CNN,および既存手法を用いた処理精度を上回ることが確認されています。 本書は注目のViTの入門書です。Transformerの成り立ちからはじめ,その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク,ViTから派生したモデルを紹介したあと,TransoformerとViTを分析し,その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。

新規会員限定 70%OFFクーポンプレゼント!