検索結果
-
3.5特徴のない東京の駅弁を変える! 地方の名産を盛り込み、旅情たっぷりに仕立てるのが一般的な、駅弁のイメージだが、東京の場合はどうなのか? 本書は「冷めてもおいしい」という料理の異色ジャンルに足を踏み入れた一料理人の苦悩、試行錯誤、挑戦と、東京発の大ヒット駅弁を次々と生み出したプロセスを追うヒューマン・ドキュメント。 小林 祐一(こばやしゆういち) 東京都生まれ。(有)小林編集事務所代表。歴史紀行、文化財探訪などのジャンルを中心に取材・執筆・講演を行なう。近年の著書に『京都歴史探訪ウォーキング』『四国八十八カ所札所めぐりルートガイド』『秩父三十四カ所札所めぐりルートガイド』『もっと知りたい!江戸・東京歴史探訪ウォーキング』『日本名城紀行』『東京古寺探訪』など。法政大学エクステンションカレッジ講師、ほか、複数のカルチャースクール、旅行会社などで「旅と歴史」関連の講師を務める。 小林 裕子(こばやしひろこ) 新潟県生まれ。上智大学文学部卒業。出版社等で飲食店業界の専門誌の編集、健康情報誌の編集を経験し、フリーランスのライター・エディターに。現在、(有)小林編集事務所を主宰し、「人と仕事」「転職」「資格」「中高年世代のセカンドライフ」「福祉」といったジャンルを中心に編集・取材・執筆活動を行なっている。
-
3.0コンピュータビジョン研究の最先端をゆくトップランナーたちが織り成す季刊シリーズ創刊!! cvpaper.challengeおよびCVIM研究会全面協力のもと,最新トレンドのサーベイ,いま注目の最重要論文深読み,肝となる技術や理論のチュートリアルの3本柱で,実用性・信頼性のある最先端情報を,毎号ディープに解説。 創刊号のWinter 2021では,まず最新トレンドサーベイ記事「イマドキノCV」で近年のコンピュータビジョン分野において最重要と位置付けられる「データラベルの利活用」や「認識モデルの構築」を扱う。次に論文「フカヨミ」記事を3本掲載し,それぞれ,新規視点画像生成分野で2020年に登場したNeRF,画像処理分野の基本タスクである物体検出技術,いま最も伸びている3D認識アプローチのカテゴリレベル姿勢推定について取り上げる。最後に,チュートリアル記事「ニュウモンVision & Language」で,深層学習の発展とともに盛り上がりを増しているVision & Language(V&L)分野の概要と,現在どのような深層学習手法とその関連手法が使われているかを中心に詳しく紹介する。
-
-【最新動向サーベイ】 ・イマドキノ敵対的学習:敵対的学習とはどのような技術か、最新の敵対的学習ではどのような工夫がなされているか、などを、さまざまな応用手法を踏まえてわかりやすく解説。 【論文フカヨミ】 ・フカヨミ点群解析:3次元点群データがどのようなものであるか、また、点群データを解析する際に考慮しなければならない3つの性質について解説し、近年の点群解析手法がこれらの課題をどう解決しようとしているかを紹介。 ・フカヨミ数式ドリブン点群事前学習:3次元点群を用いた3D物体認識に焦点を置き、CVPR2022で提案された数式ドリブン点群事前学習であるPoint Cloud Fractal Database(PC-FractalDB)についてフカヨミ。 ・フカヨミ3次元物体姿勢推定:物体のRGB画像を用いた3次元物体姿勢推定と精緻化に主眼を当てながら、近年大きな進展を遂げている深層学習ベースの手法について解説。 【チュートリアル】 ・ニュウモン点群深層学習:深層学習を用いて点群データを処理する方法について、基礎となる技術・アイデアを解説し、それらに関する関連研究を俯瞰する。3次元点群を用いたアプリケーションについても簡単に紹介。 その他、4コマ漫画「みかんちゃんの日常」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】 ・イマドキノ一人称ビジョン:人の身体に軽量小型のウェアラブルカメラを装着し、装着者自身の視点から見た映像を撮影することで自身およびその周辺の環境を理解する一人称ビジョンについて、浅く広く、応用や実践も含めて紹介。 【論文フカヨミ】 ・フカヨミStable Diffusionと脳活動:Stable Diffusionと名付けられた潜在拡散モデルの各要素やプロセスが、脳内の活動とどのように対応しているかを探ることで、生物学的に拡散モデルの解釈を試みた研究について紹介。加えて、新たな深層学習モデルの訓練を必要としないシンプルなデコーディングの枠組みも提案。 ・フカヨミ音響情報のCV応用:本稿では音と画像を活用した研究をおおまかに、意味情報をもつ音響信号を用いて人物姿勢や画像を生成するモデルと、反響音から室内の3次元空間情報を推定するモデルに大別し、それぞれの代表的な研究について解説。 ・フカヨミ潜在空間で画像編集:表現空間における座標系に注目し、生成される画像を高品質に編集できる手法deep curvilinear editing (DeCurvEd) を紹介。 【チュートリアル】 ・ニュウモン拡散モデル:前々号(Summer 2023)掲載の「イマドキノ拡散モデル」では、拡散モデルの基礎を踏まえつつも、最新の研究動向を体系的に広く紹介することに主眼に置いた。今回はチュートリアル記事として前回よりさらに大きく紙面を割き、爆発的な進展の中で登場した数多くの技術の中でも特に広く使われているものを中心に、そのアイデアや技術の詳細を紹介。 その他、漫画「君も魔法をかけてみよう!」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】「イマドキノDNNの枝刈り」高性能で軽量なDNN(deep neural network)を作成するために、既存の大規模モデルの性能を維持しつつ、DNNのモデルサイズを圧縮する試みがある。そのアプローチの一つが、DNNの重みに対する枝刈りである。本稿では枝刈りに焦点を当て、モデルサイズを圧縮するための枝刈り技術の代表的な手法を紹介するとともに、より低い計算量で枝刈りを行うイマドキノ試みについても紹介。/「イマドキノマルチモーダルLLM」マルチモーダルLLM(MM-LLM)の包括的なサーベイを、最近の進歩に焦点を当てて紹介。モデルアーキテクチャを5つの構成要素に分類し、一般的な設計定式化と訓練パイプラインの概要を示したのち、様々な最先端のMM-LLMをそれぞれ特有の定式化により分けて解説する。 【論文フカヨミ】「フカヨミマルチカメラBEV認識」3次元のシーン理解を行うための認識技術の一例として、マルチカメラによるBEV(bird’s eye view; 鳥瞰視点)認識技術を解説。自動運転分野におけるBEV 認識の定義について筆者なりの解釈を述べ、マルチカメラBEV認識を理解に欠かせないコア技術として、画像をBEVに変換する視点変換のアプローチについて、いくつかの潮流に分けて説明。次にマルチカメラBEV認識の代表的な手法BEVDetとBEVFormerの2つを解説し、最新の技術動向をもとに今後の展望について議論する。/「フカヨミ計画指向End-to-End自動運転」自動運転システムにおけるDNNベースのアプローチで特に注目を集めているのがビジョンベースのEnd-to-End自動運転フレームワークである。UniAD は、End-to-Endフレームワークを発展させ、経路計画を念頭において設計を行う計画指向哲学を提案した研究である。本稿では、計画指向なEnd-to-End自律走行モデルについての研究動向と、UniADモデルの詳細について解説する。 【チュートリアル】「ニュウモン一人称ビジョン」『コンピュータビジョン Winter2023』掲載の「イマドキノ一人称ビジョン」に続く「一人称ビジョン」記事第2弾。本稿では、『Winter 2023』で扱いきれなかった個々の手法の詳細に重点を置いて解説。一人称視点映像を用いたタスクに取り組むためのテクニックや具体的なデータセット・モデルに焦点を当てた、より実践的な入門ガイドを提供する。 そのほか、マルチタスクをスピーディにこなすためのツールと仕事術を紹介する「CV人材のための作業効率アップ研究所(後編)」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」、漫画「Happy AI」を掲載。
-
-【最新動向サーベイ】 ・イマドキノNeural Fields:なぜNeural Fields はこのような盛り上がりを見せているのか? 従来の信号表現に比べてNeural Fields は何が面白いのか? などの問いについて、技術的な視点からわかりやすく解説。 【論文フカヨミ】 ・フカヨミ非グリッド特徴を用いた画像認識:CNNの内部ではシーンの表現に一様なグリッド状の特徴マップが用いられているが、実世界のシーンを特徴ベクトルの集合で表現する際は、グリッド状の均一な配置ではなく、情報の濃淡に応じた不均一な配置になるのが自然に思われる。このような発想に基づき、グリッドによらない特徴表現によってシーンを認識する手法を紹介。 ・フカヨミ一般化ドメイン適応:教師なしドメイン適応(UDA)の研究動向として近年数多く提案されている派生問題について述べたうえで、多様化するUDAの派生問題を統一的に扱う枠組みとして提案された一般化ドメイン適応(GDA)について、GDA提案者自らが丁寧に解説。 ・フカヨミバックボーンモデル:Vision Transformerもさまざまなタスクを解くためのバックボーンモデルとして活用されつつある。本稿ではVision Transformerを物体検出タスクなどのバックボーンモデルとして活用する手法をフカヨミ。 【チュートリアル】 ・ニュウモン微分可能レンダリング:微分可能レンダリングとはどのような発想に基づくものなのか、「微分可能」であることにどのような価値があるのかを説明し、具体的な応用を幅広く例示したうえで、微分可能レンダリングそのものの技術的課題と解決法、および微分可能レンダリング機能を提供するライブラリを紹介。 その他、4コマ漫画「えーあい*けんきゅうしつ」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】 ・イマドキノバーチャルヒューマン:XR分野におけるバーチャルヒューマンにかかわる技術の中でも、人間の全身構造や形状の把握に主眼を置いた代表的な研究について紹介。今後の見通しについても触れる。 【論文フカヨミ】 ・フカヨミオープンワールド物体検出:筆者らがECCV2022で提案したオープンワールド物体検出のための手法LDETについて解説。既存手法の欠点を克服するためのデータ拡張、および学習フレームワークを提案し、さらなる発展についても言及。 ・フカヨミマルチフレーム超解像:シングルイメージ超解像を含む超解像分野全体の概観から始め、マルチフレーム超解像に関する最新の研究について紹介。 ・フカヨミ深層単画像カメラ校正:1枚の入力画像のみで歪みと傾きを高精度に校正する深層単画像カメラ校正の研究動向を紹介し、高精度な深層単画像カメラ校正を実現した論文をフカヨミ。 【チュートリアル】 ・ニュウモンAutoML:深層学習のためのAutoMLとして、ニューラル構造探索(NAS)とハイパーパラメータ最適化(HPO)について、代表的な手法を取り上げて解説。 その他、漫画「訳わかめフューチャー」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】「イマドキノ微分可能レンダリング」イマドキノ微分可能レンダリングのうち、大きなブレイクスルーとなったGaussian Splattingを紹介。本記事により、NeRFやGaussian Splattingの性能の優劣ではなく、解きたいタスクで微分可能レンダリングが何をできるか、シーンに何が仮定できるのか、それによりどんな表現が適しているのかを、根拠をもって考えるきっかけを提供する。/「イマドキノ論文サーベイ」大規模言語モデルの応用方法の1つであるRetrieval-Augmented Generation(RAG)を活用した、論文サーベイツール“Crux”の開発と使用例について紹介。Cruxを使用することで、膨大な数の研究論文から必要な情報を効率的に抽出できる。 【論文フカヨミ】「フカヨミ正規化フロー」2024年2月に公開されたStable Diffusion 3は正規化フローの派生であるRectified Flowを用いており、生成タスクにおいて正規化フローの利用が加速すると予想される。そこで本稿では、正規化フローの基礎について解説し、正規化フローが用いられている最新研究を紹介。/「フカヨミ3D医療解析」3D医療画像分野におけるコア技術である事前学習について、昨今の基盤モデルの潮流も含めて解説。各手法についての詳細な説明というより、分野全体における網羅的なトレンドを“深読み”していくことを目的とする。 【チュートリアル】「ニュウモンイベントカメラ」“動きがあったこと(イベント)”の検出に特化した新しいデバイスであるイベントカメラ(event camera)について、その仕組みを含む基礎から始まり、多種多様な応用研究、実際に利用する際のコツについて解説。 そのほか、マルチタスクをスピーディにこなすためのツールと仕事術を紹介する「CV人材のための作業効率アップ研究所(前編)」、漫画「がんばれ!堀田くん」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-コンピュータビジョン研究の最先端をゆくトップランナーたちが織り成す季刊シリーズ第3号。最新動向のサーベイ、いま注目の最重要論文の深読み、肝となる技術や理論のチュートリアルの3本柱で、実用性・信頼性のある最先端情報を、体系的・網羅的にディープに解説。 最新動向サーベイ記事、「イマドキノ基盤モデル」では、Bommasaniらによって提案された基盤モデル(foundation model)の概念と、自然言語処理やコンピュータビジョン分野の基盤モデルを紹介し、基盤モデルの課題についても解説する。
-
-【最新動向サーベイ】 ・イマドキノ拡散モデル:拡散モデルに関する最近の研究動向を紹介。基本技術、条件付き生成への拡張、生成の高速化について述べ、拡散モデルを学ぶうえで役立つリソースを紹介。 【論文フカヨミ】 ・フカヨミCLIP:2020年にOpenAIの研究グループによって提案されて以降、さまざまなタスクで利用される基盤モデルとなっているCLIPについてフカヨミ。 ・フカヨミマテリアル画像キャプション生成:近年の代表的な画像キャプション生成手法の概要と課題、そしてその課題を解決するために筆者らがECCV2022で提案した高速かつ高精度な画像キャプション生成手法“GRIT”について解説。 ・フカヨミジェスチャー動画生成:これまでのジェスチャー動作生成手法に関する研究を分類しながら、主要技術と残された課題に触れ、その課題に取り組んだDisCoについての論文およびBEATについての論文の2本をフカヨミ。 【チュートリアル】 ・ニュウモン深層照度差ステレオ法:照度差ステレオ法の基本的な原理と、照度差ステレオ法の研究で現在主流となっているデータ駆動型の手法をわかりやすく解説。 その他、4コマ漫画「ふたり大学生」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-★特集:生成AI★ 最新動向サーベイ記事を3本に拡大してお届けする、生成AI特別号!! 日本語言語モデル、ロボティクス基盤モデル、生成AI開発&利用における法的留意点、それぞれのイマドキとは!? 【最新動向サーベイ】 ・イマドキノLLM構築:近年のLLMの進展を概観のうえ、LLMの事前学習からチューニングまでの各ステップにおける、経験的な知見や研究報告を紹介。 ・イマドキノRobot Learning:ロボティクス分野においても大きく注目されている「基盤モデル」がロボットマニピュレーションの発展にどの程度寄与するのかについて読み解く。 ・イマドキノ生成AIの法律問題:生成AIの開発段階および利用段階において、法的に留意すべき事項として特に重要となる(1)著作権の帰属・侵害、(2)肖像権・パブリシティ権の侵害、(3)個人情報を含むパーソナルデータの不適切利用、(4)秘密情報の漏えいの4点について、開発・学習段階と生成・利用段階に分けて解説。これら留意点を意識しさえすれば、生成AI開発・利用を踏み留まるほどの大きなリスクは見当たらないといっても過言ではないだろう。 【論文フカヨミ】 ・フカヨミテキストからの動作生成:近年、言語を用いた動作の検索、さらには生成までの研究が行われてきている。本稿では1人の動作生成について取り上げたうえで、筆者らによるテキストから2人の共同動作を生成する研究について紹介。 【チュートリアル】 ・ニュウモン自己教師あり学習による事前学習:自己教師あり学習による事前学習として、自己教師あり学習の概要と代表的な評価方法に加え、現在の主流となっている対照学習とMasked Image Modelingを中心とした代表的な手法について解説する。 そのほか、異分野へのCV技術応用を紹介する「コンピュータビジョンの学際研究」、Embodied AIについてミライとユメの双子姉妹が案内する「叡智の図書館」、マンガ「三次の国のアリス」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】 ・イマドキノ物体検出:物体検出は、画像認識の中でも重要なタスクの一つである。従来の典型的な物体検出の技術は成熟してきており、研究者はより発展的なタスク設定に取り組むことが増えている。一方で、物体検出は、実応用や他のコンピュータビジョンタスクで活用されることが多いが、それらの応用に物体検出は不要なのではないかという説が議論されるようになった。本記事では、最新の動向に焦点を当て、物体検出の広がり、そして終わりの可能性について紹介する。 ・イマドキノ局所特徴点マッチング:画像局所特徴とは、画像内の局所的なパターンなどの特徴を特徴ベクトルとして記述し、2画像間のマッチングに用いる手法である。本記事では、画像局所特徴として一世を風靡したSIFT について、どのような背景下で生まれ、どのように深層学習に至るまで発展を遂げたのかを振り返る。 ・イマドキノ3次元復元:撮影された画像からシーンの3 次元構造を推定するタスクはコンピュータビジョンにおける重要な研究分野であり、幅広い分野において活用されている。本記事では、大規模な3D データセットを学習し、2 枚の入力画像から3 次元点マップを推論するアプローチと、学習時に明示的な3D 教師データを必要としない、1 枚の入力画像から3 次元表現を推論するアプローチの2 種類を紹介する。 ・イマドキノ偏光CV:光は電磁波の一部であり、人間はそのさらに一側面しか知覚できない。一方で、偏光には、反射時のふるまいが電磁気学から理論的に導出できるなど、可視光にはない特徴がある。本記事では、偏光の基礎からその取り扱い方、最新研究など、現在の偏光CV を取り巻く状況を解説する。 【チュートリアル】 ・ニュウモン3D Gaussian Splatting:近年のグラフィックスハードウェアや自動微分フレームワークの進歩に伴い、NeRFや3D Gaussian Splatting(3DGS)などの新規視点合成技術が著しい発展を遂げている。3DGSは、高解像度の視点合成をリアルタイムで行うことができ、その高い表現能力と柔軟性から、形状復元や動的シーンのモデリングなど様々なタスクに応用されている。本記事では3DGS の原理およびその利点と課題を包括的に解説する。 そのほかに、最近研究者たちの間で密かなブームを呼んでいるモデルマージの手法をミライとユメの双子姉妹が案内する「叡智の図書館II」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-コンピュータビジョン研究の最先端をゆくトップランナーたちが織り成す季刊シリーズ第2号。最新動向のサーベイ,いま注目の最重要論文の深読み,肝となる技術や理論のチュートリアルの3本柱で,実用性・信頼性のある最先端情報を,体系的・網羅的にディープに解説。 第2号では,まず,最新動向サーベイ「イマドキノ動画認識」にて,畳み込みニューラルネットワーク(CNN)の動画認識への適用,Transformerをベースにした認識モデルについて紹介。論文フカヨミ記事3本では,単一の画像を入力とする単眼超解像(single image SR; SISR),ディープニューラルネットワーク(DNN)における課題となっている敵対的サンプル,画像を扱うためのTransformerであるVision Transformer(ViT)のそれぞれについて,基礎から分野のトレンドまで,重要論文を紐解きながら詳しく解説。最後にチュートリアル記事「ニュウモンVisual SLAM」にて,以前にも増して注目を集めているVisual SLAMについて(本記事では単眼カメラのVisual SLAMを取り上げる),発展の歴史と基礎を丁寧に解説する。
-
-【最新動向サーベイ】 ・イマドキノ植物とCV:植物分野にとってCVは非常に重要な要素技術であり、隣接分野の1つともいえる。本稿では植物分野におけるCVの現状を紹介しつつ、植物特有の興味深い挑戦性から生み出される新たなCV研究の方向性について考える。 【論文フカヨミ】 ・フカヨミEmbodied AI:言語と視覚情報を同時に扱いながら行動に結び付けるEmbodied AI のタスクの中でも難易度の高い、もの探しタスク(ObjectNav)について解説。 ・フカヨミマテリアルセグメンテーション:車両の自動運転・運転支援という文脈においては、マルチモーダル計測を活用した統計的機械学習に基づく素材認識は行われておらず、そのためのデータセットも存在していない。このような現状を打破すべく、マルチモーダル計測を備えた新たなMCubeSデータセットと、それを活用した素材認識ネットワークMCubeSNetを紹介。 ・フカヨミデータ拡張:画像データにおける一般的なデータ拡張から、モデルやデータに合わせて適切なデータ拡張方法を探索し、最適化するデータ拡張探索/手法について解説。 【チュートリアル】 ・ニュウモンニューラル3次元復元:ニューラル3次元復元の大きな枠組み、すなわちフレームワークを理解できるようになることを主な目標し、入力と出力の関係や要素技術の利点、問題点を整理する。その上で、それらのフレームワークを使いながら、どのように要素技術を組み合わせるべきなのかを解説。 その他、4コマ漫画「不思議な鏡」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】 ・イマドキノデザイン生成:コンピュータグラフィックス領域の技術が多分に活用されているグラフィックデザインの理解と生成において、個別の対象ごとにどのようなタスクが存在し、どういったアプローチが取られているのかを研究事例ベースで広く紹介。 【論文フカヨミ】 ・フカヨミ様々な入力と人物状態推定:人物の姿勢や形状などの様々な状態を推定するタスクである人物状態推定に関する研究を紹介。特に、計測対象人物(ユーザ)が計測用デバイスやマーカーなどを身につける必要がない非侵襲的な計測に基づき、かつ、一般的なRGB 動画像を入力としないものについて概説する。 ・フカヨミレイアウト生成:レイアウトと呼ばれる構図表現について紹介。まずレイアウトに関する基礎知識を述べた後に、利用者の意図に沿いながらレイアウトそのものを自動生成する研究の最近の動向と課題を紹介。そして筆者がCVPR2023 で発表した、LayoutDMという、 単一のモデルで様々な手がかりからのレイアウト生成を実現する手法について解説。 ・フカヨミAIに潜むバイアス:特にビジョンと言語の話題に的を絞り、DNN が持つバイアスについて議論する。まず、モデルが持つバイアスとは一体どのようなものなのかを明らかにし、その上で画像のキャプショニング(画像とテキストのペア) やVQA のデータセット自体が内包するバイアスを例示。その上で、画像のキャプショニングのタスクにおいてある種のバイアスを低減する手法を紹介する。 【チュートリアル】 ・ニュウモンData-Centric AI:Data-Centric AI(DCAI)が注目を集めるきっかけとなったAndrew Ng氏の講演「A Chat with Andrew on MLOps:From Model-Centric to Data-Centric AI」の概要について述べた後、DCAIにおける取り組みの中からデータセットの拡大と改善という2つの大きなテーマにフォーカスし、それぞれの代表的な手法を紹介。 その他、新たに参画したジュニア編集委員による「ココカラ研究者紹介」、漫画「ロット谷への降下」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-【最新動向サーベイ】「イマドキノロボット基盤モデル」大規模言語モデルや視覚言語モデルなどの基盤モデルの発展に伴って、ロボティクスにおいても認識や制御の部分で基盤モデルを活用する事例、また、ロボティクス領域での基盤モデルを構築しようとする事例が見られるようになってきた。本稿では、ロボティクス領域での基盤モデル、すなわち、ロボット基盤モデルを構築することを目的とした研究事例を中心に紹介する。/「イマドキノCV for Earth」環境問題の解決に向けて、画像認識技術がどのように利用されているのか、生物多様性と動物保護、森林保護、廃棄物・汚染管理、持続可能な農業と食糧生産の4つの分野に焦点を当てて紹介。それぞれの分野において研究者たちがどのように課題と向き合い、データをとり、手法を適用していったのかを解説する。/「イマドキノ音声合成」ニューラルネットワークを用いた大規模言語モデルの進展に伴い、音声の離散表現に基づくテキスト音声合成(TTS)手法が数多く提案されている。これらの手法は、単に高品質なTTS を実現するだけでなく、数秒から数分の限られた音声から、モデルの再学習を必要とせずにその声質や話し方を忠実に再現するゼロショットTTS を可能にしている。本稿では、これまでのTTS 手法の変遷について紹介し、近年提案されている言語モデルに基づくTTS の研究動向の解説をする。/「イマドキノマルチエージェント経路計画」グラフ上の複数エージェントに対し、互いに衝突のない経路を計算する問題はマルチエージェント経路計画(MAPF)と呼ばれ、多数の魅力的な応用がある。人工知能・ロボティクス分野で大きな注目を集めているMAPF 研究について、その経緯と最新の動向を紹介する。 【チュートリアル】「ニュウモン実世界情報と基盤モデル」Vision and Language 技術の進展により、画像認識とテキスト理解の双方が求められる画期的な手法やデータセットが開発され、これまでの画像とテキストの理解を超えて、画像、3D、そしてロボティクスを言語モダリティと結合する機運が高まっている。本稿では、大規模言語モデルや視覚言語モデルについて、その性質や課題を参照表現理解などの視点から解説し、3D 理解や実世界理解、ロボット基盤モデルなどのより複雑なモダリティの理解およびインタラクションの研究へのアプローチについて議論する。 そのほか、国内外から注目を集めているSakana AIのインタビュー記事や、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」、漫画「電脳探偵メタデンコ」を掲載。
-
-本書は、情報処理学会CVIM(コンピュータビジョンとイメージメディア)研究会主催で開催されたチュートリアル講演をもとに書かれた『コンピュータビジョン最前線』Winter 2021~Autumn 2022の連載記事「ニュウモン」4編をまとめたものである。新たに必要となった加筆・修正を施し単行本化した。 本書により、深層学習のブレークスルーにより新しい原理・技術が続々と提案され、日々進化し続けているコンピュータビジョン分野で話題の技術・アルゴリズムについて、原理から実践場面における実装までを体系的に学ぶことができる。 ・イマドキノバーチャルヒューマン:XR分野におけるバーチャルヒューマンにかかわる技術の中でも、人間の全身構造や形状の把握に主眼を置いた代表的な研究について紹介。今後の見通しについても触れる。 【論文フカヨミ】 ・フカヨミオープンワールド物体検出:筆者らがECCV2022で提案したオープンワールド物体検出のための手法LDETについて解説。既存手法の欠点を克服するためのデータ拡張、および学習フレームワークを提案し、さらなる発展についても言及。 ・フカヨミマルチフレーム超解像:シングルイメージ超解像を含む超解像分野全体の概観から始め、マルチフレーム超解像に関する最新の研究について紹介。 ・フカヨミ深層単画像カメラ校正:1枚の入力画像のみで歪みと傾きを高精度に校正する深層単画像カメラ校正の研究動向を紹介し、高精度な深層単画像カメラ校正を実現した論文をフカヨミ。 【チュートリアル】 ・ニュウモンAutoML:深層学習のためのAutoMLとして、ニューラル構造探索(NAS)とハイパーパラメータ最適化(HPO)について、代表的な手法を取り上げて解説。 その他、漫画「訳わかめフューチャー」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ロボットを思い通りに操るにはどうすればよいのか? アルゴリズム(PAD)、C言語(NXC)、NXT-SWを併記しており、相互に参照しながら、効率よくロボットプログラミングが、マスターできます。さらにもの作りの基本サイクルであるPDSサイクルを紹介、計画立案、評価方法など実例を挙げ解説。アイディアやグループ作業のコツなど、ロボコンで役立つ知識も習得できます。
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 本書ではLEGO Education SPIKEを用いたロボットプログラミングの方法を解説しています。初心者でも「基礎編」「応用編」の順に学習を進めていくことで、ロボットプログラミングを段階的にマスターできるよう構成。GUIプログラムとPython言語の開発環境が用意されているため、本書でも2種類のプログラムを併記しました。ものづくりを行う上で役に立つ理論・ノウハウをまとめた教科書として最適な1冊です。
-
-
-
4.01巻4,180円 (税込)※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 自動運転の要素技術を、第一線の著者陣により、わかりやすく解説。 本書は、自動運転の要素技術を、第一線の著者陣により、わかりやすく解説した書籍です。本書1冊で、自動運転にかかわる技術の全容と今後の課題をポイントを押さえて理解することができます。 自動運転技術は交通事故の減少、高齢者の移動支援、運転負荷の軽減や快適性の向上など、現在のさまざまな課題を解決する切り札として、大きな注目を集めています。 一方、自動運転技術は自動車工学、パワーエレクトロニクス、移動体通信工学、人間工学、センシング技術、そしてAI・機械学習技術など、まさに各分野における最先端の要素技術の集合体であるため、その全容をコンパクトにポイントを押さえて解説している書籍がいままでにありませんでした。 今後のキーテクノロジーとされる深層学習が自動運転技術において、どのように使われていくのかに焦点を当てながら、イメージに訴える平易な説明を心掛け、数式の使用を最小限に抑えて解説しています。 第1章 自動運転技術の概要 第2章 環境認識・予測 第3章 地図作成と自己位置推定 第4章 自動運転車の判断 第5章 縦方向と横方向の車両運動制御 第6章 複数台の協調制御 第7章 自動運転技術開発に使用されるツール 第8章 深層学習の基礎 第9章 深層強化学習 第10章 深層学習のノウハウ
-
3.2人工知能が俳句を詠む日はいつ訪れるのか。現在の人工知能はどこまでできて、できないのかを、俳句を詠むAIの開発を通して迫る! 突然ですが、 見送りのうしろや寂し秋の風 病む人のうしろ姿や秋の風 このふたつの俳句が松尾芭蕉と人工知能のどちらの作品かわかるでしょうか。 本書は、現在も精力的に研究の進む人工知能について、俳句の生成という視点から現在の研究・開発動向を解説するものです。コンピュータを用いた俳句の自動生成は1968年のCybernetic Serendipityというコンピュータアートの展覧会に端を発し、近年では小説を生成する「きまぐれ人工知能プロジェクト 作家ですのよ」などとともに、人工知能による文学生成研究のひとつとして進められています。俳句という身近でわかりやすいテーマであるため、TVや新聞などのメディアでも取り上げられるなど、人工知能による俳句生成は現在注目が集まっています。 本書では、実際に俳句を生成する人工知能である「AI一茶くん」を研究・開発している著者らが、現在の人工知能技術の動向から創作分野における人工知能の展開、俳句をどのように人工知能に解釈させ、生成するのかを具体的に解説します。そして「AI一茶くん」の活動の紹介を通して、現在の人工知能がどこまで達成し、なにができていないのかまで見ていきます。 人工知能がどんなことをできるのか気になる方、とくに人工知能の創造性について興味のある方にピッタリの1冊となっています。もちろん人工知能がどんな俳句を生成するのかが気になる俳句好きの方にもわかりやすく、ていねいに解説しています。 第1章 人工知能が俳句を詠む日 第2章 人工知能の歴史と未来 第3章 人工知能を実現する技術 第4章 人工知能と創作 第5章 俳句の人工知能的解釈 第6章 俳句を生成する人工知能、AI一茶くんの仕組み 第7章 AI一茶くんの活動 第8章 人工知能と俳句の未来 付録 AI俳句百句選
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 ますます活発化するスポーツとロボティクスのつながりと,その可能性についてわかりやすく解説.今後のロボティクスにおける多種多様な発展の方向性を提示 本書は,スポーツとロボティクス(ロボット工学)をかけ合わせるスポーツロボティクスについて,一からわかりやすく解説しています. ロボティクスの発展により,これをスポーツに応用していく取組みが多方面で進んでいます.人型ロボット(ヒューマノイドロボット)が典型的であるように,そもそもロボットには人間の物理モデルであるという側面があり,身体運動を扱ううえでスポーツと高い親和性を示します.一方,スポーツは身体運動そのものだけではなく戦術的な側面も合わせもちます.さらに,現実世界に介入できるロボティクスの強みを活かした応用も期待できます. これらを踏まえ,本書では大きく「身体運動の生成と解析」「戦術的行動の生成と解析」「対人競技ロボット」「人間・スポーツの拡張」の4つの視点から,スポーツロボティクスの基礎と現状,今後の展開について説明しています. ロボティクスの応用先としてのスポーツ,またはロボティクスの研究開発のゆりかごとしてのスポーツに注目している研究者,技術者,学生,および,ロボカップなどのロボット競技で活躍したい皆さんにとって有用な書籍です. 第1章 スポーツロボティクス概要 第2章 身体運動のシミュレーションと解析 第3章 戦術の生成と解析 第4章 対人競技ロボット 第5章 人間・スポーツの拡張
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 ソフトロボティクスの基本構成と数理モデルについて一から解説.これからのロボット工学にかかわるすべての研究者・技術者にとっての必読書 本書は,ロボット工学の重要なキーテクノロジーであるソフトロボット学(ソフトロボティクス)の基本構成と数理モデルについて,一からわかりやすく解説した書籍です. 従来のロボットが高剛性の身体,精密かつパワフルに動くサーボモータ,緻密にコーディングされた制御プログラムで構成されるのに対して,ソフトロボットはサステイナブルで粘弾性に富んだ身体をもち,精密ではなくても,これまで人間や従来のロボットがアクセス困難であった未知の環境や変化する環境に柔軟に対応してデリケートに動作し,メンテナンスが容易であるシンプルな制御プログラムで構成されます.しかし,これには,従来のロボットとは大きく異なる基本構成と数理モデルが求められます. 本書では,柔軟物体の数理と情報処理について一から詳しく解説したうえで,やわらかい機能性材料とデバイスについて述べ,また,ソフトロボットシステムの設計と制御についてわかりやすく解説しています.これからのロボット工学にかかわるすべての研究者・技術者にとって必読書といえる内容です. 序 章 ソフトロボットの概念 0.1 ソフトロボットとは何か 0.2 ソフトロボットの歴史 0.3 剛体ロボットからのソフトロボット学検討 第1部 柔軟物体の数理と情報処理 第1章 柔軟体モデリング 1.1 ソフトロボットの力学 1.2 弾性ロッド 1.3 柔軟曲面 第2章 やわらかい知能 2.1 やわらかい身体に制御をアウトソースする 2.2 脳-身体-環境系に対する力学系的アプローチ 2.3 やわらかい身体の情報処理能力 第2部 やわらかい機能性材料とデバイス 第3章 ソフトアクチュエータ 3.1 ソフトアクチュエータ概論 3.2 空圧ソフトアクチュエータ 3.3 イオン導電性高分子アクチュエータ 3.4 DEA 3.5 熱応答性材料 3.6 筋細胞アクチュエータ 第4章 やわらかいセンサ 4.1 やわらかいセンサの導入方法と種類 4.2 抵抗センサ 4.3 静電容量センサ 4.4 電場応答性センサ 4.5 磁気式触覚センサ 4.6 光学センサ 第3部 ソフトロボットシステムの設計と制御 第5章 設計指針と製作方法 5.1 ソフトロボットのつくり方 5.2 ソフトメカニズム 5.3 生物規範メカニズム 5.4 3Dプリンタを用いたソフトロボット製作 5.5 型成型 5.6 シート積層による曲げ構造 第6章 ソフトロボットの基本機能と制御 6.1 概 論 6.2 ソフトロボットハンド 6.3 連続ロボットアーム 6.4 インフレータブルロボット 6.5 ぜん動運動 6.6 飛行移動 6.7 遊泳移動
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ★ 語り継がれる伝説・歴史を詳述! * 「観音霊験記」の縁起解説 * 御朱印や御詠歌の予習に * 豊富な写真で見どころ案内 * 「観音霊験記」の縁起解説 ★ 巡礼道をわかりやすく解説! ! * 札所間の歩き方がわかる地図 * ルート上の目印や起伏を詳述 * 周辺の立ち寄り情報 etc. ◆◇◆ 本書について ◆◇◆ 各札所の紹介記事の前に、 そのひとつ前の札所から徒歩で移動してくる 「歩き巡礼」のルートを「巡礼道」として紹介しています。 徒歩の場合の歩行時間は1時間につき3㎞の移動を原則に、 坂道や山道などの状況を考慮して算出した標準的な時間を記しています。 地図は、原則としてひとつ手前の札所から該当の札所までの道のりと、 最寄りの駅またはバス停から札所までの範囲を掲載しています。 周辺の札所からの移動区間についても 地図上で参考にできるようにつとめました。 各札所の紹介ページには、 『観音霊験記』による縁起を囲み記事で紹介しました。 これは江戸時代末期に発表された、 百観音霊場を題材にした浮世絵で、 札所の縁起(由来)について物語り風に記したものです。 原文は古語なので、 文章は大意を意訳して紹介しました。 ◆◇◆ 主な目次 ◆◇◆ ☆ 秩父市東部と横瀬町の札所 *1番札所 四萬部寺 *2番札所 真福寺 *3番札所 常泉寺 *4番札所 金昌寺 *5番札所 語歌堂 *6番札所 ト雲寺 ・・・など ☆ 秩父市街地と周辺の札所 *12番札所 野坂寺 *13番札所 慈眼寺 *14番札所 今宮坊 *15番札所 少林寺 *16番札所 西光寺 *17番札所 定林寺 ・・・など ☆ 秩父郊外 荒川・小鹿野・皆野の札所 *23番札所 音楽寺 *24番札所 法泉寺 *25番札所 久昌寺 *26番札所 円融寺 *27番札所 大渕寺 *28番札所 橋立堂 ・・・など ※本書は2017年発行の 『秩父三十四ヶ所 札所めぐり 観音霊場巡礼ルートガイド』 を元に情報更新・一部必要な修正を行い、 改訂版として新たに発行したものです。
-
4.0大正14年(1925)11月1日、神田~上野間の高架鉄道が完成し、この日から山手線の環状運転が始まった。その山手線も、実は海あり、山あり、谷ありの起伏に富んだ地形に築かれた鉄道路線で、その成り立ちと進化はまた、東京の発展の歴史とも重なっている。江戸から東京へと変貌を遂げた明治維新の歴史、首都としての都市基盤の整備、そして戦後の復興の歴史……。そうした地形や歴史を訪ねながら電車に乗り、駅周辺を散策し、山手線29駅を探検する。 小林祐一(こばやしゆういち) 東京都生まれ。歴史紀行、文化財探訪などのジャンルを中心に取材・執筆・講演・TV出演等を行なう。近年の著書に『四国八十八ヶ所札所めぐり』『秩父三十四所札所めぐり』『日本名城紀行』『東京古寺探訪』『坂東三十三所札所めぐり』など。JR東日本大人の休日倶楽部をはじめ、東京都公園協会、ほか複数のカルチャースクールで「旅と歴史」関連の講師を務める。日本歴史学会、日本城郭史学会、交通史学会会員。