Kaoru Honda | 本多 郁
課題はあるが、まだ手法が定まっていない──そんなAI R&Dフェーズから、仮説検証と定量評価を通じて技術的な意思決定を支援します。
研究と実装の間をつなぎ、制約下で“動くAI”へ落とし込む Independent AI R&D Engineer です。
Deep Learning(深層学習)を基盤に、Transformer / CNN ベースの Computer Vision を中心とした AI研究開発を、仮説立案・実験設計から実装評価まで一貫して担当します。
- Computer Vision R&D:課題定義・論文調査から入り、複数モデルを比較・優先順位付けしながら、学習・ファインチューニング・モデル改良を含むR&Dを一貫支援
- Computer Vision(製造業向け):異常検知・物体検知・セマンティックセグメンテーション・エッジ検出・テキスト検出/認識などを、現場データ特性を踏まえて研究開発
- Computer Vision(自動運転・車載):Transformerベースの単眼深度推定モデルを対象に、NVIDIA Jetson / TensorRT 環境での高速化を目的とした Edge AI を研究開発
- Edge AI / NVIDIA:NVIDIA Jetson / CUDA / TensorRT 環境において、推論最適化を通じて実運用可能な設計判断を支援
Services(提供できること)
1) Computer Vision R&D(研究開発・評価)
Deep Learning / Transformer / CNN ベースのCVモデルを対象に、R&Dフェーズの意思決定を支援します。
- 論文調査・アーキテクチャ理解を前提に課題を構造化
- 顧客データの特性に合わせてモデル内部に切り込み、学習・ファインチューニング・モデル改良を含む比較実験を実施
- 定量評価にもとづき、再現性のある評価レポート/設計指針として整理
2) Edge AI / 推論最適化(実装・高速化)
Jetson Orin / TensorRT, PyTorch→ONNX→TensorRT における高速化・設計指針化。
- NVIDIA Jetson / CUDA エコシステム:Jetson Orin を中心に、NVIDIA GPU 上での推論最適化を実施
- TensorRT 最適化:解像度設計・量子化(INT8 PTQ)・TensorRT FP16 を段階検証
- 低レベル最適化の検証:cuDNN / cuBLAS / cuBLASLt などの tacticSources を制御し、速度差を定量評価
- 速度/精度/開発コストのトレードオフを整理し、設計指針として提示
3) 産業向け Computer Vision R&D(製造業)
製造現場の厳しい撮像条件・データ特性を前提に、モデル改良と評価を一体で回し、実運用に耐える設計判断を支援します。
- 教師なし異常検知・物体検知・セマンティックセグメンテーション・エッジ検出・テキスト検出/認識などの課題設定と複数手法の比較検証
- 失敗例から原因を仮説化し、モデル内部(前処理/損失関数/アーキテクチャ等)を改良 → 学習・ファインチューニング → 評価を反復
- エッジ実装を見据えたモデルの軽量化・形式変換(TFLite, ONNX, TensorRT)や運用制約を踏まえた設計
Selected Work
車載向け 単眼深度推定(Deep Learning / Transformerベース)の推論最適化 — 実運用を想定した大幅な高速化(2025/08–2026/01, NDA)
NVIDIA Jetson CUDA TensorRT Edge AI Pytorch Transformer ViT Monocular depth estimation 単眼深度推定 自動運転・車載 高速化
概要: 自動運転・ADAS 領域で用いられる単眼深度推定モデルに対して、 再学習を行わず、推論側の設計変数に着目した Edge AI 向け最適化 R&Dを実施しました。
- 設計アプローチ: 入力解像度、量子化、推論バックエンド設定など、 学習以外の複数の最適化レバーを段階的に切り分けて検証
- 定量評価: 速度・安定性・精度のトレードオフを 共通条件下で比較し、 「どの手法が効き、どこから先は費用対効果が低いか」を整理
- 技術的知見: Transformer 系モデルでは、 量子化よりも別の設計要因が支配的になるケースがあり、 モデル特性に応じた最適化戦略が必要であることを確認
- NVIDIA スタック理解: TensorRT のビルド設定や内部実行計画(CUDA / cuDNN / cuBLAS 系)を 設計変数として扱い、 ブラックボックスにしない最適化判断を実施
製造業向け Computer Vision R&D(Deep Learning / CNN・Transformerベース)(2022/10–2025/03, NDA)
Deep Learning CNN Transformer ViT Computer Vision Edge AI TFLite ONNX 教師なし異常検知 物体検知 セマンティックセグメンテーション エッジ検出 テキスト検出/認識 特徴点マッチング
概要:製造現場の厳しい撮像条件下における画像データを対象に、CNN および Transformer ベースの深層学習を用いた異常検知・エッジ検出・テキスト認識などについて、モデルをブラックボックスとして扱うのではなく、内部構造を理解した上でケースごとに改良方針を立て、学習・ファインチューニング・モデル改良・評価を一体として反復するR&Dフェーズを一貫して支援しました。
- 原因分析:失敗例・誤検出の傾向を分析し、ボトルネックを仮説化(データ特性/前処理/モデル構造)
- 改良と学習:事前学習モデルを起点に学習条件・構成を調整し、必要に応じてアーキテクチャや損失を含めて改良
- 定量評価:ケースごとに評価指標を揃え、改善効果を検証(比較実験・再現性重視)
- エッジ視点:運用制約を踏まえた軽量化や形式変換(例:TFLite)も含めて検討
データサイエンス/意思決定支援(要約)
- 時系列分析・因果推論・予測モデル(例:アパレル領域のトレンド分析・宿泊予約売上予測モデルの構築など)
- CIO(宿泊施設)としてIT戦略とデータ活用(2019–2022)
Product:SkyWalking(登山GPS・オフライン地図)
- 国土地理院 防災アプリコンテスト:防災アプリ賞(2016/2017)
Credentials(学位・受賞・発表)
- 京都大学大学院 情報学研究科 社会情報学専攻 修士 (M.S. in Informatics)
- 受賞:国土地理院 防災アプリコンテスト 防災アプリ賞(2016/2017)、文化庁メディア芸術祭 審査委員会推薦作品(2004)
- 著書(抜粋):『Papervision3Dではじめる Flash3Dアニメーション』(技術評論社, 2009)ほか
発表(抜粋)
過去の発表(さらに表示)
Research / Notes(リンク集)
Independent Research(自主研究)
業務とは独立して、純粋な科学的関心にもとづき取り組んでいる研究テーマです(成果の社会実装は分野全体として発展途上)。
気象予報AI(GraphCast / ECMWF AIFS など)の公開データ解析・評価
- GraphCast(GNN型全球予報)の Colab デモ実行:推論→可視化→簡易評価の流れを確認
- AIFS(operational)と GraphCastGFS(experimental)の位置づけ整理と Open Data 取得
- Herbie + ERA5 を用いた「同一init/同一変数で比較する」評価パイプラインの試作(例:Z500, MAE/RMSE)
About
京都大学大学院 情報学研究科 修士課程修了 (M.S. in Informatics)。2000年代から途切れなくソフトウェア開発に携わり、時代の変化に合わせて技術領域を更新し続けてきました。2020年頃よりDeep Learning(深層学習)を基盤に、Transformer / CNN ベースの Computer Visionを主軸として、研究開発フェーズでの仮説立案・実験設計・実装評価・推論最適化(Edge AI)を横断して支援しています。また、気象予報AI(GraphCast / ECMWF AIFS など)についても業務とは独立して継続的に調査・評価し、公開データを用いた試作・検証や勉強会での共有を行っています。日本企業・研究開発組織の意思決定プロセスや長期運用の制約について豊富な経験を有しており、先端技術を“運用に耐える形”へ落とし込むことを得意としています。
Timeline(主要)
Personal(趣味・座右の銘)
- 趣味:登山/水泳/テニス/旅行/京都探索/読書/ピアノ
- 関心:AIと人類・社会・文明/気候変動・脱炭素化社会・再生可能エネルギー・地球史
- 座右の銘:“Stay hungry, stay foolish.”