English version /Japanese version
Updated: 2014/5/13

研究内容

最近の研究: 以前の研究:


研究の背景となる理論:

研究上の私見:



不整地環境における車両の走行経験を反映した環境認識

本研究では,ロボット自身が運動して得た情報にもとづいた画像情報からの特徴抽出にもとづく柔軟な環境認識法を提案する.カメラ,レーザーレンジファイダ(LRF)などを搭載した自律移動ロボットのナビゲーション問題において,距離計測にもとづく3 次元形状認識では識別しにくい走路上の障害物を,画像特徴と走行経験の相関抽出にもとづいて認識する方法を提案する.これにより,「走りやすいかどうか」「どのように走行すれば走りやすいか」を識別・判断しながら賢く移動できるロボットを実現する.


想定する屋外の不整地環境 実験用移動ロボット(上図)と画像特徴抽出のためのフィルタの例(下図)

関連文献:

  1. Mohammed Abdessamad Bekhti, Soudai Tanaka, Yuichi Kobayashi, Toru Kaneko,Image Feature-based Traversability Analysis for Mobile Robot Navigation in Outdoor Environment,日本機械学会ロボティクス・メカトロニクス講演会,1P1-C06, May. 2014.(発表予定)

未知不整地環境における無人車両の自律制御

未知の(地図を持たない)不整地環境において,目標地点の情報と近傍の観測情報のみにもとづいて賢く判断しながらナビゲーションを行う手法を提案する.LRF(レーザーレンジファインダー)の情報をもとに,走路かどうかを判別し,判別結果をもとに経路を生成し走行する.分岐に来た時,どちらの経路を選択するべきかを過去の最適制御の経験をもとに判断し,単純に目標地点に近い方を選ぶという方策よりも賢い経路選択方法を提案する.実際の不整地環境をもとに構成したシミュレータおよび実機車両を用いて提案制御法を検証する.

シミュレータ環境における自律走行 走路判別とナビゲーション

関連文献:

  1. 須永賢治,小林祐一,平松裕二,藤井北斗,神谷剛,屋外不整地環境における無人車両のための走路判別,精密工学会誌,Vol. 79, No. 11, (項未定), Nov. 2013.
  2. 近藤 正人,小林 祐一,金子 透,平松 裕二,藤井 北斗,神谷 剛志,未知屋外不整地環境での無人車両ナビゲーションにおける局所地形特徴量にもとづく経路選択法,第31回日本ロボット学会学術講演会予稿集,2K2-052013.


視覚特徴間の依存関係による状態識別と運動生成

視覚入力の中から,「関係のあるもの」と「関係のないもの」を識別する過程を自律的に獲得できるロボットの学習法を提案する.ロボット身体や背景・物体に関する視覚的特徴や空間中の位置関係などに関する事前知識を用いずに,特徴間の位置変化や遮蔽による消失などの情報だけをもとに離散的な状態識別を行う.抽出を行った身体及び物体の特徴クラスタから,関節角度に対する条件付き確率を用いて位置予測を行うことで,リーチングや回避などの行動生成につなげられる.

確率的な依存関係を用いた状態識別の例 視覚特徴間の依存関係を表すネットワークの生成例

関連文献:

  1. Takayuki Somei, Yuichi Kobayashi, Akinobu Shimizu and Toru Kaneko, " Clustering of Image Features Based on Contact and Occlusion among Robot Body and Objects", Proceedings of the 2013 IEEE Workshop on Robot Vision (WoRV2013), 2013.
  2. 染井貴之,小林祐一,清水昭伸,金子透,"重点サンプリングによる探索を利用した空間認知のための視覚特徴クラスタ統計学習,” 30回日本ロボット学会学術講演会予稿集,AC3N1-4, 2012.

力覚センサ情報を用いたヒューマノイドロボットによる物体抱え上げ動作の教示

本研究では,事前に取得した様々な姿勢での成功・失敗例を力覚センサとともに収集し,それにより構成される特徴空間を用いた動作生成法を提案する.オフラインで取得した抱え上げ姿勢およびそのときの力覚センサ情報を用いて特徴空間を構成する.オンラインでは,得られた特徴空間を用いて,必要に応じて抱え上げ姿勢を修正し,抱え上げ動作の成功率を向上させる.提案手法をヒューマノイド型ロボットにより検証する.

力覚情報の特徴空間への射影を用いた
抱え上げ姿勢の修正法の概念図

ヒューマノイド型ロボットによる
抱え上げ行動のシミュレーション評価

関連文献:

  1. S. Uematsu, Y. Kobayashi, A. Shimizu, T. Kaneko, Prediction of object manipulation using tactile sensor information by a humanoid robot, Proc. of IEEE Int. Symposium on Robotic and Sensors Environments, 37-42, 2012.
  2. 植松重之,小林祐一,清水昭伸,金子透,"体性感覚情報を用いた抱え上げ動作達成の認識と予測,” 第30回日本ロボット学会学術講演会予稿集,AC3N2-3, 2012.
  3. 小林祐一,坪田真延:"教示データからの特徴空間の構成にもとづく力覚情報を用いた抱え上げ行動の生成," 日本機械学会ロボティクス・メカトロニクス講演会Robomec2011,1A1-O09, 2011.

身体運動・物体運動におけるモードの抽出と計画空間シフト学習

ロボットが物体を含んだ系で多様な行動を計画・制御するためには,状態空間の高次元化,ロボット身体,物体挙動の複雑化などが問題となり,学習により実用的な振舞いを生成するロボットは未だ実現されていない.計画空間シフト学習はこのような問題に対して,多様な変数のうち注目する変数を抽出・グループ化し,そのグループ同士の関係から「運動モード」を生成することで高次元の運動生成問題を低次元の問題に分割することを提案している.各運動モードごとに変数群の間の運動の関係を学習し,モード遷移を含めた総合的な運動計画を行うことで,多様な運動を統一的な枠組みのもとで生成可能な枠組みを提案した.これにより,障害物を回避して目標位置にロボット身体を移動させる行動,物体を操作して目標位置に運ぶ行動,物体を道具として利用して別の物体を目標位置に運ぶ行動,などの異なる種類の運動が統一的な枠組みのもとで学習により実現可能であることを示した.


物体の軌道計画,身体運動の計画の分離に
もとづく動作生成の概念

身体運動のみのモード,物体と身体が同期して動くモード,等の複数のモードの抽出
及びモード遷移を含めた動作計画
モードの遷移を考慮した目標位置への
物体の押し操作行動の生成

L字型の物体を道具として利用した物体の引き寄せ動作の生成

関連文献:

  1. Yuichi Kobayashi and Shigeyuki Hosoe, Planning-Space Shift Motion Generation: Variable-space Motion Planning: Toward Flexible Extension of Body Schema, Journal of Intelligent and Robotic Systems, volume 62, issue 3-4, 2011.
  2. Yuichi Kobayashi and Shigeyuki Hosoe, ``Planning-Space Shift Learning: Variable-space Motion Planning toward Flexible Extension of Body Schema,'' Proc. of IEEE/RSJ Int. Conf. on Intelligent Robot and Systems, 373-379, 2009.
  3. 小林祐一,細江繁幸: "動作計画空間の動的変更の可能な対象物操作の行動学習法", 第19回自律分散システム・シンポジウム資料, 95-100, 2008.

滑り・非滑りの接触モードの切り替りをを考慮した対象物操作の学習

物体を操作する行動は,環境と物体,ロボットと物体との間の接触をともなうため正確な事前のモデル化が困難である.本研究では,接触に関する物理モデルの知識を埋め込むことなく,ロボット自身の試行錯誤から滑り・非滑り(stick/slip)の判別を学習し,望ましい動作を生成する学習法を提案する.提案する考え方は,制御入力に対する接触モードの切り替りをパタン分類学習法(Support Vector Machine,SVM)により獲得し,それと最適制御を組み合わせることにより適切な動作を生成することである.最適制御の方法としては強化学習,モデル予測制御などを用い,学習により得やすい情報を既知情報として用いることで,効率よく動作を獲得する方法を提案した.


物体の抱え上げ動作,滑り・非滑りを切り替えた物体の引き寄せ操作の獲得
階層型学習器とSVMによる接触モード境界の学習の組合せ

モデル予測制御と線形SVMによる物体回転操作の実現

関連文献:

  1. 篠田真也,小林祐一,植松重之:``モデル予測制御による接触モデルを学習・修正可能な物体操作法”,第24回自律分散システム・シンポジウム資料,151-156,2012.
  2. 篠田真也,小林祐一,高崎雄太,河原井伸行:``接触モード境界推定に基づいたモデル予測制御による対象物操作'', 計測自動制御学会システム・情報部門学術講演会2010講演論文集,1944-1947, 2010.
  3. Nobuyuki Kawarai and Yuichi Kobayashi, Learning of whole arm manipulation with constraint of contact mode maintaining, Journal of Robotics and Mechatronics, Vol. 22, No.4, 542-550, 2010.
  4. Yuichi Kobayashi, Masashi Shibata, Shigeyuki Hosoe and Yoji Uno, ``Learning of Object Manipulation with Stick/Slip Mode Switching,'' IEEE/RSJ 2008 Int. Conf. on Intelligent Robot and Systems, 373-379, 2008.

ロボットの運動生成のための画像からの身体・物体情報の抽出

多様に変化する実世界でロボットが活躍するためには,問題に特化した設計によらずにロボット自身の試行錯誤から認識・行動を獲得するアプローチが重要であると考えられる.本論文は,2関節マニピュレータによる障害物回避行動を例にとり,身体・障害物の位置・形状などの事前知識を利用せずに画像から行動生成のために必要な低次元視覚特徴をボトムアップに獲得する方法を提案する.まず運動指令前後の画像間のSIFTマッチングにより,身体に関係する特徴点を抽出する.得られた動き情報からヤコビ行列の推定し,状態遷移予測モデルを生成する.この状態遷移予測モデルにもとづき,障害物との接触により予測モデル通りに運動できない状況を特徴づける特徴点を衝突に関係した特徴として獲得し,予測モデルの切り替えに用いる.状況に応じて予測モデルを切り替えながらモデル更新型動的計画法により適切な動作を生成する. 実機マニピュレータと障害物を含んだ実画像を用いた実験を行い,リーチングタスクおよび障害物回避タスクにおいて,身体特徴の発見,状態遷移モデルの生成とそれを利用した動作生成,衝突に関係した特徴の自律的抽出が達成できていることを確認した.


物体との衝突に関する特徴の自律的抽出と運動生成

試行錯誤による身体・物体の抽出とそれを利用した物体操作

関連文献:

  1. 浅水喬大,小林祐一,対象物操作行動の計画と生成に基づいたロボットの身体と対象物表現の獲得,日本ロボット学会誌,Vol.29, No. 2, 172-183, 2011.
  2. 岡本太一,小林祐一,大西正輝,ロボットの障害物回避行動生成における画像特徴の獲得,日本ロボット学会誌,Vol.28, No. 10, 1213-1222, 2010.
  3. Taichi Okamoto, Yuichi Kobayashi and Masaki Onishi, Acquisition of Body and Object Representation Based on Motion Learning and Planning Framework, Proc. of the 9th Int. Conf. on Intelligent Systems Design and Applications, 737-742, 2009.
  4. Takahiro Asamizu and Yuichi Kobayashi, Acquisition of image feature on collision for robot motion generation, Proc. of the 9th Int. Conf. on Intelligent Systems Design and Applications, 1312-1317, 2009.

複数・異種センサによる観測行動の統合による状態空間の生成

未知環境で動くロボットの活動範囲を広げるためには複数のセンサを搭載することが有効であるが,一般にセンサには観測範囲の制限が存在し,観測可能な範囲が重ならない複数のセンサを利用してロボットの動作を生成することは簡単ではない.本論文では,センサ観測と世界座標系でのロボットの運動の関係が未知であるという前提のもと,観測範囲に制限のある複数のセンサの情報を利用して行動を生成する方法を提案する.提案法では,各センサに関する運動指令に対するセンサ観測値の変化(Jacobi行列)を推定し,これを拡散学習にもとづいて仮想的に外延することで,観測範囲外でのセンサの値を仮想的に推定できる.このように外延により得られた観測値と別のセンサの観測値との間の対応をとることで,観測可能範囲の重ならない複数のセンサの観測空間を統合し,行動を生成する.提案する行動生成法を2種類のロボット制御問題に適用し,有効性を検証した.手先に距離センサを搭載し,手先位置をカメラで計測できるマニピュレータによる床へのリーチング行動,カメラおよび腹側に距離センサを搭載した移動ロボットによる壁沿い走行位置へのリーチング行動,という2種類の行動生成問題において,カメラの視野範囲内から視野範囲外に出て,距離センサが望ましい値をとる状態まで動作生成を行うことが可能であることを確認した.


図左:センサ(i)の観測可能範囲からセンサ(j)の観測可能範囲への運動の生成
図中央:適用例(1):カメラによる手先の観測,手先に取り付けた距離センサによる床までの距離の計測
図右:適用例(2):カメラと距離センサを搭載した移動ロボットによる壁に正対した状態からの壁沿い姿勢へのナビゲーション

関連文献:

  1. 栗田英介,小林祐一,郷古学,不完全な知覚のセンサ同士の統合によるロボットの行動生成,計測自動制御学会論文集, Vol. 47, No.4, 191-199, 2011.
  2. Eisuke Kurita, Yuichi Kobayashi, Manabu Gouko, Motion Generation by Integration of Multiple Observation Spaces for Robots with Limited Range of Observation, 2011 International Conference on Control, Robotics and Cybernetics, Vol.1, 86-90, 2011.
  3. 栗田英介,小林祐一,郷古学:``観測範囲に制限のあるセンサを搭載したロボットの学習にもとづいた行動生成法'', 計測自動制御学会システム・情報部門学術講演会2010講演論文集,1515-1518, 2010.

人と接するロボットのための最適制御・最適化にもとづく行動設計

家庭環境などで人と接するロボットには,衝突回避や人との対話などの複数のタスクを同時に実行することが求められる.本論文では,人の動きによる不確実さを考慮した複数の人と接するロボットタスクの設計法を提案する.提案法ではまずpetri-netを用いた複数並行タスクの設計を行い,マルコフ決定過程での表現に変換して,最適制御および最適化の枠組みを用いたタスクの調停を行う.また,人の挙動による不確実さを扱うために人の存在確率の推定や人の発話確率モデルを導入する.提案法により,if-thenルールにより記述されてきた行動調停が統一的な枠組みで記述される.安全確保タスクと対話タスクという二つのタスクを実ロボット上で実装し,人の動きに応じた首振り行動が実現できることを確認した.また,複数タスクに関する重みづけパラメータを変化させることでロボットの挙動を安全確保および対話それぞれのタスクの間の調停が実現できることを確認した.

Petrinetを用いたタスクの表現 人の動きまわる環境下でのロボットの観測行動評価実験

関連文献:

  1. 小林 祐一,大西 正輝,細江 繁幸,羅 志偉,``人と接するロボットのための並列タスク設計への最適化によるアプローチ,'' 日本ロボット学会誌 Vol. 27, No. 10, 1132-1143, 2009.
  2. Yuichi Kobayashi, Masaki Onishi, Shigeyuki Hosoe, Zhiwei Luo, ``Behavior Design of A Human-interactive Robot through Parallel Tasks Optimization,'' Proc. of the 9th International Symposium on Distributed Autonomous Robotic Systems (DARS2008), 2008.
  3. 小林祐一, 大西正輝, 細江繁幸, 羅 志偉: "人と接するロボットのための認識・対話設計法-Petri-net と最適制御からのアプローチ", 第25回日本ロボット学会学術講演会予稿集, 1E361, 2007.

群移動ロボットによる協調捕獲行動の自律分散制御

自律分散型群ロボットシステムには,局所的な観測のみから全体としての秩序を形成することによる,観測・通信コストの低減や柔軟性・適応性などが期待される.本研究では,群移動ロボットによる移動対象物の協調捕獲問題における自律分散型の制御法を提案する.協調捕獲行動を取り囲み行動と把持行動とに分け,取り囲み行動の設計では,近傍(隣接)ロボットの位置情報のみを利用した制御則に関する収束・順序保存などの基本的性質と,制御則と評価関数との関係を明らかにした.この議論を利用し,近傍ロボットの位置・姿勢情報のみから未知形状対象物の形状推定を用いた把持行動の制御則を提案した.force-closureの条件を分散的な形で表現し,系の評価関数の設計に利用できることを示した.シミュレーションにより,移動対象物の取り囲み行動および凸形状対象物の把持行動において提案制御則が適切に機能し,かつ把持行動においては局所情報から各ロボットが force-closure の達成を判断可能であることを示した.

6台のロボットによる円形移動対象物の取り囲み行動

4台のロボットによる楕円形対象物の把持行動

6台のロボットによる6角形対象物の把持行動

全方位カメラを搭載した移動ロボットによる取り囲み行動の実験

関連文献:

  1. Yuichi Kobayashi, Kyouji Otsubo and Shigeyuki Hosoe, ``Design of Decentralized Capturing Behavior by Multiple Mobile Robots,'' IEEE 2006 Workshop on Distributed Intelligent Systems, 13-18, 2006.
  2. 小林祐一,大坪恭士,細江繁幸,"群移動ロボットによる協調捕獲行動の自律分散制御", 第6回計測自動制御学会制御部門大会資料, Vol.2, pp.463-468, 2006.
  3. 小林祐一,大坪恭士,細江繁幸,野田幸男,"分散協調捕獲行動のための群移動ロボット制御", 第16回インテリジェント・システム・シンポジウム講演論文集, pp.171-176, 2006.

強化学習における画像認識解像度の適応的獲得

ロボットの認識・行動能力をより柔軟にするためには,ロボットの行動およびタスクの達成に即したセンサ入力からの状態空間の構成が重要である.本研究では,ロボットマニピュレータによる対象物操作行動における画像情報からの分解能の調節可能な特徴抽出方法を提案する.mean shift アルゴリズムによるクラスタリングおよび主成分分析により画像情報を低次元パラメータ空間に写像し,強化学習により行動を学習するという枠組みを用いてタスク達成を損ねないという条件のもとでの分解能調節アルゴリズムを示した.これにより高い分解能で高い精度の情報を得ることと低い分解能で計算量を節約することのTrade offの問題をタスクの達成という観点から調整することが可能になる.実機ロボットによる実験において,押し操作のタスクの達成を損ねずに粗い分解能を用いることでより少ない計算時間で押し操作の達成ができることを示した.

画像入力から状態空間を構成するための提案学習法の概要

対象物操作を行うマニピュレータ・カメラシステム

画像情報を用いた特徴抽出および低次元状態空間構成の流れ 各時間ステップにおいて異なる分解能で処理された入力画像

関連文献:

  1. 小林祐一,加藤 真人,細江 繁幸,分解能の調節可能な画像情報からの状態空間の構成, 日本ロボット学会誌, Vol. 25,No. 5,770-778,2007.
  2. Masato Kato, Yuichi Kobayashi and Shigeyuki Hosoe, ``Optimizing Resolution for Feature Extraction in Robotic Motion Learning ,'' IEEE Int. Conf. on Systems, Man & Cybernetics, Hawaii USA, 1086-1091, 2005.

低次元化写像を利用した対象物操作の強化学習

強化学習は幅広い対象に適用可能である反面,対象に関する知識を仮定しないため試行錯誤が多く必要とされるという問題を持つ.本研究では,ロボットによる対象物操作問題を想定し,ロボットの運動が拘束により低自由度の運動に制限される,またその拘束を破る境界が連続である,という知識を仮定した強化学習法を提案する.低次元状態空間への写像をオンラインで構築し,この写像を利用した状態空間においてタスクの失敗を引き起こす境界を推定することによる報酬関数の推定を行う.例として2リンクマニピュレータによる1自由度対象物の回転操作を取り上げ,対象物とマニピュレータ手先の接触を維持しながら目標姿勢まで対象物を回転させるタスクにおいて評価を行う.低次元化写像を用いないモデル同定型強化学習,および低次元化写像を用いるが報酬関数の推定を行わないTD学習との比較において,高い学習性能でタスクの達成が可能であることを示した.

対象物とロボット手先の間に拘束が存在する対象物操作問題

コンフィギュレーション空間中の拘束された運動を行う部分多様体

1自由度の回転運動を行う対象物操作問題(対象物と手先間の滑り・離れを考慮)

学習曲線の例

関連文献:

  1. 小林 祐一,藤井 博基,細江 繁幸,``一次元空間への低次元化写像を用いた対象物操作の強化学習,'' 計測自動制御学会論文集 第42巻7号,814-821,2006.
  2. Yuichi Kobayashi, Hiroki Fujii and Shigeyuki Hosoe, ``Reinforcement Learning for Manipulation Using Constraint between Object and Robot,'' IEEE Int. Conf. on Systems, Man & Cybernetics, Hawaii USA., 871-876, 2005.

逐次的な矩形基底の分割・統合による適応分解能関数近似

強化学習における関数近似に適した適応分解能性能を実現するため,グラフ上の反応拡散方程式に基づいた関数近似要素の動的再配置を提案した(以前の研究参照).この提案法は動的に要素を動かすことで柔軟性を実現したが,位相構築の計算の複雑さや学習過程の安定性などに課題を残した.本研究では,「近似関数の形状の複雑さに応じた分解能」という目標と「関数近似要素を自律分散システムの要素として扱う」という方法を過去の研究と同じくし,矩形基底を逐次的に分割・統合する,状態遷移のモデルを同定しながら価値関数の更新を行う,という考えを導入した関数近似法ならびに強化学習への適用法を示した.1自由度の倒立振子の振り上げ問題(2次元状態空間),Acrobotの安定化問題(4次元状態空間)への適用を行い,格子状関数近似法に対する比較を行った.

固定型(格子状)関数近似,RBFネットワークおよび提案手法の学習曲線の比較

最大サイズの基底の逐次分割により得られた関数近時器の制御性能の評価

2次元ガウス関数近似のようす

1次元倒立振子の振り上げ問題における基底の分割・統合結果

関連文献:

  1. 小林 祐一,湯浅 秀男,細江 繁幸,`強化学習のための矩形基底による自律分散型関数近似,'' 計測自動制御学会論文集 第40巻第8号,849-858, 2004
  2. Yuichi KOBAYASHI and Shigeyuki HOSOE, ``Adaptive Resolution Function Approximation for TD-learning: Simple Division and Integration,'' Proc. of SICE Annual Conference 2003, Fukui, Japan, 3023-3028, 2003.
  3. Yuichi Kobayashi and Shigeyuki HOSOE, ``Hyper-Cubic Discretization in Reinforcement Learning Based on Autonomous Decentralized Approach,'' IEEE Int. Conf. on Systems, Man & Cybernetics, Washington D.C. USA, 3633-3638, 2003.

多次元評価により構成される評価空間の自己組織化

準備中


グラフ上の反応拡散方程式を用いた自律分散型関数近似

強化学習などの未知の対象を扱う行動学習においては,問題に即した情報表現方法を自律的に獲得することが望まれる.強化学習の分野ではしばしば「状態空間の自律的生成」と呼ばれるが,より広い意味では,強化学習に適した適応的な関数近似法と理解することができる.状態空間が高次元・広大になるほどこの問題は学習に大きな影響を与える.
本研究は,グラフ上の反応拡散方程式に基づき,分解能を適応的に変化させる関数近似を実現するものである.強化学習に適した低設計自由度で安定な関数近似法を目指している.
目標関数は,位置と勾配情報を持つノードによって表現される超平面によって近似される.ノードをアークで結ぶことでグラフを構成し,各ノードに曲率体積を定義する.ノードは近傍(アークで結ばれた)ノードの情報から挙動を決定する.この挙動設計に,自律分散システムの理論であるグラフ上の反応拡散方程式を用いる.
平面の貼り合わせ

平面の貼り合わせ

境界付きグラフへの適用

境界付きグラフへの適用

複雑度の定義

曲率体積の定義

複雑度の均一化曲率体積の均一化
1次元ガウス関数近似のうようす
1次元関数近似への適用例
2次元ガウス関数近似のようす
2次元関数近似への適用例

倒立振子振り上げ問題


近似要素数に対する学習性能の比較
関連文献:
  1. 小林 祐一, 湯浅 秀男, 新井 民夫, ``自律分散系の適応アルゴリズムによる強化学習のための関数近似,'' 計測自動制御学会論文集 第38巻2号, 219-226, 2002
  2. Yuichi KOBAYASHI, Hideo YUASA and Shigeyuki HOSOE, ``Q-learning with Adaptive Resolution Function Approximation based on Graph,'' Proc. of the ICASE/SICE Workshop: Intelligent Control and Systems, Muju, Korea, 79-84, 2002.
  3. Yuichi Kobayashi, Hideo Yuasa, and Tamio Arai, ``Function Approximation for Reinforcement Learning Based on Reaction-Diffusion Equation on a Graph,'' Proc. of SICE Annual Conference 2002, Osaka, Japan, 916-921, 2002.

状況認識に不確実性を有する環境下での観測行動の獲得

観測と移動に大きな誤差を伴う四脚ロボットのサッカー行動において,観測行動のコストと最適性を考慮した実時間での行動決定手法を提案した.ロボットの位置情報に関する不確実さを考慮にいれ,動的計画法によるオフライン計算によって状態−行動マップを生成する.このマップを用いることで,ロボットはすべての状態において,不確実さおよび観測行動の時間的コストを含めて最適な行動を決定することができる.メモリの限られたロボットに実装するために,ベクトル量子化によってこのマップを圧縮する.圧縮には,それによって損なわれる最適性を尺度として用いる.四脚ロボットのボールへの到達タスクを扱い,シミュレーションにおいて従来の観測判別法と比較して有効であることを確認し,実機実験において実時間性と低計算量という要請に応えることを確認した.

確率分布を用いた不確実さの表現(左図)と不確実さを表すパラメータを含めた状態空間での状態遷移(右図)

2次元ガウス関数近似のようす
実機四脚ロボットによる観測戦略実現の例

関連文献:

  1. 小林 祐一,深瀬 武,上田 隆一,新井 民夫,湯浅 秀男, ``実時間性と観測コストを考慮した四脚ロボットのサッカー行動設計,'' 日本ロボット学会誌 Vol. 21, No.7, 802-810, 2003.
  2. Takeshi Fukase, Yuichi Kobayashi, Ryuichi Ueda, Takanobu Kawabe and Tamio Arai, ``Real-time Decision Making under Uncertainty of Self-Localization Results,’’ The 2002 International RoboCup Symposium Pre-Proceedings, 372-379, 2002.
  3. Takeshi FUKASE, Masahiro YOKOI, Yuichi KOBAYASHI, Hideo YUASA and Tamio ARAI, ``Quadruped Robot Navigation Considering the Observational Cost,'' Andreas Birk, Silvia Coradeschi and Satoshi Tadokoro (Eds.), RoboCup 2001: Robot Soccer World Cup V, Springer, 350-355, 2002.

Back to TOP PAGE