About: マルコフ決定過程

Property	Value
dbo:abstract	マルコフ決定過程（マルコフけっていかてい、英: Markov decision process; MDP）は、状態遷移が確率的に生じる動的システム（確率システム）の確率モデルであり、状態遷移がマルコフ性を満たすものをいう。MDP は不確実性を伴う意思決定のモデリングにおける数学的枠組みとして、強化学習など動的計画法が適用される幅広い最適化問題の研究に活用されている。MDP は少なくとも1950年代には知られていたが、研究の中核は1960年に出版された Ronald A. Howard の "Dynamic Programming and Markov Processes" に起因する。MDP はロボット工学や自動制御、経済学、製造業を含む幅広い分野で用いられている。 (ja) マルコフ決定過程（マルコフけっていかてい、英: Markov decision process; MDP）は、状態遷移が確率的に生じる動的システム（確率システム）の確率モデルであり、状態遷移がマルコフ性を満たすものをいう。MDP は不確実性を伴う意思決定のモデリングにおける数学的枠組みとして、強化学習など動的計画法が適用される幅広い最適化問題の研究に活用されている。MDP は少なくとも1950年代には知られていたが、研究の中核は1960年に出版された Ronald A. Howard の "Dynamic Programming and Markov Processes" に起因する。MDP はロボット工学や自動制御、経済学、製造業を含む幅広い分野で用いられている。 (ja)
dbo:thumbnail	wiki-commons:Special:FilePath/Markov_Decision_Process_example.png?width=300
dbo:wikiPageExternalLink	http://webdocs.cs.ualberta.ca/~sutton/book/the-book.html http://www.ai.mit.edu/~murphyk/Software/MDP/mdp.html http://www.cs.uwaterloo.ca/~jhoey/research/spudd/index.php http://www7.inra.fr/mia/T/MDPtoolbox/ https://pypi.python.org/pypi/pymdptoolbox http://www.cs.ualberta.ca/~sutton/book/ebook http://www.jstor.org/stable/3690147 https://books.google.com/books%3Fid=hHVQAAAAMAAJ https://ci.nii.ac.jp/naid/10031140795/%22 http://ieeexplore.ieee.org/stamp/stamp.jsp%3Farnumber=5408453 http://www.eecs.umich.edu/~baveja/ http://www.eecs.umich.edu/~baveja/Papers/Thesis.ps.gz http://www.iumj.indiana.edu/IUMJ/FULLTEXT/1957/6/56038
dbo:wikiPageID	3495943 (xsd:integer)
dbo:wikiPageLength	10854 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	91468364 (xsd:integer)
dbo:wikiPageWikiLink	dbpedia-ja:Category:アンドレイ・マルコフ dbpedia-ja:Category:数学に関する記事 dbpedia-ja:Category:理論計算機科学 dbpedia-ja:Category:論理学 dbpedia-ja:Q学習 dbpedia-ja:ベルマン方程式 dbpedia-ja:マルコフ性 dbpedia-ja:マルコフ連鎖 dbpedia-ja:ロイド・シャープレー dbpedia-ja:ロボット工学 dbpedia-ja:動的計画法 dbpedia-ja:強化学習 dbpedia-ja:経済学 dbpedia-ja:線型計画法 dbpedia-ja:製造業 dbpedia-ja:部分観測マルコフ決定過程 dbpedia-ja:ファイル:Markov_Decision_Process_example.png
prop-en:wikiPageUsesTemplate	template-en:Cite_book template-en:Cite_conference template-en:Cite_journal template-en:Computer-stub template-en:Lang-en-short template-en:Refbegin template-en:Refend template-en:Seealso template-en:Sfn template-en:仮リンク template-en:確率論 template-en:Reflist_hide
dct:subject	dbpedia-ja:Category:アンドレイ・マルコフ dbpedia-ja:Category:数学に関する記事 dbpedia-ja:Category:理論計算機科学 dbpedia-ja:Category:論理学
rdfs:comment	マルコフ決定過程（マルコフけっていかてい、英: Markov decision process; MDP）は、状態遷移が確率的に生じる動的システム（確率システム）の確率モデルであり、状態遷移がマルコフ性を満たすものをいう。MDP は不確実性を伴う意思決定のモデリングにおける数学的枠組みとして、強化学習など動的計画法が適用される幅広い最適化問題の研究に活用されている。MDP は少なくとも1950年代には知られていたが、研究の中核は1960年に出版された Ronald A. Howard の "Dynamic Programming and Markov Processes" に起因する。MDP はロボット工学や自動制御、経済学、製造業を含む幅広い分野で用いられている。 (ja) マルコフ決定過程（マルコフけっていかてい、英: Markov decision process; MDP）は、状態遷移が確率的に生じる動的システム（確率システム）の確率モデルであり、状態遷移がマルコフ性を満たすものをいう。MDP は不確実性を伴う意思決定のモデリングにおける数学的枠組みとして、強化学習など動的計画法が適用される幅広い最適化問題の研究に活用されている。MDP は少なくとも1950年代には知られていたが、研究の中核は1960年に出版された Ronald A. Howard の "Dynamic Programming and Markov Processes" に起因する。MDP はロボット工学や自動制御、経済学、製造業を含む幅広い分野で用いられている。 (ja)
rdfs:label	マルコフ決定過程 (ja) マルコフ決定過程 (ja)
prov:wasDerivedFrom	http://ja.wikipedia.org/wiki/マルコフ決定過程?oldid=91468364&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Markov_Decision_Process_example.png
foaf:isPrimaryTopicOf	http://ja.wikipedia.org/wiki/マルコフ決定過程
is dbo:wikiPageWikiLink of	dbpedia-ja:MDP dbpedia-ja:Q学習 dbpedia-ja:アンドレイ・マルコフ dbpedia-ja:ベルマン方程式 dbpedia-ja:マルコフ性 dbpedia-ja:マルコフ連鎖 dbpedia-ja:マルコフ過程 dbpedia-ja:多腕バンディット問題 dbpedia-ja:強化学習 dbpedia-ja:機械学習 dbpedia-ja:眼窩前頭皮質 dbpedia-ja:自動計画 dbpedia-ja:部分観測マルコフ決定過程
is owl:sameAs of	dbpedia-wikidata:マルコフ決定過程
is foaf:primaryTopic of	http://ja.wikipedia.org/wiki/マルコフ決定過程