「信頼領域」を解説文に含む見出し語の検索結果(1~10/341件中)
読み方:しんらいりょういきほう【英】:trust region method制約なし最適化問題を解く勾配法の1つ. ヘッセ行列が正定値でなくてもニュートン法が大域的収束するように工夫された解法であるが...
読み方:しんらいりょういきほう【英】:trust region method制約なし最適化問題を解く勾配法の1つ. ヘッセ行列が正定値でなくてもニュートン法が大域的収束するように工夫された解法であるが...
読み方:しんらいりょういきほう【英】:trust region method制約なし最適化問題を解く勾配法の1つ. ヘッセ行列が正定値でなくてもニュートン法が大域的収束するように工夫された解法であるが...
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfb...
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfb...
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfb...
近接方策最適化(きんせつほうさくさいてきか、PPO)は強化学習のアルゴリズムの一種である。2017年にジョン・シュルマンによって発明され[1]、OpenAIのデフォルトの強化学習アルゴ...
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfb...
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfb...
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfb...
< 前の結果 | 次の結果 >
>>
「信頼領域」の辞書の解説