Toutes les news taguées avec ce sujet.
Des algorithmes Q-learning adaptés à l'optimisation risk-averse par utilité exponentielle dans les processus de décision markoviens escomptés.