Théorie de la décision

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La théorie de la décision est une théorie de mathématiques appliquées ayant pour objet la prise de décision.

Théorie de la décision intertemporelle[modifier | modifier le code]

La notion de décision intertemporelle découle de la prise en compte du facteur temps dans les problématiques reliant l'offre et la demande, les disponibilités et les contraintes. Ces problématiques sont celles qui découlent des combinaisons possibles entre les disponibilités et les décisions pouvant les impliquer. Les diverses fluctuations susceptibles d'être mesurées et prévues par ailleurs permettent ainsi de nourrir des modèles dynamiques.

Modèle à utilité escomptée[modifier | modifier le code]

L'économiste Paul Samuelson propose en 1937 dans un article intitulé « A Note on Measurement of Utility » un modèle simple de décision intertemporelle connu sous le modèle à utilité escomptée[1],[2]. Dans ce modèle, les préférences intertemporelles sont représentées par un paramètre unique appelé « taux d'escompte psychologique » (noté \rho). Dans le cas où le temps est considéré comme discret, l'utilité intertemporelle considérée en t (U^t) s'écrit comme la somme des utilités instantanées (u_t) pondérées par le facteur d'escompte psychologique :


U^t(u_t, \ldots u_T) = \sum_{k=0}^{T-t} \left( \frac{1}{1+\rho} \right)^k u_{t+k}

En temps continu, l'utilité intertemporelle s'écrit comme l'intégrale entre t et T de l'utilité instantanée pondérée par le facteur d'escompte psychologique :


U^t\left( {u_\tau}_{\tau \in [t,T]}\right) = \int_{t}^{T} e^{-\rho \tau} u_\tau d\tau

L'agent prend alors la décision qui maximise son utilité intertemporelle.

Applications[modifier | modifier le code]

Le modèle à utilité escomptée est utilisé en théorie des jeux pour l'étude des jeux répétés.

Dans un article publié en 1988 dans le Journal of Political Economy, Gary Becker et Kevin Murphy utilisent le modèle à facteur d'escompte pour rendre compte des comportements de consommation de bien addictifs (tabac, drogue, etc). Ils entendent montrer que contrairement à l'intuition, la consommation de biens addictifs n'est pas incompatible avec les hypothèses de rationalité telles qu'elles sont définies en théorie économique[3].

Modèles comportementaux[modifier | modifier le code]

Lorsque les individidus ont des comportements temporellement incohérent, il est nécessaire de modéliser leur comportement différemment. Le modèle à escompte quasi-hyperbolique en temps discret est devenu l'un des modèles les plus utilisés pour rendre compte des phénomènes d'addiction ou de procrastination. En 2013, David Laibson et Harris Christopher proposent une extension en temps continu de ce modèle[4].

Théorie de la décision dans le risque et l'incertain[modifier | modifier le code]

Depuis les travaux de Frank Knight en 1921, on dit que l'environnement est risqué si l'agent qui prend la décision connaît les distributions de probabilités sur les différents états du monde possibles. Si ces probabilités sont inconnues, on dit que l'environnement est incertain[5],[6].

Théorie de la décision dans le risque[modifier | modifier le code]

Théorie de l'utilité espérée[modifier | modifier le code]

La théorie de l'utilité espérée (aussi appelée théorie EU, de l'anglais « expected utility ») est l'approche la plus communément retenue par la théorie de la décision pour décrire les choix risqués. Introduisons d'abord quelques notations:
L'incertitude est décrite par un ensemble d'états du monde \Omega=\left\{ \omega_{1},...,\omega_{n}\right\} partitionné par la famille de parties {\textstyle \mathcal{P}(\Omega)=2^{n}}.
Un élément de {\textstyle \mathcal{P}(\Omega)} est appelé événement.
Une variable aléatoire f est une fonction qui associe à chaque \omega un résultat noté x.
L'ensemble des résultats est noté X, X étant un sous-ensemble de {\textstyle \mathbb{R}}.
On écrit {\textstyle \mathcal{A}=\left\{ f:\Omega\rightarrow X\right\} } l'ensemble des variables aléatoires.
Dans le cas du risque, le décideur est supposé connaître les distributions de probabilités induites par les variables aléatoires. La distribution induite par la variable aléatoire f est notée l_{f}. La relation binaire \succcurlyeq signifie "est préféré ou indifférent à". Elle compare des loteries (ou distributions de probabilités), c'est-à-dire des projets risqués de la forme l=(x_1,p_1;...;x_n,p_n)\forall i=1,...,n,x_i est le résultat obtenu avec la probabilité p_i. On écrit \mathcal{L}=\left\{ l_{f}:X\rightarrow\left[0;1\right]\mid{\textstyle f\in\mathcal{A}},\sum_{i=1}^{i=n}l_{f}(x_{i})=1\right\} l'ensemble des distributions de probabilités. La règle de décision développée par Von Neumann et Morgenstern en 1944, connue sous le nom "d'utilité espérée", repose sur les hypothèses suivantes, qui sont appelées axiomes et sont postulées sur la relation \succcurlyeq.

Axiome 1 (préordre total). \succcurlyeq est un préordre total. Cela signifie que :

  • \forall l,l^{\prime}\in\mathcal{L},l\succcurlyeq l^{\prime} ou l^{\prime}\succcurlyeq l (totalité);
  • {\textstyle \forall l\in\mathcal{L}},l\succcurlyeq l (réflexivité);
  • {\textstyle \forall l,l^{\prime},\hat{l}\in\mathcal{L},(l\succcurlyeq l^{\prime}\wedge l^{\prime}\succcurlyeq\hat{l})\Rightarrow l\succcurlyeq\hat{l}} (transitivité).

Axiome 2 (Monotonie). \succcurlyeq est monotone si pour toutes loteries l et l^{\prime} dans {\textstyle \mathcal{L}} on a \forall s\in S,f(s)\geq g(s)\Rightarrow l_{f}\succcurlyeq l_{g}.

Axiome 3 (Continuité). \succcurlyeq est continue si pour toutes loteries l_{f},l_{g} et l_{h} telles que l_{f}\succ l_{g}\succ l_{h}, \exists \alpha,\beta\in\left]0;1\right[ tels que : {\textstyle \alpha l_{f}+(1-\alpha)l_{h}\succ l_{g}\succ\beta l_{f}+(1-\beta)l_{h}}.

Axiome 4 (Indépendance). \succcurlyeq est indépendante si pour tout \alpha dans \left[0;1\right] et pour toutes loteries l_{f},l_{g} et l_{h} on a : l{}_{f}\succcurlyeq l_{g}\Longleftrightarrow\alpha l_{f}+(1-\alpha)l_{h}\succcurlyeq\alpha l_{g}+(1-\alpha)l_{h}

Nous pouvons maintenant présenter le théorème de représentation de Von Neumann et Morgenstern :

Théorème. Pour une loterie l=(x_1,p_1;...;x_n,p_n), on définit la fonction espérance-utilité par EU(l)=\sum_{i=1}^{n}u(x_{i})p_{i} où u est une fonction à valeurs réelles. Etant donnée une relation de préférences \succcurlyeq, les deux propositions suivantes sont équivalentes:

(i) \succcurlyeq satisfait les axiomes 1-4;

(ii) Il existe une fonction à valeurs réelles u:X\rightarrow\mathbb{R} positive à une transformation affine croissante près telle \forall l,l^{\prime}\in\mathcal{L},l\succcurlyeq l^{\prime}\Longleftrightarrow EU(l)\geq EU(l^{\prime}).

Applications[modifier | modifier le code]
  • La théorie de l'utilité espérée a été développée par Von Neumann et Morgenstern dans leur ouvrage de 1944 sur la théorie des jeux. Les auteurs appliquent cette théorie pour prédire le comportement des joueurs dans les jeux non coopératifs[7].

Le paradoxe d'Allais[modifier | modifier le code]

Le contenu descriptif du modèle de décision EU a été rapidement critiqué dans une expérience restée célèbre sous le nom de "paradoxe d'Allais". La version présentée ici est celle de Kahneman et Tversky (1979). Les sujets doivent choisir entre deux paires de loteries. D'une part, entre l_{1}=(3000,1) et l_{2}=(0,0.2;4000,0.8) et, d'autre part, entre l_{3}=(0,0.75;3000,0.25) et l_{4}=(0,0.8;4000,0.2). Le choix le plus fréquemment observé est l_{1} dans la première paire et l_{4} dans la seconde paire, en contradiction avec les prédictions de la fonction EU(.). Plus spécifiquement, c'est l'axiome d'indépendance qui est violé par les individus. Pour résoudre ce paradoxe, une réponse courante consiste à supposer que le traitement des probabilités n'est pas linéaire. Les individus "déforment" les probabilités en fonction des résultats (par exemple, ils sous-estiment la probabilité d'obtenir 3000 dans la loterie l_{3}).

Théorie des perspectives[modifier | modifier le code]

Article détaillé : Théorie des perspectives.

En 1979, Daniel Kahneman et Amos Tversky publient dans la revue Econometrica une théorie alternative à la théorie de l'espérance d'utilité[8]. À l'inverse de la théorie de l'espérance d'utilité qui a des fondement axiomatiques, la théorie des perspectives cherche à prendre en compte les principaux faits stylisés observés au cours des expériences de laboratoires :

  • Les individus ont un point de référence. Ils sont averses au risque lorsqu'ils sont au-dessus de leur point de référence et recherchent le risque lorsqu'ils sont en dessous de leur point de référence
  • Les individus ont une aversion aux pertes : la perte d'utilité liée à la perte de quelque chose est plus grande que l'utilité liée à son gain.
  • Les individus déforment les probabilités. Ils surestiment l'importance des événements rares et sous-estiment l'importance des événements presque certains.

Théorie de l'espérance d'utilité dépendante au rang[modifier | modifier le code]

Principalement axiomatisé par Quiggin (1982), le modèle suivant, appelé "Rank-Dependent Expected Utility " (RDEU), repose principalement sur un affaiblissement de l'axiome d'indépendance. Celui-ci ne tient plus que sur les distributions de probabilités induites par les variables aléatoires ayant le même tableau de variation, c'est-à-dire qui sont communément monotones, ou encore comonotones :

Axiome 4' (Indépendance comonotone). \succcurlyeq est indépendante pour les variables aléatoires comonotones si pour tout \alpha dans \left[0;1\right] et pour toutes loteries l_{f},l_{g} et l_{h} telles que \forall s \in S, (f(s)-f(s^{\prime}))(g(s)-g(s^{\prime})) \geq 0, (g(s)-h(s^{\prime}))(g(s)-h(s^{\prime})) \geq 0 et (f(s)-h(s^{\prime}))(f(s)-h(s^{\prime})) \geq 0 on a : l{}_{f}\succcurlyeq l_{g}\Longleftrightarrow\alpha l_{f}+(1-\alpha)l_{h}\succcurlyeq\alpha l_{g}+(1-\alpha)l_{h}

Théorème. Etant donnée une relation de préférences \succcurlyeq, les deux propositions suivantes sont équivalentes : (i) \succcurlyeq satisfait les axiomes 1-3 et l'axiome 4'; (ii) Il existe une fonction à valeurs réelles u:X\rightarrow\mathbb{R} positive à une transformation affine croissante près et une fonction à valeurs réelles croissante \phi:\left[0;1\right]\rightarrow\left[0;1\right] telle que la valeur d'une loterie l=(x_1,p_1;...;x_n,p_n) est donnée par V(l)=RDEU(l)=\underset{S}{\int}u(f)d\phi(p)=\sum_{i=1}^{n}(\phi(\sum_{j=i}^{n}p_{j})-\phi(\sum_{j=i+1}^{n}p_{j}))u(x_{i}) et \forall l,l^{\prime}\in\mathcal{L},l\succcurlyeq l^{\prime}\Longleftrightarrow RDEU(l)\geq RDEU(l^{\prime}).

La théorie de la décision dans l'incertitude[modifier | modifier le code]

Théorie de l'utilité espérée subjective[modifier | modifier le code]

L'utilité espérée a été élargie dès 1954 par L.J. Savage aux situations incertaines. Son axiomatisation comporte six axiomes lorsque l'ensemble \Omega est fini. Un axiome "clé" est le suivant :

Axiome (Principe de la chose sûre). \succcurlyeq est telle que pour tout événement E et actes f,g,f^{\prime} et g^{\prime} tels que \forall s \in E, f(s)=f^{\prime}(s) et g(s)=g^{\prime}(s), et \forall s \in E^{c}, f(s)=g(s) et f^{\prime}(s)=g^{\prime}(s), f\succcurlyeq g si et seulement si f^{\prime}\succcurlyeq g^{\prime}.

En addition aux hypothèses "standards" (préordre complet, monotonie, continuité), cet axiome permet à la relation de préférences d'être représentée par une fonction SEU(.) tel que SEU : f \longmapsto SEU(f)=\int_S u(f)dP(s) où :

  • La fonction u: X \rightarrow \mathbb{R} est affine à une transformation affine croissante près ;
  • La fonction d'ensemble P : \mathcal{P}(\Omega) \rightarrow [0,1] est une mesure de probabilité ;
  • SEU signifie "Subjective Expected Utility", l'adjetif "subjective" étant là pour rappeler que la mesure P(.) est attribuée par le décideur et n'est pas une donnée objective du problème de décision.

Bien que séduisant par sa simplicité et sa relative souplesse d'utilisation comparée à d'autres approches, le modèle de l'utilité espérée dans l'incertain a fait l'objet de plusieurs critiques expérimentales. La principale est liée au principe de la chose sûre, qui neutralise l'impact de l'ambiguïté sur les préférences, comme le suggère l'exemple suivant, qui constitue une variante du paradoxe d'Ellsberg (1961).

Paradoxe d'Ellsberg[modifier | modifier le code]

Article détaillé : Paradoxe d’Ellsberg.

Un individu est face à une urne contenant 30 boules rouges, et 60 boules bleues ou vertes, sans information supplémentaire sur le nombre exact de boules vertes d'une part, de boules bleues d'autre part. La probabilité d'obtenir une boule rouge, notée P(R) ,est donc connue et égale à \frac{1}{3}, de même que celle d'obtenir une boule qui serait soit bleue, soit verte : P(B \cup V)=\frac{2}{3}. Cependant, il ne s'agit pas d'une situation de risque puisque la probabilité d'obtenir une boule bleue, P(B), varie dans l'intervalle [0,\frac{2}{3}], tout comme celle d'obtenir une boule verte, P(V). Nous parlons d'ambiguïté pour qualifier une telle situation, dans laquelle seulement une partie de l'information est probabilisée. Supposons que l'individu doive effectuer un choix entre les actes suivants :

  • a=(1 si R, 0 si B, 0 si V) contre a'=(0 si R, 1 si B, 0 si V)
  • b=(1 si R, 0 si B, 1 si V) contre b'=(0, si R, 1 si B, 1 si V)

Dans le choix "a contre a'", on observe généralement a \succcurlyeq a', tandis que dans le choix "b contre b'", on observe b' \succcurlyeq b. L'aversion pour ambiguïté des individus explique ce type de choix. Le premier choix s'explique par le fait que l'individu connaît la probabilité que la boule soit rouge, et le second par le fait qu'il connaît la probabilité qu'elle soit bleue ou verte (mais pas celle qu'elle soit rouge ou verte). Il s'agit d'une contradiction directe du principe de la chose sûre. Par conséquent, de telles préférences ne peuvent être décrites par le critère de l'utilité espérée. En effet, supposons que ce soit le cas. Nous avons donc a \succcurlyeq a' si et seulement si \frac{1}{3} \geq P(B) et b' \succcurlyeq b si et seulement si P(B)+P(V) \geq P(R) + P(V). Hormis le cas de l'égalité, il s'agit clairement d'une contradiction, raison pour laquelle ce type d'expérience a été qualifié de paradoxal.

Modèles alternatifs[modifier | modifier le code]

D'autres modèles, appelées "Non-Expected Utility" modèles, ou modèles non-additifs, ont donc été axiomatisés dans l'incertain pour résoudre ce type de paradoxe.

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

Références[modifier | modifier le code]

  1. (en) Paul Samuelson, « A Note on Measurement of Utility », The Review of Economic Studies, vol. 4, no 2,‎ février 1937, p. 155-161 (lire en ligne)
  2. (en) Shane Frederick, George Loewenstein et Ted O'Donoghue, « Time Discounting and Time Preference: A Critical Review », Journal of Economic Literature, vol. 40, no 2,‎ juin 2002, p. 351-401 (lire en ligne)
  3. (en) Gary S. Becker et Kevin M. Murphy, « A Theory of Rational Addiction », Journal of Political Economy, vol. 96,‎ août 1988, p. 675-700 (lire en ligne)
  4. (en) Christopher Harris et David Laibson, « Instantaneous Gratification », Quarterly Journal of Economics, vol. 128, no 1,‎ 2013, p. 205-248 (DOI 10.1093/qje/qjs051, lire en ligne)
  5. (en) Frank Knight, Risk, Uncertainty and Profit, Boston,‎ 1921, 1e éd.
  6. Binmore 2011, p. 35
  7. (en) Oskar Morgenstern et John Von Neumann, Theory of Games and Economic Behavior, PUP,‎ 1944, 1e éd.
  8. (en) Daniel Kahneman et Amos Tversky, « Prospect Theory: An Analysis of Decision under Risk », Econometrica, vol. 47, no 2,‎ mars 1979, p. 263-291 (lire en ligne)

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Sources[modifier | modifier le code]

  • (en) Christopher Chabris, David Laibson et Jonathan Schuld, « Intertemporal Choice », dans Palgrave Dictionary of Economics,‎ 2008 (lire en ligne)

Auteurs[modifier | modifier le code]

Articles connexes[modifier | modifier le code]