Modélisation des épidémies (2) : les modèles SIR et compagnie


Dans le post précédent nous avons présenté de petites simulations numériques de la transmission d’un virus dans un lotissement. Nous avons vu que si les gens sont très mobiles, la phase de croissance de l’épidémie est exponentielle avec le temps. D’autre part le fait que les gens se « mélangent » produit une population homogène, où en chaque endroit on a à peu près les mêmes proportions de personnes saines, contaminées, guéries etc … Or on peut utiliser cette homogénéité de la population pour construire des modèles mathématiques assez simples.


Le modèle SI

Soit une population qui à un instant donné contient S personnes saines Susceptibles d’être infectées, et I personnes Infectées contagieuses. Peut-on décrire simplement la vitesse à laquelle les effectifs de ces deux groupes vont évoluer ? Pour cela nous allons supposer que tout se passe comme si les rencontres entre personnes étaient aléatoires. Plus la proportion de personnes infectées est élevée, plus la probabilité qu’une rencontre se fasse avec une telle personne est élevée. Ainsi on peut supposer que la probabilité qu’une personne rencontrée par une Susceptible soit Infectée, est proportionnelle au nombre I de personnes infectées. De plus le nombre total de telles rencontres se produisant dans un laps de temps donné est proportionnel au nombre total de personnes susceptibles S : il est donc proportionnel au produit IS. Le nombre de nouvelles contaminations qui se produisent pendant le laps de temps peut donc s’écrire \beta IS\beta est un coefficient de proportionnalité. Ainsi pendant l’intervalle de temps considéré, le nombre des Susceptibles a diminué de \beta IS et le nombre d’Infectés a augmenté de la même quantité. Si le même processus se répète à chaque intervalle de temps, l’évolution des nombres S et I lors du passage d’une étape « n » à l’étape « n+1 » est décrite par les relations :

\begin{cases}S(n+1) = S(n)-\beta I(n)S(n)\\I(n+1) = I(n)+\beta I(n)S(n)\end{cases}

Le coefficient \beta est un nombre d’autant plus élevé que les rencontres qui ont lieu pendant un intervalle de temps sont fréquentes et contaminantes.

Voilà, nous avons déjà un modèle mathématique de propagation d’une épidémie !

Appelons-le le modèle SI. Pour l’implémenter il suffit de choisir des valeurs initiales I(1) et S(1) et une valeur de \beta. On peut ensuite calculer de proche en proche toutes les valeurs de S(n) et I(n), par exemple en utilisant un tableur. On obtient typiquement ce genre d’évolution pour les effectifs des deux groupes.

Figure 1 : évolutions des groupes Susceptibles et Infectés dans le modèle SI, en partant de 10 000 personnes saines.
Figure 2 : même chose qu’à gauche en échelle semi-logarithmique.

Comme dans ce modèle minimaliste tous les infectés restent contagieux (ne guérissent ni ne décèdent) tout le monde fini par être atteint. Le tracé en échelles semi-logarithmiques à droite montre que jusque vers la 40ième étape la croissance du nombre d’infectés est exponentielle (une exponentielle donne une droite en échelles semi-log). C’est une conséquence des hypothèses du modèle. En effet les fonctions exponentielles sont celles dont l’accroissement d’une étape n à l’étape n+1 est proportionnel à leur valeur à l’étape n (si chaque étape correspond à un laps de temps très court pendant lequel les nombres varient peu). Or c’est ce que traduit la relation I(n+1) = I(n)+\beta I(n)S(n) écrite plus haut : tant que l’épidémie n’a pas trop progressé, le nombre S n’a pas beaucoup varié en valeur relative, tout se passe à peu près comme s’il était resté égal à S(1) et l’on a I(n+1) - I(n) \approx \beta S(1)I(n) . L’accroissement de I est bien approximativement proportionnel à I. Remarquez qu’on peut faire un raisonnement analogue pour la fin de la décroissance de S qui est une décroissance exponentielle.


Le modèle SIR

Nous allons maintenant voir qu’il est assez simple de compléter le modèle. Par exemple nous allons introduire le fait qu’après un certain temps, les personnes infectées contagieuses guérissent et sont immunisées : on les dénomme alors par la lettre R (pour « Recovered » en anglais). On fait l’hypothèse (encore une !) qu’à chaque étape le nombre de personnes Infectées qui guérissent est proportionnel à leur effectif I, c’est à dire que les guérisons diminuent I d’une quantité de la forme \gamma I. Autrement dit la relation précédente :

I(n+1) = I(n)+\beta I(n)S(n)

devient :

I(n+1) = I(n)+\beta I(n)S(n)-\gamma I(n).

D’autre part l’effectif R du nouveau groupe des malades guéris croit selon R(n+1) = R(n)+\gamma I(n). Le modèle est donc maintenant constitué des trois relations :

\begin{cases}S(n+1) = S(n)-\beta I(n)S(n)\\I(n+1) = I(n)+\beta I(n)S(n)-\gamma I(n)\\R(n+1) = R(n)+\gamma I(n)\end{cases}

Comme précédemment on se donne un jeu de valeurs initiales S(1), I(1) et R(1), ainsi que des valeurs pour \beta et \gamma, et l’on calcule les S(n), I(n) et R(n) pas à pas à l’aide des trois relations de récurrence. On obtient ce genre d’évolutions :

Figure 3 : exemple d’évolution des groupes Susceptibles, Infectés et Recovered (guéris et immunisés) tel que donné par le modèle SIR.

L’état contagieux est maintenant un état transitoire, dont l’effectif décrit un pic. Dans notre exemple l’état final est majoritairement constitué de personnes guéries, l’effectif qui n’a pas été touché (1000 personnes) est d’autant plus élevé que le paramètre \gamma est élevé c’est à dire que la guérison est rapide et « empêche » les personnes Infectées d’en contaminer d’autres.


Taux de reproduction, immunité collective et vaccination

Quelle est la signification précise des paramètres \gamma et \beta ? Il se trouve que \dfrac{1}{\gamma} est la durée moyenne de la contagiosité mesurée en nombre d’étapes, et que \dfrac{1}{N\beta} est la durée moyenne entre deux contaminations générées par un individu contagieux, au début de l’épidémie quand tous ses contacts se font avec des personnes saines (N est l’effectif total de la population, soit 10000 dans notre exemple). On en déduit que leur rapport \dfrac{N\beta}{\gamma} est le nombre moyen de personnes saines qui sont contaminées par une personne infectée pendant sa période de contagiosité, ce au début de l’épidémie. C’est R0 , le taux de reproduction initial de l’épidémie souvent mentionné dans les médias. Dans l’exemple de la figure ci-dessus la durée moyenne entre deux contacts contaminants est 2,8 étapes et la durée de contagiosité est 6,9 étapes. Le R0 vaut donc environ 2,5.


Une épidémie peut-elle être empêchée si seulement une partie de la population est immunisée par une épidémie antérieure ou une vaccination ? La réponse est oui, il faut pour cela que la fraction de la population protégée excède 1 - \dfrac{1}{R_{0}}. On dit alors que l’on a une immunité collective.

Justification : supposons qu’au départ seule une partie de la population soit susceptible, le reste étant immunisé. Introduisons quelques personnes infectées. Pour qu’une nouvelle épidémie se développe il faut que le nombre I se mette à augmenter, autrement dit il faut :
I(2) > I(1)
\implies I(1)+\beta I(1)S(1)-\gamma I(1) > I(1)
\implies \beta I(1)S(1) > \gamma I(1)
\implies S(1) > \dfrac{\gamma }{\beta} .
Inversement si S(1) < \dfrac{\gamma }{\beta} , l’effectif I diminue et il n’y a pas d’épidémie. Dans le cas limite S(1) = \dfrac{\gamma }{\beta} , l’effectif I reste constant. D’autre part la fraction de la population qui est immunisée vaut 1 diminué de la fraction de la population qui est susceptible, soit 1-\dfrac{S(1)}{N} . Le cas limite S(1) = \dfrac{\gamma }{\beta} correspond donc à une fraction immunisée égale à 1-\dfrac{\gamma}{N\beta} , c’est à dire égale à 1-\dfrac{1}{R_{0}}.


Concrètement quand l’épidémie se développe les nouvelles contaminations excèdent les guérisons. Au contraire dans le cas de l’immunité collective, le virus ne « trouve » pas assez de personnes saines à infecter pour compenser les guérisons.

Dans l’exemple de la figure plus haut le cas limite correspond à S(1) = \dfrac{28000}{6,9} \approx 4000 : 40% de la population doit être susceptible, autrement dit 60% doit être immunisée ( fraction immunisée : 1 - \dfrac{1}{R_{0}} = 1 - \dfrac{1}{2,5} = 0,6 ).

Pour la COVID-19 les valeurs estimées pour R0 sont de l’ordre de 3-3,5. Un taux d’immunisation de 66-70% est donc nécessaire pour empêcher un retour de l’épidémie sans mesure sanitaire spécifique.

Remarquons enfin qu’en l’absence d’immunité collective initiale, l’épidémie prend de l’ampleur jusqu’à ce que la condition S(n) < \dfrac{\gamma }{\beta} soit réalisée, ce qui se produit au moment où l’effectif I (courbe rouge dans la figure) passe par son maximum. A ce moment le taux de reproduction effectif Re , qui est par définition R0 multiplié par la fraction de la population encore saine, devient inférieur à 1. Dans ce cas c’est l’infection de la fraction 1 - \dfrac{1}{R_{0}} de la population qui a réalisé l’immunité collective.


Modèle SEIRD … et plus si affinités

Vous le devinez on peut facilement ajouter de nouveaux groupes d’individus, il suffit pour cela de compléter le système de relations. Ainsi nous ajoutons le groupe E des personnes contaminées mais non encore contagieuses (personnes dans leur période d’incubation, Expected en anglais) et le groupe D des personnes décédées. Le modèle est alors défini par :

\begin{cases}S(n+1) = S(n)-\beta I(n)S(n)\\E(n+1) = E(n)+\beta I(n)S(n)-\nu E(n)\\I(n+1) = I(n)+\nu E(n)-\gamma I(n)-\mu I(n)\\R(n+1) = R(n)+\gamma I(n)\\D(n+1)=D(n)+\mu I(n)\end{cases}

Vous pouvez vous amuser à identifier les différents termes. La première relation décrit le départ d’individus Susceptibles vers la catégorie Expected (en incubation), la seconde leur arrivée en Expected et le départ de certains vers la catégorie Infected (1/\nu correspond à la durée moyenne d’incubation), la troisième l’arrivée de ces derniers dans la catégorie Infected ainsi que la guérison et le décès de certains d’entre-eux (1/\mu et 1/\gamma correspondent respectivement aux durées moyennes de contagiosité avant le décès et avant la guérison), enfin les deux dernières relations décrivent la croissance des catégories guéris (Recovered) et Décédés.

Nous donnons ci-dessous un exemple de courbes que l’on peut obtenir, avec un jeu de paramètres qui décrit une épidémie à fort taux de létalité puisque qu’à la fin de l’épisode plus de 60% de la population est décédée.

Figure 4 : exemple d’évolutions que l’on peut obtenir avec le modèle étendu SEIRD. Bleu : effectif non touché, orange et rouge : effectifs en incubation et contagieux, noir et vert : effectifs décédés et guéris, gris : population totale.

Un point « intéressant » est le suivant : on pourrai penser que si l’on augmente le risque de décès en augmentant la valeur du paramètre \mu, le nombre de morts final augmente automatiquement. Mais ça n’est pas aussi simple ! C’est ce que l’on observe jusqu’à un certain point, au delà duquel la poursuite de l’augmentation de \mu améliore le bilan final : elle abaisse le nombre de morts final et augmente la fraction de la population qui n’a pas été touchée ! Cela n’est pas paradoxal : si la maladie tue ses victimes trop vite, les malades disposent de moins de temps pour contaminer des personnes susceptibles. A la limite, un virus qui tue instantanément ne peut pas générer une épidémie. Il existe donc une une valeur « optimale » (on devrait plutôt dire funeste) pour \mu qui maximise le nombre de décès.

Bien entendu on peut encore compléter le modèle par exemple en introduisant une durée finie d’immunité (au bout d’un certain temps les individus R (immunisés) redeviennent Susceptibles), en distinguant différentes classes d’age qui ont chacune leurs paramètres propres, et si l’on fait une étude à plus long terme en prenant en compte les effets démographiques habituels (naissances et décès dus aux autres causes que la maladie). Cela permet de décrire plus finement ce qui se passe, mais multiplie les paramètres dont il faut fixer (parfois deviner) les valeurs.

Dans le prochain post nous regarderons comment décrire ce qui s’est passé en France avec le modèle SEIRD, en incluant le confinement et les effets possibles de différents scénarios de déconfinement.

Et nous nous livrerons à un petit examen critique de ce type de modèle : quelles en sont les limites ?