Dans la fenêtre résultat, on lit la valeur de l'OR entre le sexe et le diagnostic de maladie cardiaque, ici 4,48 en arrondissant, et son intervalle de confiance à 95 % à côté (entourés en rouge), ainsi que la valeur p de significativité du test de l'association, ici <0,0001 (entourée en vert).
 
On peut donc dire que, dans notre échantillon d'étude, les hommes ont une probabilité plus grande d'avoir un diagnostic de maladie cardiaque  que les femmes, car la valeur de l'OR des hommes (codés 1 dans la variable Sexe) sur les femmes (codées 0) est significativement supérieure à 1 (en effet son l'intervalle de confiance à 95 % n'inclut pas 1, et la valeur p est inférieure à 0,05), en tenant compte de l'âge (en ajustant sur l'âge des patients).
 
Les valeurs p qui apparaissent en bas (encadrées en bleue, p est inférieur à 0,0001) correspondent au degrés de signification du modèle logistique global (avec toutes les variables explicatives, le sexe et l'âge).
Les résultats de la régression logistique multiple apparaissent alors dans la fenêtre de sortie:
☞  Dans la fenêtre de la Régression Logistique qui apparaît, il faut d'abord sélectionner la variable à expliquer   dans le champ en haut à gauche "Variable à Expliquer", ici la variable "MaladieCard", puis sélectionner les variables explicatives, dans le champ nommé "Autres Variables" au milieu en haut, ici les variable "Sexe" et "Age".
On clique enfin sur le bouton OK pour lancer le calcul.
A partir du module d'Analyse des Données Classique, on doit d'abord lire la table de données de notre exemple (projet "Cleveland.mdb", table "Angiographie")
        Pour illustrer le calcul d'un modèle logistique multiple, reprenons l'exemple précédent d'une enquête sur des personnes allant à l'hôpital pour y subir une angiographie.
Le résultat de cet examen est le diagnostic d'une maladie cardiaque.
 
On veut à partir des données de l'enquête estimer l'associations entre ce diagnostic et le sexe des patients, en tenant compte de leur l'âge.
 
Le diagnostic de maladie cardiaque est notre variable de résultat, notre variable à expliquer.
 
Le sexe des patients est une de notre variable explicative (qualitative à 2 modalités) ou variable d'exposition.
 
Enfin, l'âge des patients est une notre variable explicative d'ajustement, variable quantitative (variable continue, cf. l'annexe sur les types de variable).
 
On a donc:

Rappel: !!! Attention !!!

 

Epi Info n'accepte comme

variable de résultat

(la variable dichotomique à expliquer) que les

variables numériques codées en

0/1

, ou

les variables de type

Oui/Non

(Yes/no).

Si ce n'est pas le cas, vous devrez créer une nouvelle variable en transcodant la variable d'origine avec les commandes Epi Info du module d'analyse

DEFINIR

et

TRANSCODER

.

Lien pour récupérer la base de données de l'exemple (au format .mdb):
 
=> Cleveland.mdb <=
2.1 Exemple de calcul d'une régression logistique multiple
☞  Pour calculer le modèle logistique, on utilise la commande REGRESSION LOGISTIQUE qui se trouve dans le groupe des commandes "Statistiques Avancées".
Facteur de Risque
(variable explicative, indépendante)
 
sexe
âge
Maladie ou Symptômes
(variable à expliquer, dépendante):
 
diagnostic de maladie cardiaque
 
☝︎ Retour en haut de la page
Article publié le 30 janvier 2018
2. La Régression Logistique Multiple avec Epi Info 7:
 
    Après avoir abordé la régression logistique simple avec la commande LOGISTIQUE d'Epi Info 7, ce message traite de la régression prenant en compte plusieurs variables dites explicatives.
 
En effet, l'intérêt de la régression logistique est de pouvoir tester dans un même modèle l'association entre une variable qualitative à 2 modalités (de type oui/non (Yes/No), codée 0/1…) dite variable dépendante ou de résultat, et plusieurs autres variables qualitatives et/ou quantitatives, dites variables indépendantes ou explicatives ou d'exposition (cf. l'annexe sur les types de variable).
 
Cette régression logistique dite multiple calcule les Odds Ratio entre la variable dépendante et les variables indépendantes.
Et chaque OR calculé entre la variable dépendante (la "maladie") et une variable qualitative tiendra compte des autres variables présentes dans le modèle, on parle alors d'OR ajusté.
 
Par exemple dans un même modèle si l'eczéma est la variable dépendante, et les variables symptômes de sifflements et âge des sujets sont les variables explicatives, l'OR calculé entre l'eczéma et les sifflements sera dit ajusté sur l'âge des sujets.
 
Cela permet notamment de tenir compte des facteurs dits de confusion dans une association entre une "maladie" et une "exposition".
Sommaire
 
. Introduction. ◀
1. La Régression Logistique Simple.◀
2. La Régression Logistique Multiple.
3. La Régression Logistique avec une variable nominale.  ▶
. Annexe: les types de variables explicatives  ▶
La Régression Logistique dans Epi Info 7 (3/5)
AccueilTéléchargementsArticles par thèmeAutre 
Epi Info en Version Française, auteur David Moreau (david.moreau@epivf.fr)