Le calculateur d'indice de concordance (indice C) permet de mesurer la précision des modèles prédictifs, notamment dans l'analyse de survie. Il évalue la capacité d'un modèle à prédire le classement des résultats. Un indice C plus élevé signifie que le modèle est plus efficace pour classer les prédictions avec précision. Cet outil est largement utilisé dans les domaines de la santé et de la science des données, notamment pour valider les modèles de survie comme la régression de Cox.
Le calculateur évalue la relation entre les valeurs prédites et les résultats observés en comparant des paires de points de données. Il fournit un score compris entre 0.5 et 1.0, où 1.0 indique une précision parfaite et 0.5 suggère une prédiction aléatoire.
Calculateur d'indice de concordance de formule
La formule pour calculer l'indice C est :
Indice C = (Nombre de paires concordantes + 0.5 × Nombre de paires à égalité) / Nombre total de paires
Les paires concordantes font référence aux cas où le modèle prédit correctement le classement. Les paires à égalité se produisent lorsque le modèle donne des prédictions identiques ou lorsque les résultats observés sont les mêmes. Le total des paires représente toutes les paires possibles dans l'ensemble de données.
Étapes pour calculer :
- Identifiez toutes les paires possibles dans l'ensemble de données. Pour un ensemble de données avec n observations, le nombre total de paires est donné par la formule n × (n - 1) / 2.
- Déterminer le nombre de paires concordantes. Il s'agit de paires pour lesquelles le classement prévu par le modèle correspond au classement observé.
- Comptez les paires à égalité. Cela se produit lorsque les prédictions ou les résultats observés sont identiques.
- Remplacez les valeurs des paires concordantes, des paires liées et des paires totales dans la formule pour calculer l'indice C.
Un indice C plus élevé indique un modèle plus précis.
Tableau des conditions générales pour référence rapide
Nombre d'observations (n) | Total des paires |
---|---|
5 | 10 |
10 | 45 |
20 | 190 |
50 | 1,225 |
100 | 4,950 |
Ce tableau aide les utilisateurs à trouver rapidement le nombre total de paires pour des ensembles de données de différentes tailles, réduisant ainsi le besoin de calculs manuels.
Exemple de calculateur d'index de concordance
Pour comprendre le calcul, considérons un ensemble de données avec 10 observations. Les étapes sont les suivantes :
- Le nombre total de paires est calculé comme 10 × (10 - 1) / 2, ce qui équivaut à 45.
- Supposons que le nombre de paires concordantes soit de 30.
- Supposons qu’il y ait 5 paires à égalité.
- Remplacez les valeurs dans la formule : (30 + 0.5 × 5) / 45, ce qui donne environ 0.7.
Un indice C de 0.7 indique un modèle prédictif raisonnablement précis.
FAQ les plus courantes
L'indice C mesure la capacité d'un modèle prédictif à classer les résultats. Il est particulièrement important dans l'analyse de survie pour valider la fiabilité de modèles tels que la régression de Cox. Un indice C plus élevé reflète de meilleures performances.
Un indice C de 0.5 indique que les prédictions du modèle ne sont pas meilleures que des suppositions aléatoires. Cela suggère que le modèle n'est peut-être pas fiable pour classer les prédictions.
Non, l'indice C varie entre 0.5 et 1.0. Une valeur supérieure à 1.0 n'est pas possible et peut indiquer une erreur de calcul.