Pour traiter des données statistiques avec notre service en ligne, il suffit de suivre trois étapes :
La conception de la base de données du service StatTech est identique à celle de tout autre programme statistique et repose sur quelques règles simples et généralement acceptées :
Les lignes représentent les patients (clients, animaux, autres unités d'observation). Les données de chaque patient tiennent sur une seule ligne.
Les colonnes représentent les indicateurs (âge, sexe, tension artérielle, etc.).
La ligne supérieure de la base de données contient les noms des indicateurs sans préciser les unités de mesure ni autres informations complémentaires. Seule la première ligne de la base de données est utilisée pour les noms des indicateurs.

Figure 1 - Exemple de tableau de base de données dans MS Excel
Ne fusionnez aucune cellule de la base de données (Fig. 2) :

Figure 2 - Exemple de tableau de base de données mal formaté - cellules fusionnées
N'utilisez pas plus d'une ligne pour les noms des indicateurs (Fig. 3) :

Figure 3 - Exemple de tableau de base de données mal formaté
Pour les indicateurs dont les valeurs impliquent un classement, attribuez des codes numériques par ordre croissant.
Par exemple, degrés de gravité de la maladie : légère - 1, modérée - 2, sévère - 3.
N'oubliez pas de noter et de conserver la clé des codes utilisés séparément ; elle vous sera utile lors du téléchargement de la base de données sur le portail StatTech !
Exemple de la base de données originale avec désignations textuelles des variables catégorielles (Fig. 4):

Figure 4 - Exemple de base de données avec désignations textuelles des variables catégorielles
Même base de données après recodage des variables catégorielles (Fig. 5):

Figure 5 - Exemple de base de données avec variables catégorielles textuelles recodées
Légende de la base de données :
3) Les indicateurs quantitatifs sont présentés sous forme numérique sans préciser l'unité d'observation. Utilisez une virgule ou un point comme séparateur (Fig. 6).
Désignation incorrecte
Différents séparateurs sont utilisés
Les valeurs sont indiquées avec les unités de mesure

Désignation correcte
Une virgule est utilisée comme séparateur
Seuls les chiffres sont utilisés dans les cellules de la base de données

4) Certains indicateurs catégoriels prennent plusieurs valeurs simultanément pour la même unité d'observation.
Par exemple, cela s'applique aux maladies concomitantes, dont un même patient peut être atteint de plusieurs. Dans ce cas, il est inacceptable d'indiquer plusieurs valeurs séparées par des virgules dans une même cellule. Il est nécessaire de créer plusieurs colonnes avec des maladies distinctes, dans lesquelles les données sont saisies sous forme binaire : 1 (signifiant « Cette maladie est présente ») ou 0 (« Cette maladie n'est pas présente »).