Données

Le bon usage des données récoltées

 

Anonyme, consciencieux, honnête, fiable, probant et confidentiel : le bon usage des données récoltées exige un travail sérieux et sans failles. Les règles déontologiques en matière de statistiques sont ainsi faites, les commanditaires n’en attendent pas moins de leur prestataire et mon exigence personnelle me les impose également. Ces règles sont fondamentales pour produire des analyses de qualité, et ainsi fournir des résultats fiables pour toutes les enquêtes. Seul l’évaluateur qui s’y tient mérite la confiance de ses commanditaires. Je m’engage à les respecter.

 

Quantitatif : des enquêtes toujours anonymes

Un questionnaire est systématiquement conçu pour garantir l’anonymité du répondant. Le dépouillement se fait également de manière parfaitement anonyme. Le nom, l’adresse exacte, le numéro de téléphone, l’adresse courriel, un identifiant, un numéro de membre ou autre donnée personnelle identifiante ne sont jamais demandés dans un questionnaire.

Il y a pourtant bien des données personnelles essentielles à l’analyse. Comment imaginer décrire l’échantillon sans un minimum d’information sur les individus qui le composent ? Le genre, l’âge, le niveau de formation ou l’origine géographique (pays et/ou commune de résidence, souvent par le truchement du code postal) par exemple sont des données indispensables. Elles sont souvent un des facteurs d’explication de certaines pratiques, attentes, préférences etc. Les répondants sont donc priés de les renseigner dans le questionnaire, mais là encore toujours d’une manière qui ne permet en aucun cas de les identifier personnellement. Le dépouillement statistique de ces données exclut également toute identification ou référence à une personne précise.  

De même, le dépouillement des éléments qualitatifs est entièrement anonyme. Des informations personnelles que les répondants pourraient éventuellement divulguer dans les questions ouvertes (qualitatives) du questionnaire, ne sont pas prises en compte dans le dépouillement et l’analyse des réponses. Toute indication spontanément rajoutée en marge du questionnaire qui pourrait être de nature personnelle, n’est ni relevée, ni analysée.

L’enquête reste parfaitement anonyme même dans le cas où les individus formant le groupe cible de l’enquête sont connus nommément. C’est le cas notamment lorsque le questionnaire est distribué par voie postale ou par courriel. L’envoi est alors assuré par le commanditaire, qui ne transmet ni les fichiers d’adresses, ni les listes de noms, ni les coordonnées. Par ailleurs, aucun identifiant ne figure sur le questionnaire, ni nom, ni adresse, ni numéro de membre ou autre.

 

Qualitatif : prudence et confiance

Les enquêtes qualitatives impliquent souvent un rapport plus étroit et parfois plus personnel avec les répondants. Les objectifs de l’enquête ou la méthode employée imposent parfois de s’adresser à un groupe de personnes définies, voire identifiées à l’avance. Pour cela, il peut être nécessaire d’utiliser des données personnelles ou même de renoncer à l’anonymat des personnes interrogées. C’est le cas notamment pour les entretiens de groupes, les tables rondes d’experts ou les études quantitatives où les mêmes individus sont interrogés à intervalles réguliers (panels). Les critères de sélection des enquêtés, y compris parfois leurs noms et coordonnées, deviennent alors des données incontournables pour le bon déroulement de l’évaluation.

Ces données personnelles proviennent de sources diverses. Il est fréquent qu’elles soient mises à disposition par les commanditaires eux-mêmes. Dans d’autres cas, il revient à l’évaluatrice d’identifier les personnes à interroger. Dans un cas comme dans l’autre, ces données font l’objet d’une attention toute particulière pour ne les utiliser qu’à bon escient. Il en va de la qualité de l’évaluation mais aussi de la protection légitime de toute donnée personnelle.

Selon les modalités définies avec le commanditaire à la signature du contrat et avec l’accord des personnes concernées, les données telles que le nom et les coordonnées des répondants peuvent être communiquées au commanditaire. Elles ne seront en aucun cas transmises à des tiers.

 

Le bon usage des statistiques

« Glaube keiner Statistik, die Du nicht selbst gefälscht hast » (Ne fait confiance à aucune statistique que tu n’as pas manipulée toi-même). Pour démentir cet adage allemand, si fréquemment cité, il est impératif de respecter les règles fondamentales pour le recueil des données et le maniement des statistiques. Quelle que soit la taille de l’échantillon, je fais en sorte de contourner les écueils et de m’assurer que les critères de qualité statistique soient bien respectés.

 Absolument tabou

– la manipulation : aucune manipulation ni falsification des données n’est tolérable, et certainement pas dans le but « d’obtenir » des « résultats » définis à l’avance ;

– la censure : aucune (auto-)censure des données, aucun fait ou résultat important ne doit être volontairement passé sous silence.

 Particulièrement important

– l’échantillon : un échantillon représentatif et de taille appropriée pour pouvoir présenter des résultats probants ;

– l’exhaustivité : toutes les données pertinentes et rien que les données pertinentes doivent être analysées ;

– l’objectivité : elle est certes fortement souhaitable et toujours recherchée, mais ne sera jamais entièrement acquise, pas même avec des méthodes quantitatives ;

– les biais : autant que faire se peut, identifier et éviter les biais (potentiels). Quand ils sont inévitables, les biais (structurels) doivent être pris en compte dans l’analyse/l’interprétation des données et mentionnés dans le rapport final.

Maniement des données

– contrôle des retours : les questionnaires remplis sont triés en fonction de leur validité. Un questionnaire est invalidé quand il contient des défauts de qualité évidents ou lorsque le répondant se situe en dehors du groupe cible. Le questionnaire non-valide est alors retiré de l’échantillon et ne sera pas pris en compte pour le dépouillement ;

– contrôle de qualité : la qualité des données saisies est également vérifiée. Les erreurs de saisie apparentes ainsi que les erreurs manifestes, mais sans aucune équivoque quant à l’intention de réponse du répondant, sont corrigées dans la base de données ;

– calculs statistiques : les données corrigées sont (re-)codées selon les besoins et analysées à l’aide d’un programme statistique spécifique, qui calcule non seulement le tri à plat et les tris croisés, mais aussi les indicateurs usuels tels que les valeurs moyennes et médianes ou la corrélation (indice chi²) par exemple ;

– sélection : s’il est mathématiquement possible de calculer une masse impressionnante de statistiques, toutes ne sont pas pertinentes, loin de là. Il faut donc opérer une sélection selon des critères précis, comme par exemple la validité et l’utilité des résultats, la pertinence pour remplir les objectifs de l’évaluation, le degré de corrélation des variables ou la comparabilité des données entre elles.

Maniement des chiffres

– les pourcentages : les résultats sont présentés en chiffres absolus pour les échantillons de petite taille et en pourcentages à partir d’un échantillon de plus de 100 personnes. Certes, le calcul des pourcentages est mathématiquement exact quelle que soit la taille de l’échantillon. En sciences sociales empiriques, cependant, ils ne sont considérés comme judicieux que pour des échantillons dépassant les 100 individus, avec une tolérance à partir de 80 individus dans la pratique. Les pourcentages calculés sur une petite base (moins de 80 personnes pour la sous-partie considérée de l’échantillon), quand ils sont maintenus dans la présentation des résultats à titre de comparaison avec les autres données, sont par conséquent toujours signalés d’un astérisque pour rappeler la fragilité de leur base de calcul ;

– arrondir : la plupart des statistiques sont calculées en pourcentage avec une décimale après la virgule, ce qui représente un degré de précision amplement suffisant pour les enquêtes menées ici et compte tenu de la taille habituelle des échantillons. Pour assurer une plus grande lisibilité des résultats, ils sont présentés arrondis au nombre entier le plus proche dans le rapport final ; 

– présentation des résultats : les statistiques sont généralement présentées sous forme graphique ou expliquées directement dans le texte, parfois aussi sous forme de tableaux. Il est indispensable de les présenter de la manière la plus explicite, univoque et compréhensible possible, sans pour autant négliger l’aspect esthétique des graphiques pour rendre le rapport le plus attrayant possible.

 

Conservation des données

Le projet une fois achevé, les questionnaires papiers remplis – sauf convention divergente avec le commanditaire – sont conservés dans mes archives pour une durée de dix ans. Ils sont ensuite éliminés en déchetterie.

L’ensemble des données de chaque enquête ainsi que le dépouillement statistique, les analyses et les résultats, qu’ils soient en format électronique ou imprimés sur papier, sont également conservés dans mes archives dès la fin du projet. Cela vaut également pour les documents de travail et les rapports d’enquêtes ou d’évaluations.

Le cas échéant, s’il en a été convenu ainsi avec le commanditaire, les bases de données et certains documents (copie ou originaux) peuvent être mis à sa disposition. De même, les questionnaires papiers peuvent lui être retournés si telle est sa demande.

 

Confidentialité

Les commanditaires ont des droits sur les résultats des enquêtes et évaluations menées en leur nom – et c’est très bien ainsi. Certains contrats contiennent une clause de confidentialité portant sur les données recueillies, le dépouillement, les analyses et résultats, y compris les rapports de présentation. Il est évident que ces données ne sont jamais publiées, transmises ou même communiquées à des tiers sans autorisation explicite du commanditaire.

Toutes ces données, analyses et résultats rassemblés au fil des projets ont cependant une valeur scientifique non négligeable. Elles alimentent un fonds d’informations, de points de repères, de données de référence et /ou de comparaison et constituent une solide expérience pratique qui nourrit les analyses et interprétations de chaque évaluation. Il serait aberrant de s’en passer. Il va de soi que ni les commanditaires, ni les enquêtes ne sont cités directement – sauf à avoir l’autorisation explicite du commanditaire ou des données déjà rendues publiques au préalable.

Pour mener à bien les enquêtes et évaluations, je fais généralement appel à un ou plusieurs assistants, enquêteurs ou vacataires en cas de besoin. Les tâches que je leur confie nécessitent un accès à certaines données, bases de données ou analyses. Ils s’engagent par écrit à respecter eux aussi les clauses de confidentialité et à ne divulguer aucune information ou donnée précise auxquelles ils pourraient avoir accès sur l’évaluation menée et sur les résultats dont ils auraient eu connaissance.