1.2 Les tests d’aptitudes sont arbitraires
La deuxième catégorie, de nature méthodologique et expérimentale, dénonce les mesures contradictoires obtenues par les " tests " et autres protocoles d’évaluation ou la difficulté d’en extraire des conclusions objectives.
Le débat est notamment apparu à l’occasion des tests mentaux visant à mesurer l’intelligence, et plus tard, la créativité. Les tests les plus connus dans ce domaine ont été développés par J.P Guilford et E. Torrance dans les années 50. Ils proposent d’évaluer la créativité d’une production à partir de 4 critères : la fluidité, la flexibilité, l’originalité et le caractère élaboré des idées proposées.
Le débat est notamment apparu à l’occasion des tests mentaux visant à mesurer l’intelligence, et plus tard, la créativité. Les tests les plus connus dans ce domaine ont été développés par J.P Guilford et E. Torrance dans les années 50. Ils proposent d’évaluer la créativité d’une production à partir de 4 critères : la fluidité, la flexibilité, l’originalité et le caractère élaboré des idées proposées.
Question (classique) posée en séminaire : que faire d’un tas de briques ?
- les vendre, les échanger, les dépenser (pour une brique, t’as plus rien),…
- une maison, un garage
- une arme, un marteau, une massue, un casse-noix
- un serre-livres, un étau
- une cachette
- un économiseur d’eau dans les chasses d’eau (Bien sûr la liste n’est pas exhaustive. On peut obtenir en 5 minutes plus de 100 idées différentes pour un sujet entraîné).
- les vendre, les échanger, les dépenser (pour une brique, t’as plus rien),…
- une maison, un garage
- une arme, un marteau, une massue, un casse-noix
- un serre-livres, un étau
- une cachette
- un économiseur d’eau dans les chasses d’eau (Bien sûr la liste n’est pas exhaustive. On peut obtenir en 5 minutes plus de 100 idées différentes pour un sujet entraîné).
La fluidité est la mesure de la quantité d’idées émises dans une catégorie (par exemple : la catégorie " édifice " de notre production est peu fluide : 2 idées). La flexibilité est la capacité à proposer des idées dans des catégories différentes (6 dans notre exemple). L’originalité est le caractère de ce qui est le moins fréquent ou à part (par exemple " cachette "). L’élaboration mesure le niveau de concrétisation ou la richesse des détails employés pour décrire une idée. Ici, l’économiseur d’eau est à la fois original et élaboré par rapport au sujet posé.
L’administration du test pose immédiatement une série de questions pratiques :
- Comment classer les idées en catégories. Est-ce que le casse-noix est proche de la massue ou du serre-livres ? Est-ce que l’idée de cachette est déjà contenue dans l’idée de maison ? Une telle décision d’affectation change les scores en fluidité et en flexibilité.
- Le caractère opératoire ou élaboré de l’idée risque de consommer du temps, au détriment des autres caractéristiques de la production (par entêtement, raffinement,…). Par ailleurs une idée peut se limiter à un mot (" mur ") ou une périphrase (" un assemblage permettant de consolider un édifice plus ou moins haut,… ").
- Qu’est-ce que l’originalité ? La rareté d’une proposition dans une liste individuelle n’indique pas que la proposition soit originale " en-soi ". Si on compare plusieurs productions, on n’écarte pas nécessairement les idées aberrantes. Si on soumet cette appréciation, comme certaines méthodes le recommandent, à une communauté de " juges " indépendants, on reste tributaire de leurs modes de représentation.
- Comment classer les idées en catégories. Est-ce que le casse-noix est proche de la massue ou du serre-livres ? Est-ce que l’idée de cachette est déjà contenue dans l’idée de maison ? Une telle décision d’affectation change les scores en fluidité et en flexibilité.
- Le caractère opératoire ou élaboré de l’idée risque de consommer du temps, au détriment des autres caractéristiques de la production (par entêtement, raffinement,…). Par ailleurs une idée peut se limiter à un mot (" mur ") ou une périphrase (" un assemblage permettant de consolider un édifice plus ou moins haut,… ").
- Qu’est-ce que l’originalité ? La rareté d’une proposition dans une liste individuelle n’indique pas que la proposition soit originale " en-soi ". Si on compare plusieurs productions, on n’écarte pas nécessairement les idées aberrantes. Si on soumet cette appréciation, comme certaines méthodes le recommandent, à une communauté de " juges " indépendants, on reste tributaire de leurs modes de représentation.
L’analyse des résultats soulève aussi une question de fond : c’est le résultat de la production qui est quantifié et non le processus psychologique de créativité, qui n’est pas directement observable. Comme on ignore la loi qui relie les deux, on ne peut donner de sens au test que relativement à la performance des autres individus qui s’y sont livrés. Dans ce sens, la mesure de la créativité est donc nécessairement relative.
1.3 Le caractère subjectif de l’évaluation n’est pas satisfaisant
Dans le prolongement de ces remarques méthodologiques, des auteurs ont examiné les réticences des sujets au moment de se soumettre à des tests formalisés :
- le caractère évaluatif du test accentue les extrêmes. Il provoque une forme de censure, d’inhibition ou, à l’inverse, d’exagération chez les sujets interrogés. Le protocole amplifie les comportements (on sera d’autant plus prudent que l’on est naturellement prudent, à l’inverse d’autant plus extravagant que l’on est déjà naturellement démonstratif).
- les tests, par essence datés, ne peuvent mesurer la persévérance sur le long terme ou plus simplement l’influence ponctuelle du mode d’administration. Il s’agit donc d’une " photographie " floue et non systémique des aptitudes. Pour comble, les novateurs que l’on imagine intuitivement comme non-conformistes ne souhaitent en général pas se livrer à des " tests " normatifs.
- Des expériences, menées auprès de personnes dont la créativité est reconnue, n’ont pas donné de résultats probants. On doit l’essentiel de ces expériences à des psychologues ou pédagogues américains comme Jackson, Getzels, Wechsler : cela remet en cause la robustesse des tests et/ou les critères de reconnaissance " extérieure " de la créativité.
- Dans le domaine de l’éducation, pour des groupes scolaires homogènes en termes de résultats scolaires, les élèves qui obtenaient de bons résultats aux tests de créativité obtenaient un faible score pour le QI. Réciproquement, si l’on identifie les enfants doués en recourant aux tests de QI, on élimine 70% des sujets dits “ créatifs ”. Les tests sont donc non seulement fragiles, mais aussi de nature à froisser quelques susceptibilités…
- le caractère évaluatif du test accentue les extrêmes. Il provoque une forme de censure, d’inhibition ou, à l’inverse, d’exagération chez les sujets interrogés. Le protocole amplifie les comportements (on sera d’autant plus prudent que l’on est naturellement prudent, à l’inverse d’autant plus extravagant que l’on est déjà naturellement démonstratif).
- les tests, par essence datés, ne peuvent mesurer la persévérance sur le long terme ou plus simplement l’influence ponctuelle du mode d’administration. Il s’agit donc d’une " photographie " floue et non systémique des aptitudes. Pour comble, les novateurs que l’on imagine intuitivement comme non-conformistes ne souhaitent en général pas se livrer à des " tests " normatifs.
- Des expériences, menées auprès de personnes dont la créativité est reconnue, n’ont pas donné de résultats probants. On doit l’essentiel de ces expériences à des psychologues ou pédagogues américains comme Jackson, Getzels, Wechsler : cela remet en cause la robustesse des tests et/ou les critères de reconnaissance " extérieure " de la créativité.
- Dans le domaine de l’éducation, pour des groupes scolaires homogènes en termes de résultats scolaires, les élèves qui obtenaient de bons résultats aux tests de créativité obtenaient un faible score pour le QI. Réciproquement, si l’on identifie les enfants doués en recourant aux tests de QI, on élimine 70% des sujets dits “ créatifs ”. Les tests sont donc non seulement fragiles, mais aussi de nature à froisser quelques susceptibilités…
Les résultats croisés des tests de QI et des tests quantifiant la production d’idées (et ainsi labellisés " de créativité ") ont pu être synthétisés dans le graphique ci-contre.
Celui-ci montre bien qu’à un QI faible (<100) peuvent correspondre des capacités créatives faibles ou bonnes ; de même que pour un QI élevé, le score de créativité pourra être faible ou élevé (Voir pour cette analyse André Pousset, Créativité et Recherche Appliquée, Direction & Gestion, n°124-125, 1990).
Celui-ci montre bien qu’à un QI faible (<100) peuvent correspondre des capacités créatives faibles ou bonnes ; de même que pour un QI élevé, le score de créativité pourra être faible ou élevé (Voir pour cette analyse André Pousset, Créativité et Recherche Appliquée, Direction & Gestion, n°124-125, 1990).
1.4 Les tests figent la créativité
La mesure formelle d’un score de créativité ne donne pas de perspectives aux individus qui se prêtent au jeu de l’évaluation : " je suis créatif à l’issue du test de Torrance ", ou bien " décidément, je le savais, je ne suis pas créatif ". A partir de ce type de jugements, le test ressemble plus à un diagnostic formel qu’à un projet de développement. Or, la plupart des épreuves d’expression verbales ou figurées imaginées par les psychologues soulignent que les résultats obtenus dépendent de l’âge et/ou des " entraînements " du sujet aux exercices de résolution de problème. Si l’on admet donc qu’il suffit de mûrir, au double sens de vieillir et d’expérimenter, pour faire progresser son aptitude à la créativité, les tests ne permettent pas de savoir comment maîtriser ce processus d’amélioration de manière active ou réactive. Il n’y a qu’un pas pour conclure que les tests figent les personnes dans des schémas (précisément) anti-créatifs.
Suite de l'article
Suite de l'article