Skip to content

fix(export): codebook — entités HTML + modalités de réponse manquantes#135

Merged
mindcraft-research merged 2 commits into
mainfrom
fix-codebook-html-entities
Jun 24, 2026
Merged

fix(export): codebook — entités HTML + modalités de réponse manquantes#135
mindcraft-research merged 2 commits into
mainfrom
fix-codebook-html-entities

Conversation

@mindcraft-research

@mindcraft-research mindcraft-research commented Jun 24, 2026

Copy link
Copy Markdown
Owner

Résumé

Deux corrections sur le codebook PDF, suite à un retour utilisateur·rice (« la plupart des réponses ne sont pas présentes » + « des éléments de programmation deviennent parfois apparents »).

1. Modalités de réponse manquantes pour certains types

Le retour visait en fait les modalités possibles (le codage des valeurs), pas les réponses des participant·e·s. Pour plusieurs types, elles n'étaient pas documentées — notamment le consentement (les valeurs accept/refuse ne sont pas stockées dans q.choices, donc rien ne s'affichait).

Ajout au codebook :

  • CONSENT : modalités accept / refuse avec leurs libellés personnalisés (acceptLabel / refuseLabel) + note de redirection.
  • NUMERIC : bornes min/max si définies.
  • DATE : format (date / heure / date+heure).

2. Entités HTML non décodées (« éléments de programmation »)

stripHtml ne décodait qu'une poignée d'entités ( , &, <, >). Les accents français (é → é), apostrophes (’), entités numériques (', é)… restaient littérales — ex. « déforestation ».

Désormais stripHtml décode :

  • les entités numériques décimales (&#NN;) et hexadécimales (&#xNN;) ;
  • les entités nommées courantes (accents, ç, œ, æ, guillemets, tirets, °, €, ×, ©, ®) ;
  • & en dernier (pas de double décodage : < reste <).

Rappel (pas un bug)

Le codebook est un dictionnaire de variables (structure de l'étude). Il ne contient pas les réponses des participant·e·s — pour les résultats : export CSV / Excel / JSON.

(a) PsyToolkit / Firefox — hors PR

Réglé côté usage : passer le bloc Tâche externe en mode Redirection (PsyToolkit bloque l'affichage en iframe, Firefox encore plus). Déjà documenté.

Test plan

  • Tests unitaires stripHtml (OK) : accents, apostrophes, entités numériques hex/déc, pas de double décodage de &.
  • Générer un codebook sur une étude FR avec un bloc Consentement → modalités accept/refuse visibles, plus aucune entité résiduelle
  • Vérifier NUMERIC (min/max) et DATE (format) documentés

🤖 Generated with Claude Code

mindcraft-research and others added 2 commits June 24, 2026 20:59
Retour utilisateur·rice : dans le codebook PDF, « des éléments de
programmation deviennent parfois apparents ». Cause : le nettoyage du
texte (stripHtml) ne décodait qu'une poignée d'entités ( , &,
<, >). Les accents français (é → é), apostrophes
typographiques (’), entités numériques (', é), etc.
restaient affichés tels quels — ex. « déforestation » au lieu
de « déforestation ».

Fix : stripHtml décode désormais
- les entités numériques décimales (&#NN;) et hexadécimales (&#xNN;),
- les entités nommées courantes (accents, ç, œ, guillemets, tirets,
  °, €, ×, etc.),
et traite & en dernier pour éviter tout double décodage
(« &amp;lt; » ne devient pas « < »).

Note : le codebook reste un dictionnaire de variables (structure de
l'étude), il ne contient pas les réponses des participant·e·s — pour
les résultats, utiliser l'export CSV / Excel / JSON.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
…mérique / date

Suite au retour : dans le codebook, les modalités de réponse possibles
n'apparaissaient pas pour certains types — notamment le CONSENTEMENT
(les valeurs accept/refuse ne sont pas stockées dans q.choices, donc
rien n'était affiché).

Ajout dans le codebook :
- CONSENT : modalités « accept » / « refuse » avec leurs libellés
  personnalisés (acceptLabel / refuseLabel) et la note de redirection.
- NUMERIC : bornes min/max si définies.
- DATE : format (date / heure / date+heure).

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
@mindcraft-research mindcraft-research changed the title fix(export): codebook — décoder les entités HTML du texte fix(export): codebook — entités HTML + modalités de réponse manquantes Jun 24, 2026
@mindcraft-research mindcraft-research merged commit a236958 into main Jun 24, 2026
4 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant