Commit Graph

3 Commits

Author SHA1 Message Date
0d3f938ca9 Migration Gitea 2025-12-04 20:12:10 +08:00
889cd24319 Amélioration système de traduction: normalisation, lexique et couverture
Corrections majeures:
- Normalisation ligatures (œ→oe, æ→ae) pour éviter fragmentation tokens
- Normalisation complète lexique (clés + synonymes) sans accents
- Correction faux positif "dansent"→"dans" (longueur radical ≥5)

Enrichissement lexique (+212 entrées):
- Verbes: battre (pulum), penser/réfléchir (umis), voler (aliuk)
- Mots grammaticaux: nous (tanu), possessifs (sa/mon→na), démonstratifs (ce→ko)
- Temporels: hier/avant (at), demain/après (ok), autour (no)
- Formes conjuguées ajoutées pour manger, battre, penser

Améliorations techniques:
- Lemmatisation verbale améliorée (radical ≥5 lettres)
- Système normalizeText() dans lexiqueLoader.js
- Liaisons sacrées pour compositions culturelles

Note: Problème connu de lemmatisation à investiguer (formes fléchies non trouvées)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 22:37:31 +08:00
fd3e286bb1 Amélioration couverture lexicale: 36.5% → 54.7% (long texts)
## Lexique enrichi (871 → 940 entrées)

### Verbes ajoutés avec conjugaisons complètes
- planer → aliuk (CVCVC)
- résonner → kekak (CVCVC)
- rejoindre → kotan (CVCVC) - conjugaisons irrégulières corrigées

### Mots grammaticaux ajoutés (00-grammaire.json)
- qui/que/dont → ki (pronom relatif)
- leurs/leur → nasu (possessif 3p pluriel)
- ces/ceux/celles → tovasu (démonstratif pluriel)
- chaque/chacun → eka (quantificateur)
- depuis → ve (particule origine temporelle)
- ils/elles → tasu (pronom personnel 3p)
- et/mais → lo (ajout synonymes)
- dessus/au-dessus → ze (particule spatiale)
- tous/toutes/tout → susu (quantificateur)

### Noms et concepts ajoutés
- antre/caverne/grotte → keku (04-lieux.json)
- tradition/coutume → aitatoku (13-rituels.json)
- artisan → nekatoku (15-roles-titres.json)

### Adjectifs: formes féminines/plurielles
- gris → grise, gris (pluriel) (18-couleurs.json)
- ancien → anciens, ancienne, anciennes, ancêtre, ancêtres (01-racines-sacrees.json)
- sacré → sacrés, sacrée, sacrées (01-racines-sacrees.json)

## Corrections
- rejoindre: conjugaisons irrégulières corrigées (rejoignent vs rejoindent)

## Tests
- Ajout test-long-coverage.js pour validation exhaustive
- 4 textes longs testés
- Couverture globale: 54.7% (81/148 mots de contenu)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 18:02:15 +08:00