confluent/ancien-confluent/lexique
StillHammer 889cd24319 Amélioration système de traduction: normalisation, lexique et couverture
Corrections majeures:
- Normalisation ligatures (œ→oe, æ→ae) pour éviter fragmentation tokens
- Normalisation complète lexique (clés + synonymes) sans accents
- Correction faux positif "dansent"→"dans" (longueur radical ≥5)

Enrichissement lexique (+212 entrées):
- Verbes: battre (pulum), penser/réfléchir (umis), voler (aliuk)
- Mots grammaticaux: nous (tanu), possessifs (sa/mon→na), démonstratifs (ce→ko)
- Temporels: hier/avant (at), demain/après (ok), autour (no)
- Formes conjuguées ajoutées pour manger, battre, penser

Améliorations techniques:
- Lemmatisation verbale améliorée (radical ≥5 lettres)
- Système normalizeText() dans lexiqueLoader.js
- Liaisons sacrées pour compositions culturelles

Note: Problème connu de lemmatisation à investiguer (formes fléchies non trouvées)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 22:37:31 +08:00
..
_meta.json Réorganisation du repo par niveau de langue 2025-11-27 13:16:34 +08:00
00-grammaire.json Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
01-racines-sacrees.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
02-racines-standards.json Gestion adverbes -ment + formes adjectifs + extension lexique personnes 2025-11-30 17:09:05 +08:00
03-castes.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
04-lieux.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
05-corps-sens.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
06-actions.json Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
07-emotions.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
08-nature-elements.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
09-institutions.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
10-animaux.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
11-armes-outils.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
12-abstraits.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
13-rituels.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
14-geographie.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
15-roles-titres.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
16-communication.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
17-temps.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
18-couleurs.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
19-sante-dangers.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
20-objets-materiaux.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
21-famille.json Gestion adverbes -ment + formes adjectifs + extension lexique personnes 2025-11-30 17:09:05 +08:00
22-nombres.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
23-nourriture.json.backup Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
lowercase-confluent.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00