confluent/ancien-confluent/lexique
StillHammer dc6affc7fd Amélioration lemmatisation FR + normalisation accents + extension lexique
## Fixes

### 1. Lemmatisation verbes français (contextAnalyzer.js)
- Fix: 'ent' → 'er' (observent → observer, marchent → marcher)
- Add: règles 'ient' → 'ir' (voient → voir)
- Add: règles 'oient' → 'oir' (alternative)
- Résultat: reconnaissance conjugaisons françaises améliorée

## Ajouts lexique

### 2. Verbe "marcher" (06-actions.json)
- Confluent: tekam (racine: teka, forme liée: tek)
- Conjugaisons: marche, marches, marchons, marchent, etc.

### 3. Prépositions → Particules (00-grammaire.json)
- "dans/sur/sous" → no (localisation spatiale)
- "avec" → vi (instrument/accompagnement)
- "pour/contre" → se (but/bénéficiaire)
- "sans" → zo (négation)
- "pendant" → at (passé vécu)

### 4. Composant "echos" (03-castes.json)
- Extraction racine: "échos" → keko
- Permet reconnaissance mot seul (pas seulement dans "Enfants des Échos")

## Refactor majeur

### 5. Normalisation accents (23 fichiers JSON)
- Suppression accents de TOUTES les clés de dictionnaire
- Cohérence avec normalisation NFD côté serveur
- Fichiers normalisés:
  * 00-grammaire.json à 22-nombres.json (tous les lexiques)

## Résultats

Couverture améliorée sur phrases test:
- "Les enfants des échos observent la grande fresque": 40% → 80% (4/5)
- "Le soleil brille sur les montagnes pendant l'été": 33% → 67% (4/6)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 16:43:34 +08:00
..
_meta.json Réorganisation du repo par niveau de langue 2025-11-27 13:16:34 +08:00
00-grammaire.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
01-racines-sacrees.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
02-racines-standards.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
03-castes.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
04-lieux.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
05-corps-sens.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
06-actions.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
07-emotions.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
08-nature-elements.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
09-institutions.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
10-animaux.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
11-armes-outils.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
12-abstraits.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
13-rituels.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
14-geographie.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
15-roles-titres.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
16-communication.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
17-temps.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
18-couleurs.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
19-sante-dangers.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
20-objets-materiaux.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
21-famille.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
22-nombres.json Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
lowercase-confluent.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00