## Fixes ### 1. Lemmatisation verbes français (contextAnalyzer.js) - Fix: 'ent' → 'er' (observent → observer, marchent → marcher) - Add: règles 'ient' → 'ir' (voient → voir) - Add: règles 'oient' → 'oir' (alternative) - Résultat: reconnaissance conjugaisons françaises améliorée ## Ajouts lexique ### 2. Verbe "marcher" (06-actions.json) - Confluent: tekam (racine: teka, forme liée: tek) - Conjugaisons: marche, marches, marchons, marchent, etc. ### 3. Prépositions → Particules (00-grammaire.json) - "dans/sur/sous" → no (localisation spatiale) - "avec" → vi (instrument/accompagnement) - "pour/contre" → se (but/bénéficiaire) - "sans" → zo (négation) - "pendant" → at (passé vécu) ### 4. Composant "echos" (03-castes.json) - Extraction racine: "échos" → keko - Permet reconnaissance mot seul (pas seulement dans "Enfants des Échos") ## Refactor majeur ### 5. Normalisation accents (23 fichiers JSON) - Suppression accents de TOUTES les clés de dictionnaire - Cohérence avec normalisation NFD côté serveur - Fichiers normalisés: * 00-grammaire.json à 22-nombres.json (tous les lexiques) ## Résultats Couverture améliorée sur phrases test: - "Les enfants des échos observent la grande fresque": 40% → 80% (4/5) - "Le soleil brille sur les montagnes pendant l'été": 33% → 67% (4/6) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com> |
||
|---|---|---|
| .. | ||
| plans | ||
| prompts | ||
| public | ||
| confluentToFrench.js | ||
| contextAnalyzer.js | ||
| lexiqueLoader.js | ||
| morphologicalDecomposer.js | ||
| NUMBER_PREPROCESSING.md | ||
| numberPreprocessor.js | ||
| package-lock.json | ||
| package.json | ||
| promptBuilder.js | ||
| radicalMatcher.js | ||
| README.md | ||
| reverseIndexBuilder.js | ||
| server.js | ||
| test-complexe.txt | ||
| test-context-skimming.js | ||
| test-contextAnalyzer.js | ||
| test-nombres.js | ||
| test-number-preprocessor.js | ||
| test-prompt-nombres.js | ||
| test-promptBuilder.js | ||
| test-results-radical-system.md | ||
| test-simple-nombre.js | ||
| TESTS_NOMBRES_RESULTAT.md | ||
ConfluentTranslator
Traducteur Français vers Proto-Confluent et Ancien Confluent utilisant des LLMs.
Installation
cd ConfluentTranslator
npm install
Configuration
Le fichier .env doit être présent à la racine du projet parent (../) avec :
ANTHROPIC_API_KEY=your_key_here
OPENAI_API_KEY=your_key_here
Lancement
npm start
Interface accessible sur : http://localhost:3000
Utilisation
- Configurer le provider : Choisir entre Anthropic ou OpenAI
- Choisir le modèle : Selon le provider sélectionné
- Sélectionner la langue cible : Proto-Confluent ou Ancien Confluent
- Entrer le texte français et cliquer sur "Traduire"
La configuration est sauvegardée automatiquement dans le navigateur.
Structure
ConfluentTranslator/
├── server.js # Serveur Express + API
├── package.json
├── public/
│ └── index.html # Interface web
└── prompts/
├── proto-system.txt # Prompt système Proto-Confluent
└── ancien-system.txt # Prompt système Ancien Confluent
Langues supportées
Proto-Confluent
- Langue primitive des premiers clans
- Phonologie réduite : 4 voyelles, 8 consonnes
- Syntaxe SOV simple
- Pas de fusion, mots isolés
Ancien Confluent
- Langue unifiée de la civilisation
- Phonologie complète : 5 voyelles, 10 consonnes
- Liaisons sacrées (16 types)
- Système verbal et temporel complet