confluent/ConfluentTranslator
StillHammer dc6affc7fd Amélioration lemmatisation FR + normalisation accents + extension lexique
## Fixes

### 1. Lemmatisation verbes français (contextAnalyzer.js)
- Fix: 'ent' → 'er' (observent → observer, marchent → marcher)
- Add: règles 'ient' → 'ir' (voient → voir)
- Add: règles 'oient' → 'oir' (alternative)
- Résultat: reconnaissance conjugaisons françaises améliorée

## Ajouts lexique

### 2. Verbe "marcher" (06-actions.json)
- Confluent: tekam (racine: teka, forme liée: tek)
- Conjugaisons: marche, marches, marchons, marchent, etc.

### 3. Prépositions → Particules (00-grammaire.json)
- "dans/sur/sous" → no (localisation spatiale)
- "avec" → vi (instrument/accompagnement)
- "pour/contre" → se (but/bénéficiaire)
- "sans" → zo (négation)
- "pendant" → at (passé vécu)

### 4. Composant "echos" (03-castes.json)
- Extraction racine: "échos" → keko
- Permet reconnaissance mot seul (pas seulement dans "Enfants des Échos")

## Refactor majeur

### 5. Normalisation accents (23 fichiers JSON)
- Suppression accents de TOUTES les clés de dictionnaire
- Cohérence avec normalisation NFD côté serveur
- Fichiers normalisés:
  * 00-grammaire.json à 22-nombres.json (tous les lexiques)

## Résultats

Couverture améliorée sur phrases test:
- "Les enfants des échos observent la grande fresque": 40% → 80% (4/5)
- "Le soleil brille sur les montagnes pendant l'été": 33% → 67% (4/6)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 16:43:34 +08:00
..
plans Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
prompts Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
public Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
confluentToFrench.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
contextAnalyzer.js Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
lexiqueLoader.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
morphologicalDecomposer.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
NUMBER_PREPROCESSING.md Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
numberPreprocessor.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
package-lock.json Ajout Proto-Confluent + ConfluentTranslator 2025-11-27 11:54:38 +08:00
package.json Ajout Proto-Confluent + ConfluentTranslator 2025-11-27 11:54:38 +08:00
promptBuilder.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
radicalMatcher.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
README.md Ajout Proto-Confluent + ConfluentTranslator 2025-11-27 11:54:38 +08:00
reverseIndexBuilder.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
server.js Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
test-complexe.txt Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
test-context-skimming.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
test-contextAnalyzer.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
test-nombres.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-number-preprocessor.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-prompt-nombres.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-promptBuilder.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
test-results-radical-system.md Ajout particules ve/eol + documentation incohérences linguistiques 2025-11-29 15:03:36 +08:00
test-simple-nombre.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
TESTS_NOMBRES_RESULTAT.md Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00

ConfluentTranslator

Traducteur Français vers Proto-Confluent et Ancien Confluent utilisant des LLMs.

Installation

cd ConfluentTranslator
npm install

Configuration

Le fichier .env doit être présent à la racine du projet parent (../) avec :

ANTHROPIC_API_KEY=your_key_here
OPENAI_API_KEY=your_key_here

Lancement

npm start

Interface accessible sur : http://localhost:3000

Utilisation

  1. Configurer le provider : Choisir entre Anthropic ou OpenAI
  2. Choisir le modèle : Selon le provider sélectionné
  3. Sélectionner la langue cible : Proto-Confluent ou Ancien Confluent
  4. Entrer le texte français et cliquer sur "Traduire"

La configuration est sauvegardée automatiquement dans le navigateur.

Structure

ConfluentTranslator/
├── server.js              # Serveur Express + API
├── package.json
├── public/
│   └── index.html         # Interface web
└── prompts/
    ├── proto-system.txt   # Prompt système Proto-Confluent
    └── ancien-system.txt  # Prompt système Ancien Confluent

Langues supportées

Proto-Confluent

  • Langue primitive des premiers clans
  • Phonologie réduite : 4 voyelles, 8 consonnes
  • Syntaxe SOV simple
  • Pas de fusion, mots isolés

Ancien Confluent

  • Langue unifiée de la civilisation
  • Phonologie complète : 5 voyelles, 10 consonnes
  • Liaisons sacrées (16 types)
  • Système verbal et temporel complet