confluent/ConfluentTranslator
StillHammer e93c2f485b Analyse détaillée des mots problématiques du texte de test
Investigation complète des 10 mots non trouvés (8 après ajout ve/eol):

Découvertes:
- tiru:  Légitime (nombre = 3 dans 22-nombres.json)
- kisaran vs kisiran: ⚠️ Deux formes dans le texte, probable typo
- uravis:  Suffixe 'vis' inexistant dans grammaire
- sukamori:  Racine 'mori' totalement absente du lexique
- uraal:  Composition invalide (pas de racine 'al')
- kala:  Totalement absent
- vulu:  Totalement absent

Recommandations:
- Option A: Corriger le texte de test
- Option B: Documenter les nouveaux mots si légitimes
- Option C: Hybride (ajouter tiru, corriger kisaran, valider reste)

Document: ConfluentTranslator/ANALYSE_MOTS_PROBLEMATIQUES.md

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 07:47:11 +08:00
..
plans Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
prompts Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
public Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
ANALYSE_MOTS_PROBLEMATIQUES.md Analyse détaillée des mots problématiques du texte de test 2025-12-01 07:47:11 +08:00
confluentToFrench.js Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
contextAnalyzer.js Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
lexiqueLoader.js Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
morphologicalDecomposer.js Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
NUMBER_PREPROCESSING.md Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
numberPreprocessor.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
package-lock.json Ajout Proto-Confluent + ConfluentTranslator 2025-11-27 11:54:38 +08:00
package.json Ajout Proto-Confluent + ConfluentTranslator 2025-11-27 11:54:38 +08:00
promptBuilder.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
radicalMatcher.js Amélioration système de traduction: normalisation, lexique et couverture 2025-11-30 22:37:31 +08:00
README.md Ajout Proto-Confluent + ConfluentTranslator 2025-11-27 11:54:38 +08:00
reverseIndexBuilder.js Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
server.js Amélioration lemmatisation FR + normalisation accents + extension lexique 2025-11-30 16:43:34 +08:00
test1.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test2.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-accents.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-complexe.txt Implement radical lookup system for Confluent translator (83% → 92% coverage) 2025-11-28 22:24:56 +08:00
test-context-skimming.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
test-contextAnalyzer.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
test-lemmatize.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-long-coverage.js Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-marcher.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-nombres.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-number-preprocessor.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-observe.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-observent-seul.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-prep.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-prompt-nombres.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-promptBuilder.js Implémentation du système de prompt contextuel intelligent 2025-11-28 11:08:45 +08:00
test-results-radical-system.md Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-simple-nombre.js Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00
test-voient-seul.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
test-voit.json Amélioration couverture lexicale: 36.5% → 54.7% (long texts) 2025-11-30 18:02:15 +08:00
TESTS_NOMBRES_RESULTAT.md Système de nombres Base 12 + Number Preprocessor COMPLET 2025-11-28 13:58:04 +08:00

ConfluentTranslator

Traducteur Français vers Proto-Confluent et Ancien Confluent utilisant des LLMs.

Installation

cd ConfluentTranslator
npm install

Configuration

Le fichier .env doit être présent à la racine du projet parent (../) avec :

ANTHROPIC_API_KEY=your_key_here
OPENAI_API_KEY=your_key_here

Lancement

npm start

Interface accessible sur : http://localhost:3000

Utilisation

  1. Configurer le provider : Choisir entre Anthropic ou OpenAI
  2. Choisir le modèle : Selon le provider sélectionné
  3. Sélectionner la langue cible : Proto-Confluent ou Ancien Confluent
  4. Entrer le texte français et cliquer sur "Traduire"

La configuration est sauvegardée automatiquement dans le navigateur.

Structure

ConfluentTranslator/
├── server.js              # Serveur Express + API
├── package.json
├── public/
│   └── index.html         # Interface web
└── prompts/
    ├── proto-system.txt   # Prompt système Proto-Confluent
    └── ancien-system.txt  # Prompt système Ancien Confluent

Langues supportées

Proto-Confluent

  • Langue primitive des premiers clans
  • Phonologie réduite : 4 voyelles, 8 consonnes
  • Syntaxe SOV simple
  • Pas de fusion, mots isolés

Ancien Confluent

  • Langue unifiée de la civilisation
  • Phonologie complète : 5 voyelles, 10 consonnes
  • Liaisons sacrées (16 types)
  • Système verbal et temporel complet