Corrections majeures: - Normalisation ligatures (œ→oe, æ→ae) pour éviter fragmentation tokens - Normalisation complète lexique (clés + synonymes) sans accents - Correction faux positif "dansent"→"dans" (longueur radical ≥5) Enrichissement lexique (+212 entrées): - Verbes: battre (pulum), penser/réfléchir (umis), voler (aliuk) - Mots grammaticaux: nous (tanu), possessifs (sa/mon→na), démonstratifs (ce→ko) - Temporels: hier/avant (at), demain/après (ok), autour (no) - Formes conjuguées ajoutées pour manger, battre, penser Améliorations techniques: - Lemmatisation verbale améliorée (radical ≥5 lettres) - Système normalizeText() dans lexiqueLoader.js - Liaisons sacrées pour compositions culturelles Note: Problème connu de lemmatisation à investiguer (formes fléchies non trouvées) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com> |
||
|---|---|---|
| .. | ||
| plans | ||
| prompts | ||
| public | ||
| confluentToFrench.js | ||
| contextAnalyzer.js | ||
| lexiqueLoader.js | ||
| morphologicalDecomposer.js | ||
| NUMBER_PREPROCESSING.md | ||
| numberPreprocessor.js | ||
| package-lock.json | ||
| package.json | ||
| promptBuilder.js | ||
| radicalMatcher.js | ||
| README.md | ||
| reverseIndexBuilder.js | ||
| server.js | ||
| test1.json | ||
| test2.json | ||
| test-accents.json | ||
| test-complexe.txt | ||
| test-context-skimming.js | ||
| test-contextAnalyzer.js | ||
| test-lemmatize.json | ||
| test-long-coverage.js | ||
| test-marcher.json | ||
| test-nombres.js | ||
| test-number-preprocessor.js | ||
| test-observe.json | ||
| test-observent-seul.json | ||
| test-prep.json | ||
| test-prompt-nombres.js | ||
| test-promptBuilder.js | ||
| test-results-radical-system.md | ||
| test-simple-nombre.js | ||
| test-voient-seul.json | ||
| test-voit.json | ||
| TESTS_NOMBRES_RESULTAT.md | ||
ConfluentTranslator
Traducteur Français vers Proto-Confluent et Ancien Confluent utilisant des LLMs.
Installation
cd ConfluentTranslator
npm install
Configuration
Le fichier .env doit être présent à la racine du projet parent (../) avec :
ANTHROPIC_API_KEY=your_key_here
OPENAI_API_KEY=your_key_here
Lancement
npm start
Interface accessible sur : http://localhost:3000
Utilisation
- Configurer le provider : Choisir entre Anthropic ou OpenAI
- Choisir le modèle : Selon le provider sélectionné
- Sélectionner la langue cible : Proto-Confluent ou Ancien Confluent
- Entrer le texte français et cliquer sur "Traduire"
La configuration est sauvegardée automatiquement dans le navigateur.
Structure
ConfluentTranslator/
├── server.js # Serveur Express + API
├── package.json
├── public/
│ └── index.html # Interface web
└── prompts/
├── proto-system.txt # Prompt système Proto-Confluent
└── ancien-system.txt # Prompt système Ancien Confluent
Langues supportées
Proto-Confluent
- Langue primitive des premiers clans
- Phonologie réduite : 4 voyelles, 8 consonnes
- Syntaxe SOV simple
- Pas de fusion, mots isolés
Ancien Confluent
- Langue unifiée de la civilisation
- Phonologie complète : 5 voyelles, 10 consonnes
- Liaisons sacrées (16 types)
- Système verbal et temporel complet