Commit Graph

5 Commits

Author SHA1 Message Date
bbd8d5f9c9 Amélioration majeure du système de traduction Confluent
- Prompt système strict avec Chain-of-Thought obligatoire
- Retrait des racines en dur du prompt (context skimming pur)
- Amélioration logique fallback (activation si <50% couverture)
- Ajout lexique : loup, frère, manger + fichier famille
- Debug endpoint /api/debug/prompt pour inspection
- Documentation complète système racines françaises

🤖 Generated with Claude Code

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 12:18:55 +08:00
894645e640 Implémentation du système de prompt contextuel intelligent
Nouveau système qui analyse le texte français et génère des prompts optimisés en incluant uniquement le vocabulaire pertinent du lexique, réduisant drastiquement le nombre de tokens.

# Backend

- contextAnalyzer.js : Analyse contextuelle avec lemmatisation française
  - Tokenization avec normalisation des accents
  - Recherche intelligente (correspondances exactes, synonymes, formes conjuguées)
  - Calcul dynamique du nombre max d'entrées selon longueur (30/50/100)
  - Expansion sémantique niveau 1 (modulaire pour futur)
  - Fallback racines (309 racines si mots inconnus)

- promptBuilder.js : Génération de prompts optimisés
  - Templates de base sans lexique massif
  - Injection ciblée du vocabulaire pertinent
  - Formatage par type (racines sacrées, standards, verbes)
  - Support fallback avec toutes les racines

- server.js : Intégration API avec structure 3 layers
  - Layer 1: Traduction pure
  - Layer 2: Métadonnées contextuelles (mots trouvés, optimisation)
  - Layer 3: Explications du LLM (décomposition, notes)

- lexiqueLoader.js : Fusion du lexique simple data/lexique-francais-confluent.json
  - Charge 636 entrées (516 ancien + 120 merged)

# Frontend

- index.html : Interface 3 layers collapsibles
  - Layer 1 (toujours visible) : Traduction avec mise en valeur
  - Layer 2 (collapsible) : Contexte lexical + statistiques d'optimisation
  - Layer 3 (collapsible) : Explications linguistiques du LLM
  - Design dark complet (fix fond blanc + listes déroulantes)
  - Animations smooth pour expand/collapse

# Documentation

- docs/PROMPT_CONTEXTUEL_INTELLIGENT.md : Plan complet validé
  - Architecture technique détaillée
  - Cas d'usage et décisions de design
  - Métriques de succès

# Tests

- Tests exhaustifs avec validation exigeante
- Économie moyenne : 81% de tokens
- Économie minimale : 52% (même avec fallback)
- Context skimming opérationnel et validé

# Corrections

- ancien-confluent/lexique/02-racines-standards.json : Fix erreur JSON ligne 527

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 11:08:45 +08:00
feb0648512 Ajout formules rituelles et TODO finalisation langue
- Créé 19 formules rituelles en Confluent (salutations, rituels, bénédictions, mémoire, transmission, deuil, union)
- Contrainte: mots max 6 lettres pour mémorisation
- Simplicité graduée: salutations simples (1-2 mots), deuil complexe (6-7 mots)
- Ajout lexique complet Ancien Confluent en annexe (racines, verbes, conjugateurs, particules, liaisons)
- Créé TODO.md avec tâches finales: nombres limités, adjectifs, émotions (métaphores corporelles)
- Propositions relatives en bonus optionnel pour authenticité historique

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 07:18:01 +08:00
6fe6c7867e Ajout onglet Lexique + structure JSON modulaire
- Ajout onglet "Lexique" dans ConfluentTranslator
  - Recherche en temps réel à chaque lettre tapée
  - Sélecteur Proto/Ancien Confluent
  - Affichage français → confluent avec compteur
  - Endpoint /lexique dans server.js

- Structure modulaire lexique-ancien/ (21 fichiers)
  - Format ultra-flexible : normalisation FR, multi-traductions, métadonnées
  - 20 domaines thématiques (castes, lieux, émotions, actions...)
  - ~500-600 mots à remplir (listés en commentaire _mots_a_gerer)

- Structure modulaire lexique-proto/ (6 fichiers)
  - Racines monosyllabiques primitives
  - ~150-200 racines à remplir
  - README explicatif des différences Proto/Ancien

Format JSON supporte :
- Synonymes FR (chevaux → cheval)
- Plusieurs traductions CF par mot FR
- Compositions avec racines + sens littéral
- Évolution Proto → Ancien

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-27 12:52:07 +08:00
8ff322b85a Ajout Proto-Confluent + ConfluentTranslator
- Documentation complète Proto-Confluent (langue primitive)
- Traducteur web FR → Proto/Ancien Confluent
- Interface avec config persistante (Anthropic/OpenAI)
- Prompts système pour traduction LLM

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-27 11:54:38 +08:00