Commit Graph

30 Commits

Author SHA1 Message Date
6ac42ac48f 📊 Update API token usage statistics
Automatic update of token usage counters.
Date: 2026-01-26
2026-01-26 14:14:49 +00:00
49eb7bac6d Récupération commit perdu + fix chemin lexiques
- Restauration onglets Guide et Exemples (commit 7f2fa61 perdu lors rebase)
- Fix baseDir dans server.js pour charger les lexiques correctement
- Normalisation fins de ligne CRLF → LF

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-02 13:55:39 +00:00
aed98f17ea Update project structure and documentation
- Update CLAUDE.md to reflect new directory structure
- Add ancien-confluent and proto-confluent language variants
- Reorganize ConfluentTranslator with modular architecture
- Add comprehensive user guide (GUIDE_UTILISATION.md)
- Update API documentation and configuration files
- Clean up obsolete documentation files

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-23 07:23:58 +08:00
5602ce50be Prepare project for GitHub publication
- Add comprehensive README.md with examples and quick start
- Add SECURITY.md with API key safety guidelines
- Add MIT LICENSE
- Add .gitattributes for line ending normalization
- Create .env.example templates (root + ConfluentTranslator)
- Update .gitignore (remove unused rules, add .env variants)
- Archive work documents to docs/archive/
- Remove temporary files (nul, prompt-*.json)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-10 08:57:43 +08:00
0d3f938ca9 Migration Gitea 2025-12-04 20:12:10 +08:00
b37bc89ace Fix: Corriger chemins relatifs aprĂšs restructuration + configuration PM2
🔧 Corrections chemins relatifs (commit 4b0f916)
- Fix radicalMatcher.js: ../../../../data/lexique.json
- Fix morphologicalDecomposer.js: ../../../../data/lexique.json
- Fix promptBuilder.js: ../../../prompts/
- Fix auth.js: ../../data/tokens.json
- Fix server.js: ../../prompts/cf2fr-refinement.txt

⚙ Configuration PM2
- Add ecosystem.config.js pour gestion PM2 propre
- Fix chargement variables d'environnement .env

✅ Tests complets
- Add TEST_RESULTS.md avec documentation complĂšte
- Tous les endpoints testés et fonctionnels
- Traductions Anthropic + OpenAI opérationnelles

📩 Lexique
- Add symlinks ancien-confluent/ et proto-confluent/
- Add lexique.json et lexique-francais-confluent.json
- 1,835 mots FR, 904 mots CF, 670 racines chargées

🚀 Statut: Serveur ONLINE, tous endpoints fonctionnels

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-04 07:56:54 +00:00
4b0f916d1c Restructuration complĂšte du projet ConfluentTranslator
- Nouvelle architecture modulaire avec src/api, src/core, src/utils
- Séparation claire docs/ (admin, changelog, dev, security) et tests/ (unit, integration, scripts)
- server.js devient un simple point d'entrée
- Ajout de STRUCTURE.md documentant l'architecture
- Archivage ancien-confluent/ avec générateur de lexique complet

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-02 23:28:12 +08:00
272a05b3fe Suppression rate limiters inutiles et optimisation polling LLM
ProblÚmes résolus:
- Polling toutes les 3s vers /api/llm/limit (1200 req/h par user)
- Rate limiters par IP bloquaient légitimement les traductions
- globalLimiter (200/15min) et translationLimiter (10/min) redondants

Changements:
- Suppression setInterval 3s dans index.html
- Mise Ă  jour compteur LLM uniquement aprĂšs traductions
- Suppression globalLimiter et translationLimiter
- Garde uniquement checkLLMLimit() (par API key, 20/jour)
- Fix affichage: utilise data.remaining de l'API

Résultat: systÚme de quotas simple, clair et fonctionnel

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-02 20:24:50 +08:00
f2143bb10b WIP: Custom API keys + rate limiter fixes (Ă  continuer)
- Ajout support custom API keys (Anthropic/OpenAI) dans localStorage
- Backend utilise custom keys si fournis (pas de déduction rate limit)
- Tentative fix rate limiter pour /api/llm/limit (skip globalLimiter)
- Fix undefined/undefined dans compteur requĂȘtes
- Ajout error loop prevention (stop aprĂšs 5 erreurs)
- Reset quotidien Ă  minuit pour compteur LLM

Note: ProblÚme 429 persiste, à débugger à la maison

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-02 16:40:48 +08:00
3cd73e6598 Ajout systĂšme d'authentification complet avec interface de connexion
Backend:
- auth.js: SystĂšme de tokens avec API keys UUID
- rateLimiter.js: Rate limiting multi-tiers (global, traduction, admin)
- logger.js: Logging des requĂȘtes avec rotation automatique
- adminRoutes.js: Routes admin pour gestion des tokens
- server.js: Intégration de tous les middlewares de sécurité

Frontend:
- Interface de connexion modale élégante
- Stockage sécurisé API key dans localStorage
- Bouton déconnexion dans le header
- authFetch() wrapper pour toutes les requĂȘtes protĂ©gĂ©es
- Protection automatique des endpoints de traduction

Sécurité:
- Token admin généré automatiquement au premier lancement
- Limites quotidiennes par token configurables
- Rate limiting pour prévenir les abus
- Logs dĂ©taillĂ©s de toutes les requĂȘtes

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-02 12:01:01 +08:00
5ad89885fc Retrait du Proto-Confluent de l'interface + nettoyage lexique
- Interface: suppression sélecteur variante Proto/Ancien
- Frontend: fixé uniquement sur Ancien Confluent
- Lexique: correction doublons et consolidation
- Traducteur: optimisations CF→FR et FR→CF
- Scripts: ajout audit et correction doublons

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-02 11:36:58 +08:00
4236232a62 Refonte complĂšte du lexique Confluent et systĂšme d'audit
- Correction et extension du lexique: 78 → 0 erreurs
- Ajout de 14 racines manquantes (toli, konu, aika, vito, paka, nutu, tuli, nemu, zeru, novi, muta, supu, selu, saki)
- Extension du lexique: 67 racines standards (53 → 67)
- CrĂ©ation de 6 nouveaux fichiers lexique (navigation, architecture, concepts philosophiques, Ă©trangers, actions militaires, vĂȘtements)
- RĂ©duction consonnes rares: 26.5% → 2.7%
- Remplacement racines anglaises par finno-basques (malo→paka, situ→tuli, taki→kanu, time→aika)
- Correction des mots mal formĂ©s (ulak→kulak, koliukitan→koliukita, ulapisu→lapis, pekikayo→pekikazo)
- Amélioration script d'audit: charge maintenant verbes, compositions et grammaire (638 racines)
- Ajout scripts de maintenance (audit, correction consonnes rares, détection doublons)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 21:53:03 +08:00
6597ac8cbb Ajout onglet Settings avec configuration globale complĂšte
Nouvel onglet Settings (⚙) permettant de configurer:

ParamĂštres globaux:
- Niveau de langue (Proto/Ancien Confluent)
  → S'applique aux traductions et au lexique
  → SupprimĂ© des onglets individuels

Configuration LLM:
- Provider (Anthropic/OpenAI)
- ModĂšle (avec mise Ă  jour dynamique selon provider)
- Température (slider 0.0-2.0 pour créativité)

Interface:
- ThĂšme clair/sombre avec CSS complet
- Mode verbose (checkbox pour détails)
- Application immédiate du thÚme

API Keys (optionnel):
- Anthropic API Key
- OpenAI API Key
- Placeholder pour utilisation clés serveur

Fonctionnalités:
- localStorage pour persistance
- Bouton sauvegarde avec message confirmation
- ParamÚtres appliqués à tous les onglets
- Valeurs par défaut définies

Interface simplifiée: choix de langue retiré des autres onglets
car centralisé dans Settings.

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 12:17:57 +08:00
f05805e705 Ajout traduction Confluent→Français + suppression choix IA
Modifications de l'interface HTML:
- Ajout onglet "Confluent → Français" avec traducteur brut
- Appel API vers /api/translate/conf2fr
- Renommage onglet "Traduction" → "Français → Confluent"
- Suppression section "Configuration" (provider/model)
- Simplification: seul le choix langue cible reste
- Nettoyage code JS (loadConfig, saveConfig simplifiés)

Interface plus simple et focalisée sur les fonctionnalités essentielles.

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 12:09:27 +08:00
5c03390aaf Ajout systùme raffinement LLM CF→FR + extension lexique nourriture
Nouvelles fonctionnalités:
- Endpoint /api/translate/conf2fr/llm avec raffinement LLM
- Prompt cf2fr-refinement.txt expliquant structure Confluent
- Test test-llm-refinement.bat pour validation

Améliorations lexique:
- Ajout lexique 23-nourriture.json (vocabulaire alimentaire)
- Ajout lexique 24-habitat.json (habitat et construction)
- Correction "generation" → noviuaita (nouvelles gĂ©nĂ©rations)
- Ajout "cuisiner" → mukunekas (composition muk-u-nekas)
- Fix Ariaska → Aliaska dans prompts

Tests et outils:
- Tests de coverage et reverse translation
- Convertisseur de nombres
- Debug lemmatisation

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 11:40:30 +08:00
e93c2f485b Analyse détaillée des mots problématiques du texte de test
Investigation complÚte des 10 mots non trouvés (8 aprÚs ajout ve/eol):

Découvertes:
- tiru: ✅ LĂ©gitime (nombre = 3 dans 22-nombres.json)
- kisaran vs kisiran: ⚠ Deux formes dans le texte, probable typo
- uravis: ❌ Suffixe 'vis' inexistant dans grammaire
- sukamori: ❌ Racine 'mori' totalement absente du lexique
- uraal: ❌ Composition invalide (pas de racine 'al')
- kala: ❌ Totalement absent
- vulu: ❌ Totalement absent

Recommandations:
- Option A: Corriger le texte de test
- Option B: Documenter les nouveaux mots si légitimes
- Option C: Hybride (ajouter tiru, corriger kisaran, valider reste)

Document: ConfluentTranslator/ANALYSE_MOTS_PROBLEMATIQUES.md

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 07:47:11 +08:00
889cd24319 Amélioration systÚme de traduction: normalisation, lexique et couverture
Corrections majeures:
- Normalisation ligatures (Ɠ→oe, é→ae) pour Ă©viter fragmentation tokens
- Normalisation complÚte lexique (clés + synonymes) sans accents
- Correction faux positif "dansent"→"dans" (longueur radical ≄5)

Enrichissement lexique (+212 entrées):
- Verbes: battre (pulum), penser/réfléchir (umis), voler (aliuk)
- Mots grammaticaux: nous (tanu), possessifs (sa/mon→na), dĂ©monstratifs (ce→ko)
- Temporels: hier/avant (at), demain/aprĂšs (ok), autour (no)
- Formes conjuguées ajoutées pour manger, battre, penser

Améliorations techniques:
- Lemmatisation verbale amĂ©liorĂ©e (radical ≄5 lettres)
- SystĂšme normalizeText() dans lexiqueLoader.js
- Liaisons sacrées pour compositions culturelles

Note: ProblÚme connu de lemmatisation à investiguer (formes fléchies non trouvées)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 22:37:31 +08:00
fd3e286bb1 AmĂ©lioration couverture lexicale: 36.5% → 54.7% (long texts)
## Lexique enrichi (871 → 940 entrĂ©es)

### Verbes ajoutés avec conjugaisons complÚtes
- planer → aliuk (CVCVC)
- rĂ©sonner → kekak (CVCVC)
- rejoindre → kotan (CVCVC) - conjugaisons irrĂ©guliĂšres corrigĂ©es

### Mots grammaticaux ajoutés (00-grammaire.json)
- qui/que/dont → ki (pronom relatif)
- leurs/leur → nasu (possessif 3p pluriel)
- ces/ceux/celles → tovasu (dĂ©monstratif pluriel)
- chaque/chacun → eka (quantificateur)
- depuis → ve (particule origine temporelle)
- ils/elles → tasu (pronom personnel 3p)
- et/mais → lo (ajout synonymes)
- dessus/au-dessus → ze (particule spatiale)
- tous/toutes/tout → susu (quantificateur)

### Noms et concepts ajoutés
- antre/caverne/grotte → keku (04-lieux.json)
- tradition/coutume → aitatoku (13-rituels.json)
- artisan → nekatoku (15-roles-titres.json)

### Adjectifs: formes féminines/plurielles
- gris → grise, gris (pluriel) (18-couleurs.json)
- ancien → anciens, ancienne, anciennes, ancĂȘtre, ancĂȘtres (01-racines-sacrees.json)
- sacrĂ© → sacrĂ©s, sacrĂ©e, sacrĂ©es (01-racines-sacrees.json)

## Corrections
- rejoindre: conjugaisons irréguliÚres corrigées (rejoignent vs rejoindent)

## Tests
- Ajout test-long-coverage.js pour validation exhaustive
- 4 textes longs testés
- Couverture globale: 54.7% (81/148 mots de contenu)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 18:02:15 +08:00
ead5e78111 Gestion adverbes -ment + formes adjectifs + extension lexique personnes
## 1. Lemmatisation adverbes en -ment (contextAnalyzer.js)

Ajout gestion automatique des adverbes français :
- lentement → lent
- rapidement → rapide
- prudemment → prudent (emment → ent)
- couramment → courant (amment → ant)

Les adverbes sont maintenant traités comme leurs adjectifs de base.

## 2. Formes fléchies adjectifs (11 adjectifs enrichis)

Script automatique générant féminin/pluriel pour tous les adjectifs:
- grand → grande, grands, grandes
- petit → petite, petits, petites
- nouveau → nouvelle, nouveaux, nouvelles
- vieux → vieille, vieilles
- lumineux → lumineuse, lumineuses
- sombre, pale, translucide, patine, eclat → pluriels

## 3. Nouveaux adjectifs (02-racines-standards.json)

- **lent** → telu (+ lente, lents, lentes, lentement)
- **rapide** → hayo (+ rapides, rapidement, vif/vive)

## 4. Extension lexique personnes (21-famille.json)

Ajout vocabulaire genré conforme phonologie Confluent:
- **homme** → toko (+ hommes)
- **femme** → nako (+ femmes)
- **garçon** → toku (+ garçons) - mĂȘme racine tok que homme
- **fille** → naku (+ filles) - mĂȘme racine nak que femme

Cohérence sémantique : fille/garçon partagent racines avec femme/homme.

## Résultats tests

Coverage améliorée sur phrases test :
- "Les enfants des échos observent la grande fresque" : **100%** (5/5)
- "Le petit enfant marche lentement vers la grande maison" : **100%** (7/7)
- "Les femmes chantent et dansent sous la lune" : **100%** (5/5)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 17:09:05 +08:00
dc6affc7fd Amélioration lemmatisation FR + normalisation accents + extension lexique
## Fixes

### 1. Lemmatisation verbes français (contextAnalyzer.js)
- Fix: 'ent' → 'er' (observent → observer, marchent → marcher)
- Add: rùgles 'ient' → 'ir' (voient → voir)
- Add: rùgles 'oient' → 'oir' (alternative)
- Résultat: reconnaissance conjugaisons françaises améliorée

## Ajouts lexique

### 2. Verbe "marcher" (06-actions.json)
- Confluent: tekam (racine: teka, forme liée: tek)
- Conjugaisons: marche, marches, marchons, marchent, etc.

### 3. PrĂ©positions → Particules (00-grammaire.json)
- "dans/sur/sous" → no (localisation spatiale)
- "avec" → vi (instrument/accompagnement)
- "pour/contre" → se (but/bĂ©nĂ©ficiaire)
- "sans" → zo (nĂ©gation)
- "pendant" → at (passĂ© vĂ©cu)

### 4. Composant "echos" (03-castes.json)
- Extraction racine: "Ă©chos" → keko
- Permet reconnaissance mot seul (pas seulement dans "Enfants des Échos")

## Refactor majeur

### 5. Normalisation accents (23 fichiers JSON)
- Suppression accents de TOUTES les clés de dictionnaire
- Cohérence avec normalisation NFD cÎté serveur
- Fichiers normalisés:
  * 00-grammaire.json Ă  22-nombres.json (tous les lexiques)

## Résultats

Couverture améliorée sur phrases test:
- "Les enfants des Ă©chos observent la grande fresque": 40% → 80% (4/5)
- "Le soleil brille sur les montagnes pendant l'Ă©tĂ©": 33% → 67% (4/6)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 16:43:34 +08:00
72616f7802 Ajout particules ve/eol + documentation incohérences linguistiques
- Ajout de 've' (origine) et 'eol' (habituel) dans 00-grammaire.json
- Documentation détaillée des incohérences dans test-results-radical-system.md
- Alerte sur suffixes 'aran' et 'vis' non documentés dans grammaire officielle
- Révision objectifs coverage: 94% réaliste aprÚs ajout ve/eol
- Recommandation: valider texte de test avant ajout de nouveaux suffixes

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-29 15:03:36 +08:00
e8d17ab0d5 Implement radical lookup system for Confluent translator (83% → 92% coverage)
Major features:
- Radical-based word matching for conjugated verbs
- Morphological decomposition for compound words
- Multi-index search (byWord + byFormeLiee)
- Cascade search strategy with confidence scoring

New files:
- ConfluentTranslator/radicalMatcher.js: Extract radicals from conjugated forms
- ConfluentTranslator/morphologicalDecomposer.js: Decompose compound words
- ConfluentTranslator/plans/radical-lookup-system.md: Implementation plan
- ConfluentTranslator/test-results-radical-system.md: Test results and analysis
- ancien-confluent/lexique/00-grammaire.json: Grammar particles
- ancien-confluent/lexique/lowercase-confluent.js: Lowercase utility

Modified files:
- ConfluentTranslator/reverseIndexBuilder.js: Added byFormeLiee index
- ConfluentTranslator/confluentToFrench.js: Cascade search with radicals
- Multiple lexique JSON files: Enhanced entries with forme_liee

Test results:
- Before: 83% coverage (101/122 tokens)
- After: 92% coverage (112/122 tokens)
- Improvement: +9 percentage points

Remaining work to reach 95%+:
- Add missing particles (ve, eol)
- Enrich VERBAL_SUFFIXES (aran, vis)
- Document missing words (tiru, kala, vulu)

đŸ€– Generated with Claude Code (https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 22:24:56 +08:00
35e7b6dd9d SystÚme émotionnel complet - Métaphores corporelles
# Vocabulaire Émotionnel COMPLET
- Documentation complĂšte: docs/EMOTIONS_METAPHORES.md (400+ lignes)
  * 20+ émotions basées sur métaphores corporelles
  * 4 racines corporelles: kori (cƓur), sili (regard), kina (sang), puli (souffle)
  * Métaphores simples pour usage quotidien (ex: kori sora = joyeux)
  * Compositions formelles avec liaisons sacrées (ex: koriasora)

# Émotions DocumentĂ©es
Positives:
- Joie = kori sora / koriasora (cƓur-soleil)
- Amour = koriakota (cƓur-union)
- Espoir = koriaora (cƓur-aurore)
- SĂ©rĂ©nitĂ© = koriaura (cƓur-eau)
- Confiance = koriaveri (cƓur-vĂ©ritĂ©)
- FiertĂ© = koriamako (cƓur-grandeur)
- Gratitude = koriakita (cƓur-don)

Négatives:
- Tristesse = kori taku / koriataku (cƓur-sombre)
- Peur = sili taku / siliataku (regard-obscur)
- ColĂšre = kina suki / koriasuki (sang-feu)
- Haine = koriozoka (cƓur-contre-ennemi)
- Angoisse = korioavuku (cƓur-vers-gouffre)
- DĂ©sespoir = korizoora (cƓur-sans-aurore)
- Honte = koriataku (cƓur-ombre)

# Prompt SystĂšme Enrichi
- ConfluentTranslator/prompts/ancien-system.txt
  * Section "ÉMOTIONS (MÉTAPHORES CORPORELLES)" ajoutĂ©e
  * 6 métaphores simples documentées
  * 7 compositions formelles avec exemples
  * RĂšgles de construction avec liaisons

# Principe Culturel
Les Siliaska n'ont PAS de mots abstraits pour les émotions.
Ils utilisent des métaphores corporelles vivantes:
- Le cƓur ressent (kori)
- Le regard révÚle (sili)
- Le sang brûle (kina)
- Le souffle calme (puli)

# Résultats
✅ 3/3 systùmes essentiels COMPLÉTÉS:
  1. ✅ Nombres (Base 12 + Preprocessor)
  2. ✅ Adjectifs (Double systùme)
  3. ✅ Émotions (MĂ©taphores corporelles)

✅ Langue Confluent COMPLÈTE pour JDR
✅ Documentation totale: 2000+ lignes
✅ SystĂšme culturellement cohĂ©rent
✅ TODO mis à jour: Émotions ✅ FAIT

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 14:06:37 +08:00
19197df56b SystĂšme de nombres Base 12 + Number Preprocessor COMPLET
# SystÚme de Numération Base 12
- Lexique complet: ancien-confluent/lexique/22-nombres.json
  * 13 chiffres de base (0-12: zaro, iko, diku... tolu)
  * Puissances de 12 (tolusa=144, toluaa=1728, tolumako=20736)
  * Construction positionnelle (ex: 25 = diku tolu iko)
  * Quantificateurs vagues (tiru tiru, tolu tolu, mako, pisu)

- Documentation culturelle: docs/SYSTEME_NUMERIQUE_BASE12.md (600+ lignes)
  * Ancrage culturel profond (12 lunes/an, 12 phalanges, 12 clans originels)
  * Comptage corporel naturel (jusqu'Ă  60)
  * Avantages mathématiques (+50% plus rapide, fractions exactes)
  * Calendrier 12 lunaisons, expressions idiomatiques

- Référence rapide: docs/REFERENCE_RAPIDE_NOMBRES.md
  * Tables de conversion Base 10 ↔ Base 12
  * Formule rapide de conversion
  * Exemples d'usage commercial/architectural

# Number Preprocessor (Innovation Majeure)
- Module numberPreprocessor.js
  * Détecte automatiquement les nombres dans le texte français
  * Convertit Base 10 → Base 12 → Vocabulaire Confluent
  * Supporte: chiffres arabes, lettres françaises, compositions complexes
  * Anti-overlap intelligent (évite doublons comme "vingt-cinq" + "vingt" + "cinq")

- Intégration au systÚme de prompts
  * promptBuilder.js modifié pour appeler le preprocessor
  * server.js mis Ă  jour (passe texte original Ă  buildContextualPrompt)
  * Section "NOMBRES DÉTECTÉS" ajoutĂ©e dynamiquement au prompt
  * Fournit traductions EXACTES au LLM (zéro erreur de calcul)

- Tests complets
  * test-number-preprocessor.js: tests unitaires (✅ 100% OK)
  * Détection: 98% précision, 0 faux positifs
  * Conversion base 12: 100% exactitude
  * Vocabulaire Confluent: généré correctement

# Prompt SystĂšme Enrichi
- ConfluentTranslator/prompts/ancien-system.txt
  * Section "SYSTÈME DE NOMBRES (BASE 12)" ajoutée
  * Chiffres 0-12 documentés
  * Puissances et construction expliquées
  * Exemple 4 avec traduction nombres

# Résultats
✅ SystĂšme base 12 culturellement cohĂ©rent
✅ Preprocessing automatique des nombres
✅ Traductions exactes garanties (pas d'erreur LLM)
✅ Performance: dĂ©tection instantanĂ©e, conversion prĂ©cise
✅ Documentation complùte (900+ lignes)
✅ TODO mis à jour: Nombres ✅ FAIT

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 13:58:04 +08:00
987e395b1a Implémentation systÚme de racines françaises pour matching verbes conjugués
**Code** :
- Ajout matching racine_fr dans contextAnalyzer.js (score 0.75)
- Nouvelle condition : word.startsWith(entry.racine_fr.toLowerCase())

**Lexique** :
- Ajout champ racine_fr pour 41 verbes dans 06-actions.json
- 40 verbes avec racines optimales, 1 null (aller - trop irrégulier)
- Ajout 16 verbes avec formes exceptionnelles dans synonymes_fr
- Exemples : "voi" (voir), "donn" (donner), "compar" (comparer)

**Documentation** :
- Nouveau fichier docs/RACINES_VERBES_FRANCAIS.md
- Analyse complĂšte des 43 verbes du lexique
- Distribution : 39.5% racines 4L, 23.3% 3L, 20.9% 5L
- 79% verbes parfaitement réguliers

**Tests validés** :
- "mangĂ©" → trouve "manger" via racine "mang" (score 0.75) ✅
- "pris" → trouve "prendre" via synonymes_fr (score 0.9) ✅
- "donnait" → trouve "donner" via lemma (score 0.95) ✅
- "vu" → trouve "voir" via synonymes_fr (score 0.9) ✅

Cascade matching finale : exact(1.0) > lemma(0.95) > synonyme(0.9) >
synonyme-lemma(0.85) > racine-fr(0.75)

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 13:04:51 +08:00
bbd8d5f9c9 Amélioration majeure du systÚme de traduction Confluent
- Prompt systĂšme strict avec Chain-of-Thought obligatoire
- Retrait des racines en dur du prompt (context skimming pur)
- Amélioration logique fallback (activation si <50% couverture)
- Ajout lexique : loup, frĂšre, manger + fichier famille
- Debug endpoint /api/debug/prompt pour inspection
- Documentation complÚte systÚme racines françaises

đŸ€– Generated with Claude Code

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 12:18:55 +08:00
894645e640 Implémentation du systÚme de prompt contextuel intelligent
Nouveau systÚme qui analyse le texte français et génÚre des prompts optimisés en incluant uniquement le vocabulaire pertinent du lexique, réduisant drastiquement le nombre de tokens.

# Backend

- contextAnalyzer.js : Analyse contextuelle avec lemmatisation française
  - Tokenization avec normalisation des accents
  - Recherche intelligente (correspondances exactes, synonymes, formes conjuguées)
  - Calcul dynamique du nombre max d'entrées selon longueur (30/50/100)
  - Expansion sémantique niveau 1 (modulaire pour futur)
  - Fallback racines (309 racines si mots inconnus)

- promptBuilder.js : Génération de prompts optimisés
  - Templates de base sans lexique massif
  - Injection ciblée du vocabulaire pertinent
  - Formatage par type (racines sacrées, standards, verbes)
  - Support fallback avec toutes les racines

- server.js : Intégration API avec structure 3 layers
  - Layer 1: Traduction pure
  - Layer 2: Métadonnées contextuelles (mots trouvés, optimisation)
  - Layer 3: Explications du LLM (décomposition, notes)

- lexiqueLoader.js : Fusion du lexique simple data/lexique-francais-confluent.json
  - Charge 636 entrées (516 ancien + 120 merged)

# Frontend

- index.html : Interface 3 layers collapsibles
  - Layer 1 (toujours visible) : Traduction avec mise en valeur
  - Layer 2 (collapsible) : Contexte lexical + statistiques d'optimisation
  - Layer 3 (collapsible) : Explications linguistiques du LLM
  - Design dark complet (fix fond blanc + listes déroulantes)
  - Animations smooth pour expand/collapse

# Documentation

- docs/PROMPT_CONTEXTUEL_INTELLIGENT.md : Plan complet validé
  - Architecture technique détaillée
  - Cas d'usage et décisions de design
  - Métriques de succÚs

# Tests

- Tests exhaustifs avec validation exigeante
- Économie moyenne : 81% de tokens
- Économie minimale : 52% (mĂȘme avec fallback)
- Context skimming opérationnel et validé

# Corrections

- ancien-confluent/lexique/02-racines-standards.json : Fix erreur JSON ligne 527

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 11:08:45 +08:00
feb0648512 Ajout formules rituelles et TODO finalisation langue
- Créé 19 formules rituelles en Confluent (salutations, rituels, bénédictions, mémoire, transmission, deuil, union)
- Contrainte: mots max 6 lettres pour mémorisation
- Simplicité graduée: salutations simples (1-2 mots), deuil complexe (6-7 mots)
- Ajout lexique complet Ancien Confluent en annexe (racines, verbes, conjugateurs, particules, liaisons)
- Créé TODO.md avec tùches finales: nombres limités, adjectifs, émotions (métaphores corporelles)
- Propositions relatives en bonus optionnel pour authenticité historique

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 07:18:01 +08:00
6fe6c7867e Ajout onglet Lexique + structure JSON modulaire
- Ajout onglet "Lexique" dans ConfluentTranslator
  - Recherche en temps réel à chaque lettre tapée
  - Sélecteur Proto/Ancien Confluent
  - Affichage français → confluent avec compteur
  - Endpoint /lexique dans server.js

- Structure modulaire lexique-ancien/ (21 fichiers)
  - Format ultra-flexible : normalisation FR, multi-traductions, métadonnées
  - 20 domaines thématiques (castes, lieux, émotions, actions...)
  - ~500-600 mots à remplir (listés en commentaire _mots_a_gerer)

- Structure modulaire lexique-proto/ (6 fichiers)
  - Racines monosyllabiques primitives
  - ~150-200 racines Ă  remplir
  - README explicatif des différences Proto/Ancien

Format JSON supporte :
- Synonymes FR (chevaux → cheval)
- Plusieurs traductions CF par mot FR
- Compositions avec racines + sens littéral
- Évolution Proto → Ancien

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-27 12:52:07 +08:00
8ff322b85a Ajout Proto-Confluent + ConfluentTranslator
- Documentation complĂšte Proto-Confluent (langue primitive)
- Traducteur web FR → Proto/Ancien Confluent
- Interface avec config persistante (Anthropic/OpenAI)
- Prompts systĂšme pour traduction LLM

đŸ€– Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-27 11:54:38 +08:00