confluent

StillHammer/confluent

Fork 0

Commit Graph

Author	SHA1	Message	Date
StillHammer	987e395b1a	Implémentation système de racines françaises pour matching verbes conjugués Code : - Ajout matching racine_fr dans contextAnalyzer.js (score 0.75) - Nouvelle condition : word.startsWith(entry.racine_fr.toLowerCase()) Lexique : - Ajout champ racine_fr pour 41 verbes dans 06-actions.json - 40 verbes avec racines optimales, 1 null (aller - trop irrégulier) - Ajout 16 verbes avec formes exceptionnelles dans synonymes_fr - Exemples : "voi" (voir), "donn" (donner), "compar" (comparer) Documentation : - Nouveau fichier docs/RACINES_VERBES_FRANCAIS.md - Analyse complète des 43 verbes du lexique - Distribution : 39.5% racines 4L, 23.3% 3L, 20.9% 5L - 79% verbes parfaitement réguliers Tests validés : - "mangé" → trouve "manger" via racine "mang" (score 0.75) ✅ - "pris" → trouve "prendre" via synonymes_fr (score 0.9) ✅ - "donnait" → trouve "donner" via lemma (score 0.95) ✅ - "vu" → trouve "voir" via synonymes_fr (score 0.9) ✅ Cascade matching finale : exact(1.0) > lemma(0.95) > synonyme(0.9) > synonyme-lemma(0.85) > racine-fr(0.75) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-28 13:04:51 +08:00
StillHammer	bbd8d5f9c9	Amélioration majeure du système de traduction Confluent - Prompt système strict avec Chain-of-Thought obligatoire - Retrait des racines en dur du prompt (context skimming pur) - Amélioration logique fallback (activation si <50% couverture) - Ajout lexique : loup, frère, manger + fichier famille - Debug endpoint /api/debug/prompt pour inspection - Documentation complète système racines françaises 🤖 Generated with Claude Code Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-28 12:18:55 +08:00
StillHammer	894645e640	Implémentation du système de prompt contextuel intelligent Nouveau système qui analyse le texte français et génère des prompts optimisés en incluant uniquement le vocabulaire pertinent du lexique, réduisant drastiquement le nombre de tokens. # Backend - contextAnalyzer.js : Analyse contextuelle avec lemmatisation française - Tokenization avec normalisation des accents - Recherche intelligente (correspondances exactes, synonymes, formes conjuguées) - Calcul dynamique du nombre max d'entrées selon longueur (30/50/100) - Expansion sémantique niveau 1 (modulaire pour futur) - Fallback racines (309 racines si mots inconnus) - promptBuilder.js : Génération de prompts optimisés - Templates de base sans lexique massif - Injection ciblée du vocabulaire pertinent - Formatage par type (racines sacrées, standards, verbes) - Support fallback avec toutes les racines - server.js : Intégration API avec structure 3 layers - Layer 1: Traduction pure - Layer 2: Métadonnées contextuelles (mots trouvés, optimisation) - Layer 3: Explications du LLM (décomposition, notes) - lexiqueLoader.js : Fusion du lexique simple data/lexique-francais-confluent.json - Charge 636 entrées (516 ancien + 120 merged) # Frontend - index.html : Interface 3 layers collapsibles - Layer 1 (toujours visible) : Traduction avec mise en valeur - Layer 2 (collapsible) : Contexte lexical + statistiques d'optimisation - Layer 3 (collapsible) : Explications linguistiques du LLM - Design dark complet (fix fond blanc + listes déroulantes) - Animations smooth pour expand/collapse # Documentation - docs/PROMPT_CONTEXTUEL_INTELLIGENT.md : Plan complet validé - Architecture technique détaillée - Cas d'usage et décisions de design - Métriques de succès # Tests - Tests exhaustifs avec validation exigeante - Économie moyenne : 81% de tokens - Économie minimale : 52% (même avec fallback) - Context skimming opérationnel et validé # Corrections - ancien-confluent/lexique/02-racines-standards.json : Fix erreur JSON ligne 527 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-28 11:08:45 +08:00

Author

SHA1

Message

Date

StillHammer

987e395b1a

Implémentation système de racines françaises pour matching verbes conjugués

**Code** :
- Ajout matching racine_fr dans contextAnalyzer.js (score 0.75)
- Nouvelle condition : word.startsWith(entry.racine_fr.toLowerCase())

**Lexique** :
- Ajout champ racine_fr pour 41 verbes dans 06-actions.json
- 40 verbes avec racines optimales, 1 null (aller - trop irrégulier)
- Ajout 16 verbes avec formes exceptionnelles dans synonymes_fr
- Exemples : "voi" (voir), "donn" (donner), "compar" (comparer)

**Documentation** :
- Nouveau fichier docs/RACINES_VERBES_FRANCAIS.md
- Analyse complète des 43 verbes du lexique
- Distribution : 39.5% racines 4L, 23.3% 3L, 20.9% 5L
- 79% verbes parfaitement réguliers

**Tests validés** :
- "mangé" → trouve "manger" via racine "mang" (score 0.75) ✅
- "pris" → trouve "prendre" via synonymes_fr (score 0.9) ✅
- "donnait" → trouve "donner" via lemma (score 0.95) ✅
- "vu" → trouve "voir" via synonymes_fr (score 0.9) ✅

Cascade matching finale : exact(1.0) > lemma(0.95) > synonyme(0.9) >
synonyme-lemma(0.85) > racine-fr(0.75)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>

2025-11-28 13:04:51 +08:00

StillHammer

bbd8d5f9c9

Amélioration majeure du système de traduction Confluent

- Prompt système strict avec Chain-of-Thought obligatoire
- Retrait des racines en dur du prompt (context skimming pur)
- Amélioration logique fallback (activation si <50% couverture)
- Ajout lexique : loup, frère, manger + fichier famille
- Debug endpoint /api/debug/prompt pour inspection
- Documentation complète système racines françaises

🤖 Generated with Claude Code

Co-Authored-By: Claude <noreply@anthropic.com>

2025-11-28 12:18:55 +08:00

StillHammer

894645e640

Implémentation du système de prompt contextuel intelligent

Nouveau système qui analyse le texte français et génère des prompts optimisés en incluant uniquement le vocabulaire pertinent du lexique, réduisant drastiquement le nombre de tokens.

# Backend

- contextAnalyzer.js : Analyse contextuelle avec lemmatisation française
  - Tokenization avec normalisation des accents
  - Recherche intelligente (correspondances exactes, synonymes, formes conjuguées)
  - Calcul dynamique du nombre max d'entrées selon longueur (30/50/100)
  - Expansion sémantique niveau 1 (modulaire pour futur)
  - Fallback racines (309 racines si mots inconnus)

- promptBuilder.js : Génération de prompts optimisés
  - Templates de base sans lexique massif
  - Injection ciblée du vocabulaire pertinent
  - Formatage par type (racines sacrées, standards, verbes)
  - Support fallback avec toutes les racines

- server.js : Intégration API avec structure 3 layers
  - Layer 1: Traduction pure
  - Layer 2: Métadonnées contextuelles (mots trouvés, optimisation)
  - Layer 3: Explications du LLM (décomposition, notes)

- lexiqueLoader.js : Fusion du lexique simple data/lexique-francais-confluent.json
  - Charge 636 entrées (516 ancien + 120 merged)

# Frontend

- index.html : Interface 3 layers collapsibles
  - Layer 1 (toujours visible) : Traduction avec mise en valeur
  - Layer 2 (collapsible) : Contexte lexical + statistiques d'optimisation
  - Layer 3 (collapsible) : Explications linguistiques du LLM
  - Design dark complet (fix fond blanc + listes déroulantes)
  - Animations smooth pour expand/collapse

# Documentation

- docs/PROMPT_CONTEXTUEL_INTELLIGENT.md : Plan complet validé
  - Architecture technique détaillée
  - Cas d'usage et décisions de design
  - Métriques de succès

# Tests

- Tests exhaustifs avec validation exigeante
- Économie moyenne : 81% de tokens
- Économie minimale : 52% (même avec fallback)
- Context skimming opérationnel et validé

# Corrections

- ancien-confluent/lexique/02-racines-standards.json : Fix erreur JSON ligne 527

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>

2025-11-28 11:08:45 +08:00

3 Commits