confluent

Author	SHA1	Message	Date
StillHammer	0d3f938ca9	Migration Gitea	2025-12-04 20:12:10 +08:00
StillHammer	5ad89885fc	Retrait du Proto-Confluent de l'interface + nettoyage lexique - Interface: suppression sélecteur variante Proto/Ancien - Frontend: fixé uniquement sur Ancien Confluent - Lexique: correction doublons et consolidation - Traducteur: optimisations CF→FR et FR→CF - Scripts: ajout audit et correction doublons 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-12-02 11:36:58 +08:00
StillHammer	4236232a62	Refonte complète du lexique Confluent et système d'audit - Correction et extension du lexique: 78 → 0 erreurs - Ajout de 14 racines manquantes (toli, konu, aika, vito, paka, nutu, tuli, nemu, zeru, novi, muta, supu, selu, saki) - Extension du lexique: 67 racines standards (53 → 67) - Création de 6 nouveaux fichiers lexique (navigation, architecture, concepts philosophiques, étrangers, actions militaires, vêtements) - Réduction consonnes rares: 26.5% → 2.7% - Remplacement racines anglaises par finno-basques (malo→paka, situ→tuli, taki→kanu, time→aika) - Correction des mots mal formés (ulak→kulak, koliukitan→koliukita, ulapisu→lapis, pekikayo→pekikazo) - Amélioration script d'audit: charge maintenant verbes, compositions et grammaire (638 racines) - Ajout scripts de maintenance (audit, correction consonnes rares, détection doublons) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-12-01 21:53:03 +08:00
StillHammer	dc6affc7fd	Amélioration lemmatisation FR + normalisation accents + extension lexique ## Fixes ### 1. Lemmatisation verbes français (contextAnalyzer.js) - Fix: 'ent' → 'er' (observent → observer, marchent → marcher) - Add: règles 'ient' → 'ir' (voient → voir) - Add: règles 'oient' → 'oir' (alternative) - Résultat: reconnaissance conjugaisons françaises améliorée ## Ajouts lexique ### 2. Verbe "marcher" (06-actions.json) - Confluent: tekam (racine: teka, forme liée: tek) - Conjugaisons: marche, marches, marchons, marchent, etc. ### 3. Prépositions → Particules (00-grammaire.json) - "dans/sur/sous" → no (localisation spatiale) - "avec" → vi (instrument/accompagnement) - "pour/contre" → se (but/bénéficiaire) - "sans" → zo (négation) - "pendant" → at (passé vécu) ### 4. Composant "echos" (03-castes.json) - Extraction racine: "échos" → keko - Permet reconnaissance mot seul (pas seulement dans "Enfants des Échos") ## Refactor majeur ### 5. Normalisation accents (23 fichiers JSON) - Suppression accents de TOUTES les clés de dictionnaire - Cohérence avec normalisation NFD côté serveur - Fichiers normalisés: * 00-grammaire.json à 22-nombres.json (tous les lexiques) ## Résultats Couverture améliorée sur phrases test: - "Les enfants des échos observent la grande fresque": 40% → 80% (4/5) - "Le soleil brille sur les montagnes pendant l'été": 33% → 67% (4/6) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-30 16:43:34 +08:00
StillHammer	e8d17ab0d5	Implement radical lookup system for Confluent translator (83% → 92% coverage) Major features: - Radical-based word matching for conjugated verbs - Morphological decomposition for compound words - Multi-index search (byWord + byFormeLiee) - Cascade search strategy with confidence scoring New files: - ConfluentTranslator/radicalMatcher.js: Extract radicals from conjugated forms - ConfluentTranslator/morphologicalDecomposer.js: Decompose compound words - ConfluentTranslator/plans/radical-lookup-system.md: Implementation plan - ConfluentTranslator/test-results-radical-system.md: Test results and analysis - ancien-confluent/lexique/00-grammaire.json: Grammar particles - ancien-confluent/lexique/lowercase-confluent.js: Lowercase utility Modified files: - ConfluentTranslator/reverseIndexBuilder.js: Added byFormeLiee index - ConfluentTranslator/confluentToFrench.js: Cascade search with radicals - Multiple lexique JSON files: Enhanced entries with forme_liee Test results: - Before: 83% coverage (101/122 tokens) - After: 92% coverage (112/122 tokens) - Improvement: +9 percentage points Remaining work to reach 95%+: - Add missing particles (ve, eol) - Enrich VERBAL_SUFFIXES (aran, vis) - Document missing words (tiru, kala, vulu) 🤖 Generated with Claude Code (https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-28 22:24:56 +08:00
StillHammer	bbd8d5f9c9	Amélioration majeure du système de traduction Confluent - Prompt système strict avec Chain-of-Thought obligatoire - Retrait des racines en dur du prompt (context skimming pur) - Amélioration logique fallback (activation si <50% couverture) - Ajout lexique : loup, frère, manger + fichier famille - Debug endpoint /api/debug/prompt pour inspection - Documentation complète système racines françaises 🤖 Generated with Claude Code Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-28 12:18:55 +08:00
StillHammer	feb0648512	Ajout formules rituelles et TODO finalisation langue - Créé 19 formules rituelles en Confluent (salutations, rituels, bénédictions, mémoire, transmission, deuil, union) - Contrainte: mots max 6 lettres pour mémorisation - Simplicité graduée: salutations simples (1-2 mots), deuil complexe (6-7 mots) - Ajout lexique complet Ancien Confluent en annexe (racines, verbes, conjugateurs, particules, liaisons) - Créé TODO.md avec tâches finales: nombres limités, adjectifs, émotions (métaphores corporelles) - Propositions relatives en bonus optionnel pour authenticité historique 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-28 07:18:01 +08:00
StillHammer	245ac92c65	Réorganisation du repo par niveau de langue Structure: - proto-confluent/lexique/ et proto-confluent/docs/ - ancien-confluent/lexique/ et ancien-confluent/docs/ Chaque niveau de langue a maintenant son propre dossier unifié. 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-11-27 13:16:34 +08:00

8 Commits