Commit Graph

7 Commits

Author SHA1 Message Date
0d3f938ca9 Migration Gitea 2025-12-04 20:12:10 +08:00
889cd24319 Amélioration système de traduction: normalisation, lexique et couverture
Corrections majeures:
- Normalisation ligatures (œ→oe, æ→ae) pour éviter fragmentation tokens
- Normalisation complète lexique (clés + synonymes) sans accents
- Correction faux positif "dansent"→"dans" (longueur radical ≥5)

Enrichissement lexique (+212 entrées):
- Verbes: battre (pulum), penser/réfléchir (umis), voler (aliuk)
- Mots grammaticaux: nous (tanu), possessifs (sa/mon→na), démonstratifs (ce→ko)
- Temporels: hier/avant (at), demain/après (ok), autour (no)
- Formes conjuguées ajoutées pour manger, battre, penser

Améliorations techniques:
- Lemmatisation verbale améliorée (radical ≥5 lettres)
- Système normalizeText() dans lexiqueLoader.js
- Liaisons sacrées pour compositions culturelles

Note: Problème connu de lemmatisation à investiguer (formes fléchies non trouvées)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-30 22:37:31 +08:00
e8d17ab0d5 Implement radical lookup system for Confluent translator (83% → 92% coverage)
Major features:
- Radical-based word matching for conjugated verbs
- Morphological decomposition for compound words
- Multi-index search (byWord + byFormeLiee)
- Cascade search strategy with confidence scoring

New files:
- ConfluentTranslator/radicalMatcher.js: Extract radicals from conjugated forms
- ConfluentTranslator/morphologicalDecomposer.js: Decompose compound words
- ConfluentTranslator/plans/radical-lookup-system.md: Implementation plan
- ConfluentTranslator/test-results-radical-system.md: Test results and analysis
- ancien-confluent/lexique/00-grammaire.json: Grammar particles
- ancien-confluent/lexique/lowercase-confluent.js: Lowercase utility

Modified files:
- ConfluentTranslator/reverseIndexBuilder.js: Added byFormeLiee index
- ConfluentTranslator/confluentToFrench.js: Cascade search with radicals
- Multiple lexique JSON files: Enhanced entries with forme_liee

Test results:
- Before: 83% coverage (101/122 tokens)
- After: 92% coverage (112/122 tokens)
- Improvement: +9 percentage points

Remaining work to reach 95%+:
- Add missing particles (ve, eol)
- Enrich VERBAL_SUFFIXES (aran, vis)
- Document missing words (tiru, kala, vulu)

🤖 Generated with Claude Code (https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 22:24:56 +08:00
feb0648512 Ajout formules rituelles et TODO finalisation langue
- Créé 19 formules rituelles en Confluent (salutations, rituels, bénédictions, mémoire, transmission, deuil, union)
- Contrainte: mots max 6 lettres pour mémorisation
- Simplicité graduée: salutations simples (1-2 mots), deuil complexe (6-7 mots)
- Ajout lexique complet Ancien Confluent en annexe (racines, verbes, conjugateurs, particules, liaisons)
- Créé TODO.md avec tâches finales: nombres limités, adjectifs, émotions (métaphores corporelles)
- Propositions relatives en bonus optionnel pour authenticité historique

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 07:18:01 +08:00
76830fad6c Réorganisation documentation Confluent + lexique complet (~400 termes)
- Restructuration docs en dossiers séparés (langue/, culture/, archive/)
- Création 6 fichiers langue: phonologie, morphologie, grammaire, syntaxe, vocabulaire, lexique complet
- Ajout SYSTEM_PROMPT_LLM.md pour contextualiser un LLM
- Ajout data/lexique.json v2.0 (173 racines structurées)
- Lexique complet avec 77% de mots composés utilisant les 16 liaisons sacrées
- Archive du plan original dans docs/archive/

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-27 09:23:34 +08:00
472bfeb6c3 Mise à jour CLAUDE.md avec état actuel du projet
- Résumé des règles linguistiques validées
- Tableau des 16 liaisons sacrées
- Vocabulaire validé (castes, lieux, peuple)
- Prochaines étapes et conventions de travail

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-26 11:56:34 +08:00
3b26760f72 Fondations de la langue Confluent
- Système des 16 liaisons sacrées (I, U, A, O, E)
- 67 racines (15 sacrées, 52 standards)
- Règles phonétiques (CV final, C initial standard, V initial sacré)
- Noms des 6 castes (Nakukeko, Nakuura, Ariaska, Akoazana, Takitosa, Oraumi)
- Noms des 6 lieux (Uraakota, Vukuura, Kekutoka, Rikuvela, Talusavu, Ekakova)
- Lexique de référence complet de la civilisation

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-26 11:52:17 +08:00