confluent/CLAUDE.md
StillHammer e8d17ab0d5 Implement radical lookup system for Confluent translator (83% → 92% coverage)
Major features:
- Radical-based word matching for conjugated verbs
- Morphological decomposition for compound words
- Multi-index search (byWord + byFormeLiee)
- Cascade search strategy with confidence scoring

New files:
- ConfluentTranslator/radicalMatcher.js: Extract radicals from conjugated forms
- ConfluentTranslator/morphologicalDecomposer.js: Decompose compound words
- ConfluentTranslator/plans/radical-lookup-system.md: Implementation plan
- ConfluentTranslator/test-results-radical-system.md: Test results and analysis
- ancien-confluent/lexique/00-grammaire.json: Grammar particles
- ancien-confluent/lexique/lowercase-confluent.js: Lowercase utility

Modified files:
- ConfluentTranslator/reverseIndexBuilder.js: Added byFormeLiee index
- ConfluentTranslator/confluentToFrench.js: Cascade search with radicals
- Multiple lexique JSON files: Enhanced entries with forme_liee

Test results:
- Before: 83% coverage (101/122 tokens)
- After: 92% coverage (112/122 tokens)
- Improvement: +9 percentage points

Remaining work to reach 95%+:
- Add missing particles (ve, eol)
- Enrich VERBAL_SUFFIXES (aran, vis)
- Document missing words (tiru, kala, vulu)

🤖 Generated with Claude Code (https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 22:24:56 +08:00

4.6 KiB

CLAUDE.md

This file provides guidance to Claude Code (claude.ai/code) when working with code in this repository.

Projet

Confluent est un projet de création d'une langue construite (conlang) pour la Civilisation de la Confluence, une civilisation fictive du projet de jeu de rôle civjdr.

État actuel

Le système linguistique de base est validé et documenté :

  • 67 racines (15 sacrées, 52 standards)
  • 16 liaisons sacrées
  • Système verbal complet (12 verbes, conjugateurs)
  • Syntaxe SOV avec particules
  • 6 castes et 6 lieux nommés

Structure du projet

confluent/
├── CLAUDE.md                    # Ce fichier
├── docs/
│   ├── SYSTEM_PROMPT_LLM.md     # Prompt pour contextualiser un LLM
│   ├── LEXIQUE_REFERENCE_CONFLUENCE.md  # Vocabulaire à traduire
│   ├── langue/                  # Documentation linguistique
│   │   ├── 01-PHONOLOGIE.md     # Sons, consonnes, voyelles
│   │   ├── 02-MORPHOLOGIE.md    # Racines, liaisons sacrées
│   │   ├── 03-GRAMMAIRE.md      # Verbes, conjugaisons, particules
│   │   ├── 04-SYNTAXE.md        # Structure de phrase, négation, questions
│   │   └── 05-VOCABULAIRE.md    # Lexique validé (castes, lieux)
│   ├── culture/
│   │   └── CONTEXTE_CIVILISATION.md  # Contexte culturel
│   └── archive/
│       └── PLAN_LANGUE_REGARD_LIBRE.md  # Document de travail original
└── data/
    └── lexique.json             # Données structurées (racines, liaisons)

Documents de référence

Pour comprendre la langue

  1. docs/langue/01-PHONOLOGIE.md - Sons et règles phonétiques
  2. docs/langue/02-MORPHOLOGIE.md - Structure des mots et liaisons
  3. docs/langue/03-GRAMMAIRE.md - Verbes et conjugaisons
  4. docs/langue/04-SYNTAXE.md - Construction des phrases
  5. docs/langue/05-VOCABULAIRE.md - Lexique complet

Pour le contexte

  • docs/culture/CONTEXTE_CIVILISATION.md - Valeurs et culture
  • docs/LEXIQUE_REFERENCE_CONFLUENCE.md - Vocabulaire à traduire

Pour un LLM

  • docs/SYSTEM_PROMPT_LLM.md - Prompt système complet

Données structurées

  • data/lexique.json - Racines, liaisons, particules en JSON

Règles linguistiques (résumé)

Phonétique et Orthographe

  • Consonnes (10): b, k, l, m, n, p, s, t, v, z
  • Voyelles actives (5): a, e, i, o, u
  • Voyelles réservées: y, é, è (expansion future)

⚠️ IMPORTANT : Pas de majuscules en Confluent

  • Le Confluent n'a PAS de distinction majuscule/minuscule
  • Tout le texte Confluent est écrit en MINUSCULES
  • Les noms propres, castes, lieux sont TOUS en minuscules : "uraakota", "siliaska", "aliaska"
  • Les lexiques JSON stockent tout en minuscules

Structure des racines

  • Toute racine finit par CV (consonne + voyelle)
  • ~80% standard : commence par consonne (ex: sili, toka)
  • ~20% sacrée : commence par voyelle (ex: aska, ura)

Les 16 liaisons sacrées

Base Liaisons Domaine
I i, ie, ii, iu Agentivité
U u, ui Appartenance
A a, aa, ae, ao Relation
O o, oa Tension
E e, ei, ea, eo Dimension

Composition

sili (regard) + -i- (agent) + aska (libre)
→ sil- + i + aska = Siliaska

Vocabulaire validé

Castes

Français Confluent
Enfants des Échos Nakukeko
Enfants du Courant Nakuura
Ailes-Grises Aliaska
Faucons Chasseurs Akoazana
Passes-bien Takitosa
Voix de l'Aurore Oraumi

Lieux

Français Confluent
La Confluence Uraakota
Gouffre Humide Vukuura
Antres des Échos Kekutoka
Cercles de Vigile Sikuvela
Halls des Serments Talusavu
Grande Fresque Ekakova

Peuple

Siliaska = "Les porteurs du regard libre"

Prochaines étapes

  1. Enrichir le lexique (verbes, concepts abstraits, émotions...)
  2. Définir les formules rituelles
  3. Résoudre les questions ouvertes (nombres, propositions relatives...)
  4. Créer des outils de traduction/génération

Conventions de travail

  • Ratio sacré/standard : garder ~20-25% de racines sacrées (V initial)
  • Mix phonétique : ~70% créations originales, ~20% finnois-like, ~10% basque-like
  • Éviter : sons trop elfiques (L/R liquides), sons anglo/latins (th, ph)
  • Tester : chaque nouvelle racine avec des compositions

Lien avec civjdr

Ce projet est un sous-projet de ../civjdr. La langue reflète les valeurs de la civilisation : observation, transmission, mémoire, confluence/union.