confluent/CLAUDE.md
StillHammer e8d17ab0d5 Implement radical lookup system for Confluent translator (83% → 92% coverage)
Major features:
- Radical-based word matching for conjugated verbs
- Morphological decomposition for compound words
- Multi-index search (byWord + byFormeLiee)
- Cascade search strategy with confidence scoring

New files:
- ConfluentTranslator/radicalMatcher.js: Extract radicals from conjugated forms
- ConfluentTranslator/morphologicalDecomposer.js: Decompose compound words
- ConfluentTranslator/plans/radical-lookup-system.md: Implementation plan
- ConfluentTranslator/test-results-radical-system.md: Test results and analysis
- ancien-confluent/lexique/00-grammaire.json: Grammar particles
- ancien-confluent/lexique/lowercase-confluent.js: Lowercase utility

Modified files:
- ConfluentTranslator/reverseIndexBuilder.js: Added byFormeLiee index
- ConfluentTranslator/confluentToFrench.js: Cascade search with radicals
- Multiple lexique JSON files: Enhanced entries with forme_liee

Test results:
- Before: 83% coverage (101/122 tokens)
- After: 92% coverage (112/122 tokens)
- Improvement: +9 percentage points

Remaining work to reach 95%+:
- Add missing particles (ve, eol)
- Enrich VERBAL_SUFFIXES (aran, vis)
- Document missing words (tiru, kala, vulu)

🤖 Generated with Claude Code (https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-28 22:24:56 +08:00

135 lines
4.6 KiB
Markdown

# CLAUDE.md
This file provides guidance to Claude Code (claude.ai/code) when working with code in this repository.
## Projet
**Confluent** est un projet de création d'une langue construite (conlang) pour la Civilisation de la Confluence, une civilisation fictive du projet de jeu de rôle **civjdr**.
## État actuel
Le système linguistique de base est **validé et documenté** :
- 67 racines (15 sacrées, 52 standards)
- 16 liaisons sacrées
- Système verbal complet (12 verbes, conjugateurs)
- Syntaxe SOV avec particules
- 6 castes et 6 lieux nommés
## Structure du projet
```
confluent/
├── CLAUDE.md # Ce fichier
├── docs/
│ ├── SYSTEM_PROMPT_LLM.md # Prompt pour contextualiser un LLM
│ ├── LEXIQUE_REFERENCE_CONFLUENCE.md # Vocabulaire à traduire
│ ├── langue/ # Documentation linguistique
│ │ ├── 01-PHONOLOGIE.md # Sons, consonnes, voyelles
│ │ ├── 02-MORPHOLOGIE.md # Racines, liaisons sacrées
│ │ ├── 03-GRAMMAIRE.md # Verbes, conjugaisons, particules
│ │ ├── 04-SYNTAXE.md # Structure de phrase, négation, questions
│ │ └── 05-VOCABULAIRE.md # Lexique validé (castes, lieux)
│ ├── culture/
│ │ └── CONTEXTE_CIVILISATION.md # Contexte culturel
│ └── archive/
│ └── PLAN_LANGUE_REGARD_LIBRE.md # Document de travail original
└── data/
└── lexique.json # Données structurées (racines, liaisons)
```
## Documents de référence
### Pour comprendre la langue
1. `docs/langue/01-PHONOLOGIE.md` - Sons et règles phonétiques
2. `docs/langue/02-MORPHOLOGIE.md` - Structure des mots et liaisons
3. `docs/langue/03-GRAMMAIRE.md` - Verbes et conjugaisons
4. `docs/langue/04-SYNTAXE.md` - Construction des phrases
5. `docs/langue/05-VOCABULAIRE.md` - Lexique complet
### Pour le contexte
- `docs/culture/CONTEXTE_CIVILISATION.md` - Valeurs et culture
- `docs/LEXIQUE_REFERENCE_CONFLUENCE.md` - Vocabulaire à traduire
### Pour un LLM
- `docs/SYSTEM_PROMPT_LLM.md` - Prompt système complet
### Données structurées
- `data/lexique.json` - Racines, liaisons, particules en JSON
## Règles linguistiques (résumé)
### Phonétique et Orthographe
- **Consonnes (10):** b, k, l, m, n, p, s, t, v, z
- **Voyelles actives (5):** a, e, i, o, u
- **Voyelles réservées:** y, é, è (expansion future)
**⚠️ IMPORTANT : Pas de majuscules en Confluent**
- Le Confluent n'a PAS de distinction majuscule/minuscule
- Tout le texte Confluent est écrit en MINUSCULES
- Les noms propres, castes, lieux sont TOUS en minuscules : "uraakota", "siliaska", "aliaska"
- Les lexiques JSON stockent tout en minuscules
### Structure des racines
- Toute racine **finit par CV** (consonne + voyelle)
- **~80% standard** : commence par consonne (ex: sili, toka)
- **~20% sacrée** : commence par voyelle (ex: aska, ura)
### Les 16 liaisons sacrées
| Base | Liaisons | Domaine |
|------|----------|---------|
| **I** | i, ie, ii, iu | Agentivité |
| **U** | u, ui | Appartenance |
| **A** | a, aa, ae, ao | Relation |
| **O** | o, oa | Tension |
| **E** | e, ei, ea, eo | Dimension |
### Composition
```
sili (regard) + -i- (agent) + aska (libre)
→ sil- + i + aska = Siliaska
```
## Vocabulaire validé
### Castes
| Français | Confluent |
|----------|-----------|
| Enfants des Échos | Nakukeko |
| Enfants du Courant | Nakuura |
| Ailes-Grises | Aliaska |
| Faucons Chasseurs | Akoazana |
| Passes-bien | Takitosa |
| Voix de l'Aurore | Oraumi |
### Lieux
| Français | Confluent |
|----------|-----------|
| La Confluence | Uraakota |
| Gouffre Humide | Vukuura |
| Antres des Échos | Kekutoka |
| Cercles de Vigile | Sikuvela |
| Halls des Serments | Talusavu |
| Grande Fresque | Ekakova |
### Peuple
**Siliaska** = "Les porteurs du regard libre"
## Prochaines étapes
1. Enrichir le lexique (verbes, concepts abstraits, émotions...)
2. Définir les formules rituelles
3. Résoudre les questions ouvertes (nombres, propositions relatives...)
4. Créer des outils de traduction/génération
## Conventions de travail
- **Ratio sacré/standard** : garder ~20-25% de racines sacrées (V initial)
- **Mix phonétique** : ~70% créations originales, ~20% finnois-like, ~10% basque-like
- **Éviter** : sons trop elfiques (L/R liquides), sons anglo/latins (th, ph)
- **Tester** : chaque nouvelle racine avec des compositions
## Lien avec civjdr
Ce projet est un sous-projet de `../civjdr`. La langue reflète les valeurs de la civilisation : observation, transmission, mémoire, confluence/union.