confluent/docs/archive/RAPPORT_CORRECTION_DOUBLONS.md
StillHammer 5602ce50be Prepare project for GitHub publication
- Add comprehensive README.md with examples and quick start
- Add SECURITY.md with API key safety guidelines
- Add MIT LICENSE
- Add .gitattributes for line ending normalization
- Create .env.example templates (root + ConfluentTranslator)
- Update .gitignore (remove unused rules, add .env variants)
- Archive work documents to docs/archive/
- Remove temporary files (nul, prompt-*.json)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-10 08:57:43 +08:00

188 lines
7.3 KiB
Markdown

# Rapport de Correction des Doublons du Lexique Confluent
**Date:** 2025-12-02
**Script utilisé:** `scripts/fix-doublons.js`
## Résumé
- **Doublons détectés:** 121 mots Confluent utilisés plusieurs fois
- **Remplacements effectués:** 177 (certains doublons avaient plus de 2 occurrences)
- **Succès:** 177/177 (100%)
- **Échecs:** 0
## Résultat final
Après correction, l'audit du lexique montre:
-**0 erreurs** (contre 419 avant)
- ⚠️ 19 avertissements (problèmes mineurs de forme liée)
- Tous les mots Confluent sont maintenant **uniques**
## Principaux remplacements effectués
### Particules grammaticales (00-grammaire.json)
| Mot français | Ancien | Nouveau | Raison |
|--------------|--------|---------|--------|
| autour | no | mla | Doublon avec particule locative "no" |
| sa | na | tla | Doublon avec particule génitif "na" |
| depuis | ve | mle | Doublon avec particule origine "ve" |
| avant | at | isu | Doublon avec marqueur passé "at" |
| après | ok | alo | Doublon avec marqueur futur "ok" |
### Auxiliaires avoir
| Mot français | Ancien | Nouveau |
|--------------|--------|---------|
| as (tu as) | iku | euma |
| a (il/elle a) | iku | oape |
| avons | iku | uila |
| avez | iku | aila |
| ont | iku | oolu |
Le mot "iku" est conservé uniquement pour "ai" (j'ai).
### Racines sacrées
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| âme | umi | uuto | "umi" gardé pour "esprit" (racine sacrée prioritaire) |
| souffle | umi | eila | |
| esprit (abstrait) | umi | oelu | |
| passé | ena | ieso | "ena" gardé pour "origine" |
| guerre | oki | uovi | "oki" gardé pour "épreuve" (racine sacrée) |
| aurore (temps) | ora | uizi | "ora" gardé pour "aurore" (racine sacrée moment sacré) |
| rhombe | onu | ieto | "onu" gardé pour "son" |
| étoile (nature) | atu | aoni | "atu" gardé pour "étoile" (racine sacrée céleste) |
### Racines standards courantes
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| liberté | aska | oabsi | "aska" gardé pour "libre" |
| liberté (var.) | aska | eilne | |
| vieux | aita | eabme | "aita" gardé pour "ancêtre" |
| ancêtre (rôle) | aita | ietni | |
| poisson (std) | pisu | ltiti | "pisu" gardé pour "petit" |
| poisson (animal) | pisu | mzoti | |
| poisson (nourriture) | pisu | zsita | |
| paix (std) | tosa | lsezi | "tosa" gardé pour "bon" |
| paix (abstrait) | tosa | bbolu | |
### Couleurs
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| vert | viku | nsime | "viku" gardé pour "bois/forêt" |
| bleu | zelu | spati | "zelu" gardé pour "ciel" |
| azur | zelu | ssebi | |
| gris (std) | senu | bkula | "senu" gardé pour "cendre" |
| gris (couleur) | senu | msobe | |
| rouge (std) | pasu | kzunu | "pasu" gardé pour "sang" (corps) |
| rouge (couleur) | pasu | zkaba | |
| noir | kumu | bkipe | "kumu" gardé pour "sombre" |
| sombre (couleur) | kumu | zpasi | |
### Nature et éléments
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| forêt | viku | zbipo | "viku" gardé comme racine de base |
| arbre | viku | vtese | |
| mer (nature) | melu | kzumi | "melu" gardé pour "mer" (racine) |
| mer (géo) | melu | kzome | |
| sel (nature) | salu | ztozi | "salu" gardé pour "sel" |
| montagne (nature) | tasa | lnosu | "tasa" gardé pour "sommet" |
| vallée (std) | valu | vbite | "valu" gardé pour "valeur" |
| vallée (nature) | valu | pbali | |
| vallée (géo) | valu | bpuse | |
### Castes et noms propres
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| Nakukeko (var.) | nakukeko | nnukamuke | Original gardé |
| Nakuura (var.) | nakuura | psununzo | Original gardé |
| Aliaska (var.) | aliaska | iatozupi | Original gardé |
| Aile-Grise | aliaska | iezevipe | |
| Akoazana (var.) | akoazana | oekovabpo | Original gardé |
| Faucon Chasseur | akoazana | uuzivenna | |
| Takitosa (var.) | kanutosa | lkosegusa | Original gardé |
| Passe-bien | kanutosa | vbuvaloli | |
| Oraumi (var.) | oraumi | oakegze | Original gardé |
### Lieux
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| La Confluence | uraakota | eamutusbo | "uraakota" gardé comme nom principal |
| Uraakota (var.) | uraakota | ielalulte | |
| Vukuura (var.) | vukuura | vmavekna | Original gardé |
| Kekutoka (var.) | kekutoka | klikubozi | Original gardé |
| Sikuvela (var.) | sikuvela | nbabosove | Original gardé |
| Cercles de Vigile | sikuvela | ntanazaza | |
| Talusavu (var.) | talusavu | bpotekike | Original gardé |
| Hall des Serments | talusavu | szuvozeni | |
| Ekakova (var.) | ekakova | aolulatu | Original gardé |
| Grande Fresque | ekakova | oemonona | |
### Compositions géographiques
| Mot français | Ancien | Nouveau |
|--------------|--------|---------|
| profondeur | vukumako | nsalapinu |
| cascade (géo) | ulaoavuku | eotesehevi |
| source (géo) | enuula | euvikpi |
| grotte (géo) | vukutoka | bsekusoto |
| voûte | vukutoka | mbalateki |
| crevasse (armes) | vukukali | zkumopubo |
| crevasse (géo) | vukukali | ktovoleno |
| crevasse (danger) | vukukali | nvipovito |
| escalier | vukukali | kpopezosu |
| promontoire | tasumelu | tmunoboli |
| pic | tasupiki | pkuzezelo |
| côte | tokumelu | nbupukapu |
| horizon | zelutoka | btalatuka |
### Autres corrections notables
| Mot français | Ancien | Nouveau | Note |
|--------------|--------|---------|------|
| cercle | siku | mvitu | "siku" gardé pour interrogatif "comment" |
| oreille | tiku | bpivu | "tiku" gardé pour interrogatif "quand" |
| où (interrogatif) | viku | psopo | "viku" gardé pour "bois/forêt" |
| main | kanu | sbove | "kanu" gardé pour démonstratif "celui-ci" |
| œil | sili | spima | "sili" gardé pour "regard/signe" |
| chair | sanu | bbuke | "sanu" gardé pour "corps" |
| loup | loku | ltute | "loku" gardé pour "loi/lieu" |
## Stratégie de priorisation
Le script a utilisé la hiérarchie suivante pour décider quel mot garder:
1. **Racines sacrées** (01-racines-sacrees.json) - priorité 1500
2. **Racines standards** (02-racines-standards.json) - priorité 1300
3. **Grammaire** (00-grammaire.json) - priorité 1100
4. **Castes et lieux** (03-castes.json, 04-lieux.json) - priorité 1000
5. **Autres types:**
- Particules, marqueurs, négations: 800
- Verbes: 700
- Compositions: 500
- Noms propres: 400
- Autres: 100-300
## Génération des nouveaux mots
Les nouveaux mots ont été générés en respectant:
- ✅ Structure CV pour les racines (finissent par consonne+voyelle)
- ✅ Structure CVCVC pour les verbes (5 lettres, finissent par consonne)
- ✅ ~20% de racines sacrées (commencent par voyelle)
- ✅ Phonologie: consonnes b,k,l,m,n,p,s,t,v,z + voyelles a,e,i,o,u
- ✅ Consonnes rares (r,d,h,g) limitées à ~10% des mots générés
- ✅ Unicité garantie (vérification contre tous les mots existants)
## Vérification
Pour vérifier le résultat:
```bash
node scripts/audit-lexique.js
```
Résultat attendu: **0 erreurs, 0 doublons**
## Prochaines étapes recommandées
1. ⚠️ Corriger les 19 avertissements mineurs (formes liées incorrectes)
2. ✅ Valider que les nouveaux mots générés sont phonétiquement harmonieux
3. ✅ Mettre à jour la documentation si nécessaire
4. ✅ Tester le système de traduction avec les nouveaux mots