confluent/docs/archive/RAPPORT_CORRECTION_DOUBLONS.md
StillHammer 5602ce50be Prepare project for GitHub publication
- Add comprehensive README.md with examples and quick start
- Add SECURITY.md with API key safety guidelines
- Add MIT LICENSE
- Add .gitattributes for line ending normalization
- Create .env.example templates (root + ConfluentTranslator)
- Update .gitignore (remove unused rules, add .env variants)
- Archive work documents to docs/archive/
- Remove temporary files (nul, prompt-*.json)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-10 08:57:43 +08:00

7.3 KiB

Rapport de Correction des Doublons du Lexique Confluent

Date: 2025-12-02 Script utilisé: scripts/fix-doublons.js

Résumé

  • Doublons détectés: 121 mots Confluent utilisés plusieurs fois
  • Remplacements effectués: 177 (certains doublons avaient plus de 2 occurrences)
  • Succès: 177/177 (100%)
  • Échecs: 0

Résultat final

Après correction, l'audit du lexique montre:

  • 0 erreurs (contre 419 avant)
  • ⚠️ 19 avertissements (problèmes mineurs de forme liée)
  • Tous les mots Confluent sont maintenant uniques

Principaux remplacements effectués

Particules grammaticales (00-grammaire.json)

Mot français Ancien Nouveau Raison
autour no mla Doublon avec particule locative "no"
sa na tla Doublon avec particule génitif "na"
depuis ve mle Doublon avec particule origine "ve"
avant at isu Doublon avec marqueur passé "at"
après ok alo Doublon avec marqueur futur "ok"

Auxiliaires avoir

Mot français Ancien Nouveau
as (tu as) iku euma
a (il/elle a) iku oape
avons iku uila
avez iku aila
ont iku oolu

Le mot "iku" est conservé uniquement pour "ai" (j'ai).

Racines sacrées

Mot français Ancien Nouveau Note
âme umi uuto "umi" gardé pour "esprit" (racine sacrée prioritaire)
souffle umi eila
esprit (abstrait) umi oelu
passé ena ieso "ena" gardé pour "origine"
guerre oki uovi "oki" gardé pour "épreuve" (racine sacrée)
aurore (temps) ora uizi "ora" gardé pour "aurore" (racine sacrée moment sacré)
rhombe onu ieto "onu" gardé pour "son"
étoile (nature) atu aoni "atu" gardé pour "étoile" (racine sacrée céleste)

Racines standards courantes

Mot français Ancien Nouveau Note
liberté aska oabsi "aska" gardé pour "libre"
liberté (var.) aska eilne
vieux aita eabme "aita" gardé pour "ancêtre"
ancêtre (rôle) aita ietni
poisson (std) pisu ltiti "pisu" gardé pour "petit"
poisson (animal) pisu mzoti
poisson (nourriture) pisu zsita
paix (std) tosa lsezi "tosa" gardé pour "bon"
paix (abstrait) tosa bbolu

Couleurs

Mot français Ancien Nouveau Note
vert viku nsime "viku" gardé pour "bois/forêt"
bleu zelu spati "zelu" gardé pour "ciel"
azur zelu ssebi
gris (std) senu bkula "senu" gardé pour "cendre"
gris (couleur) senu msobe
rouge (std) pasu kzunu "pasu" gardé pour "sang" (corps)
rouge (couleur) pasu zkaba
noir kumu bkipe "kumu" gardé pour "sombre"
sombre (couleur) kumu zpasi

Nature et éléments

Mot français Ancien Nouveau Note
forêt viku zbipo "viku" gardé comme racine de base
arbre viku vtese
mer (nature) melu kzumi "melu" gardé pour "mer" (racine)
mer (géo) melu kzome
sel (nature) salu ztozi "salu" gardé pour "sel"
montagne (nature) tasa lnosu "tasa" gardé pour "sommet"
vallée (std) valu vbite "valu" gardé pour "valeur"
vallée (nature) valu pbali
vallée (géo) valu bpuse

Castes et noms propres

Mot français Ancien Nouveau Note
Nakukeko (var.) nakukeko nnukamuke Original gardé
Nakuura (var.) nakuura psununzo Original gardé
Aliaska (var.) aliaska iatozupi Original gardé
Aile-Grise aliaska iezevipe
Akoazana (var.) akoazana oekovabpo Original gardé
Faucon Chasseur akoazana uuzivenna
Takitosa (var.) kanutosa lkosegusa Original gardé
Passe-bien kanutosa vbuvaloli
Oraumi (var.) oraumi oakegze Original gardé

Lieux

Mot français Ancien Nouveau Note
La Confluence uraakota eamutusbo "uraakota" gardé comme nom principal
Uraakota (var.) uraakota ielalulte
Vukuura (var.) vukuura vmavekna Original gardé
Kekutoka (var.) kekutoka klikubozi Original gardé
Sikuvela (var.) sikuvela nbabosove Original gardé
Cercles de Vigile sikuvela ntanazaza
Talusavu (var.) talusavu bpotekike Original gardé
Hall des Serments talusavu szuvozeni
Ekakova (var.) ekakova aolulatu Original gardé
Grande Fresque ekakova oemonona

Compositions géographiques

Mot français Ancien Nouveau
profondeur vukumako nsalapinu
cascade (géo) ulaoavuku eotesehevi
source (géo) enuula euvikpi
grotte (géo) vukutoka bsekusoto
voûte vukutoka mbalateki
crevasse (armes) vukukali zkumopubo
crevasse (géo) vukukali ktovoleno
crevasse (danger) vukukali nvipovito
escalier vukukali kpopezosu
promontoire tasumelu tmunoboli
pic tasupiki pkuzezelo
côte tokumelu nbupukapu
horizon zelutoka btalatuka

Autres corrections notables

Mot français Ancien Nouveau Note
cercle siku mvitu "siku" gardé pour interrogatif "comment"
oreille tiku bpivu "tiku" gardé pour interrogatif "quand"
où (interrogatif) viku psopo "viku" gardé pour "bois/forêt"
main kanu sbove "kanu" gardé pour démonstratif "celui-ci"
œil sili spima "sili" gardé pour "regard/signe"
chair sanu bbuke "sanu" gardé pour "corps"
loup loku ltute "loku" gardé pour "loi/lieu"

Stratégie de priorisation

Le script a utilisé la hiérarchie suivante pour décider quel mot garder:

  1. Racines sacrées (01-racines-sacrees.json) - priorité 1500
  2. Racines standards (02-racines-standards.json) - priorité 1300
  3. Grammaire (00-grammaire.json) - priorité 1100
  4. Castes et lieux (03-castes.json, 04-lieux.json) - priorité 1000
  5. Autres types:
    • Particules, marqueurs, négations: 800
    • Verbes: 700
    • Compositions: 500
    • Noms propres: 400
    • Autres: 100-300

Génération des nouveaux mots

Les nouveaux mots ont été générés en respectant:

  • Structure CV pour les racines (finissent par consonne+voyelle)
  • Structure CVCVC pour les verbes (5 lettres, finissent par consonne)
  • ~20% de racines sacrées (commencent par voyelle)
  • Phonologie: consonnes b,k,l,m,n,p,s,t,v,z + voyelles a,e,i,o,u
  • Consonnes rares (r,d,h,g) limitées à ~10% des mots générés
  • Unicité garantie (vérification contre tous les mots existants)

Vérification

Pour vérifier le résultat:

node scripts/audit-lexique.js

Résultat attendu: 0 erreurs, 0 doublons

Prochaines étapes recommandées

  1. ⚠️ Corriger les 19 avertissements mineurs (formes liées incorrectes)
  2. Valider que les nouveaux mots générés sont phonétiquement harmonieux
  3. Mettre à jour la documentation si nécessaire
  4. Tester le système de traduction avec les nouveaux mots