confluent/scripts/fix-racines-json.py
StillHammer 4236232a62 Refonte complète du lexique Confluent et système d'audit
- Correction et extension du lexique: 78 → 0 erreurs
- Ajout de 14 racines manquantes (toli, konu, aika, vito, paka, nutu, tuli, nemu, zeru, novi, muta, supu, selu, saki)
- Extension du lexique: 67 racines standards (53 → 67)
- Création de 6 nouveaux fichiers lexique (navigation, architecture, concepts philosophiques, étrangers, actions militaires, vêtements)
- Réduction consonnes rares: 26.5% → 2.7%
- Remplacement racines anglaises par finno-basques (malo→paka, situ→tuli, taki→kanu, time→aika)
- Correction des mots mal formés (ulak→kulak, koliukitan→koliukita, ulapisu→lapis, pekikayo→pekikazo)
- Amélioration script d'audit: charge maintenant verbes, compositions et grammaire (638 racines)
- Ajout scripts de maintenance (audit, correction consonnes rares, détection doublons)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-01 21:53:03 +08:00

59 lines
1.7 KiB
Python

#!/usr/bin/env python3
"""
Répare le fichier 02-racines-standards.json :
- Déplace les 8 racines de "pronoms" vers "dictionnaire"
- Garde tous les pronoms dans "pronoms"
"""
import json
from pathlib import Path
# Chemins
LEXIQUE_DIR = Path(__file__).parent.parent / "ancien-confluent" / "lexique"
RACINES_FILE = LEXIQUE_DIR / "02-racines-standards.json"
# Les 8 racines à déplacer de pronoms vers dictionnaire
RACINES_A_DEPLACER = {
"agent": "toli",
"proteger": "konu",
"duree": "aika",
"materiau_bois": "vito",
"negatif": "paka",
"aliment": "nutu",
"demeurer": "tuli",
"souvenir": "nemu"
}
def main():
print("🔧 Réparation du fichier 02-racines-standards.json\n")
# Charger le fichier
with open(RACINES_FILE, 'r', encoding='utf-8') as f:
data = json.load(f)
print(f"Avant: {len(data['dictionnaire'])} entrées dans dictionnaire")
print(f"Avant: {len(data['pronoms'])} entrées dans pronoms\n")
# Déplacer les racines
moved = 0
for key_fr, mot_conf in RACINES_A_DEPLACER.items():
if key_fr in data['pronoms']:
print(f" Déplacement: {key_fr} ({mot_conf})")
data['dictionnaire'][key_fr] = data['pronoms'][key_fr]
del data['pronoms'][key_fr]
moved += 1
print(f"\n{moved} racines déplacées")
print(f"Après: {len(data['dictionnaire'])} entrées dans dictionnaire")
print(f"Après: {len(data['pronoms'])} entrées dans pronoms")
# Sauvegarder
with open(RACINES_FILE, 'w', encoding='utf-8') as f:
json.dump(data, f, ensure_ascii=False, indent=2)
f.write('\n')
print(f"\n💾 Fichier sauvegardé: {RACINES_FILE}")
if __name__ == "__main__":
main()