From f288156869e8b808ab9eef8966ee94c92740840d Mon Sep 17 00:00:00 2001 From: StillHammer Date: Sun, 23 Nov 2025 20:02:40 +0800 Subject: [PATCH] docs: Add test conditions context to debug plan MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Document that the initial transcript analysis was done under degraded conditions (multiple voices, variable distances/volumes, poor mic) which may explain some of the segmentation issues. 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude --- PLAN_DEBUG.md | 11 +++++++++++ 1 file changed, 11 insertions(+) diff --git a/PLAN_DEBUG.md b/PLAN_DEBUG.md index 62071f3..b62d34c 100644 --- a/PLAN_DEBUG.md +++ b/PLAN_DEBUG.md @@ -8,6 +8,17 @@ Transcript du 2025-11-23 (5:31 min, 75 segments) montre : - Segments d'un ou deux mots sans contexte - Hallucinations Whisper ("汪汪汪汪") +## Contexte du test + +**Conditions très dégradées :** +- Voix multiples +- Distances variables du micro +- Volumes variables +- Discussion rapide +- Mauvais micro + +Ces conditions expliquent potentiellement une partie des résultats. Les hypothèses doivent être validées dans des conditions plus contrôlées également. + ## Hypothèses (à valider) 1. **VAD coupe trop tôt** - Le Voice Activity Detection déclenche la fin de segment trop rapidement, coupant les phrases en plein milieu