docs: Add Whisper prompt improvement strategy

- Document current prompt limitations - Propose improved prompt with anti-hallucination instructions - Suggest dynamic context and domain vocabulary enhancements 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-23 20:09:04 +08:00 · 2025-11-23 20:09:04 +08:00 · 9163e082da
commit 9163e082da
parent a3b38cf32a
1 changed files with 29 additions and 2 deletions
--- a/PLAN_DEBUG.md
+++ b/PLAN_DEBUG.md
@ -75,8 +75,35 @@ sessions/
 - [ ] Infos Whisper ? (latence, modèle, filtered)
 - [ ] Infos Claude ? (latence, modèle)

+## Piste : Améliorer le prompt Whisper
+
+### Prompt actuel (insuffisant)
+```
+The following is a conversation in Mandarin Chinese about business, family, and daily life. Common names: Tingting, Alexis.
+```
+
+### Problèmes
+- Trop vague, n'aide pas Whisper
+- Ne bloque pas les hallucinations connues
+- Pas d'instruction sur quoi faire avec le bruit/silence
+
+### Prompt proposé
+```
+Transcription d'une réunion en chinois mandarin. Plusieurs interlocuteurs.
+Ne transcris PAS : musique, silence, bruits de fond, applaudissements.
+Ne génère JAMAIS de phrases comme "谢谢观看", "感谢收看", "订阅", "Thank you for watching", "Subscribe".
+Si l'audio est inaudible, renvoie une chaîne vide.
+Noms possibles: Tingting, Alexis.
+```
+
+### Améliorations possibles
+1. **Contexte dynamique** - Passer les 2-3 dernières transcriptions dans le prompt
+2. **Vocabulaire métier** - Ajouter les termes récurrents spécifiques
+3. **Anti-hallucination explicite** - Lister les phrases à ne jamais générer
+
 ## Prochaines étapes

 1. Implémenter le système de logging basique (JSON chinois/français)
-2. Analyser les patterns dans les données
-3. Enrichir avec plus de métadonnées si nécessaire
+2. Tester le nouveau prompt Whisper
+3. Analyser les patterns dans les données
+4. Enrichir avec plus de métadonnées si nécessaire