docs: Add Whisper prompt improvement strategy

- Document current prompt limitations
- Propose improved prompt with anti-hallucination instructions
- Suggest dynamic context and domain vocabulary enhancements

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
StillHammer 2025-11-23 20:09:04 +08:00
parent a3b38cf32a
commit 9163e082da

View File

@ -75,8 +75,35 @@ sessions/
- [ ] Infos Whisper ? (latence, modèle, filtered)
- [ ] Infos Claude ? (latence, modèle)
## Piste : Améliorer le prompt Whisper
### Prompt actuel (insuffisant)
```
The following is a conversation in Mandarin Chinese about business, family, and daily life. Common names: Tingting, Alexis.
```
### Problèmes
- Trop vague, n'aide pas Whisper
- Ne bloque pas les hallucinations connues
- Pas d'instruction sur quoi faire avec le bruit/silence
### Prompt proposé
```
Transcription d'une réunion en chinois mandarin. Plusieurs interlocuteurs.
Ne transcris PAS : musique, silence, bruits de fond, applaudissements.
Ne génère JAMAIS de phrases comme "谢谢观看", "感谢收看", "订阅", "Thank you for watching", "Subscribe".
Si l'audio est inaudible, renvoie une chaîne vide.
Noms possibles: Tingting, Alexis.
```
### Améliorations possibles
1. **Contexte dynamique** - Passer les 2-3 dernières transcriptions dans le prompt
2. **Vocabulaire métier** - Ajouter les termes récurrents spécifiques
3. **Anti-hallucination explicite** - Lister les phrases à ne jamais générer
## Prochaines étapes
1. Implémenter le système de logging basique (JSON chinois/français)
2. Analyser les patterns dans les données
3. Enrichir avec plus de métadonnées si nécessaire
2. Tester le nouveau prompt Whisper
3. Analyser les patterns dans les données
4. Enrichir avec plus de métadonnées si nécessaire