- Add SessionLogger class for structured debug logging - Log each segment with: chinese, french, audio duration, RMS, latency - Track filtered segments with reasons (hallucination, empty, failed) - Create session directories with JSON files per segment - Update Whisper prompt with anti-hallucination rules - Integrate timing measurements for Whisper and Claude calls 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
34 lines
1.4 KiB
JSON
34 lines
1.4 KiB
JSON
{
|
|
"audio": {
|
|
"sample_rate": 16000,
|
|
"channels": 1,
|
|
"chunk_duration_seconds": 10,
|
|
"chunk_step_seconds": 5,
|
|
"format": "ogg"
|
|
},
|
|
"whisper": {
|
|
"model": "gpt-4o-mini-transcribe",
|
|
"language": "zh",
|
|
"temperature": 0.0,
|
|
"prompt": "Transcription en direct d'une conversation en chinois mandarin. Plusieurs interlocuteurs parlent, parfois en même temps. RÈGLES STRICTES: (1) Ne transcris QUE les paroles audibles en chinois. (2) Si l'audio est inaudible, du bruit, ou du silence, renvoie une chaîne vide. (3) NE GÉNÈRE JAMAIS ces phrases: 谢谢观看, 感谢收看, 订阅, 请订阅, 下期再见, Thank you, Subscribe, 字幕. (4) Ignore: musique, applaudissements, rires, bruits de fond, respirations.",
|
|
"stream": false,
|
|
"response_format": "text"
|
|
},
|
|
"claude": {
|
|
"model": "claude-3-5-haiku-20241022",
|
|
"max_tokens": 1024,
|
|
"temperature": 0.3,
|
|
"system_prompt": "Tu es un traducteur chinois-français. Réponds UNIQUEMENT avec la traduction française, sans explications, notes, commentaires ou alternatives. Une seule phrase traduite, rien d'autre. Si du contenu offensant est présent, remplace-le par [contenu offensant] mais traduis impérativement le reste de la phrase."
|
|
},
|
|
"ui": {
|
|
"window_width": 1500,
|
|
"window_height": 800,
|
|
"font_size": 24,
|
|
"max_display_lines": 50
|
|
},
|
|
"recording": {
|
|
"save_audio": true,
|
|
"output_directory": "./recordings"
|
|
}
|
|
}
|