feat: add diarize_model arg to CLI (#1101)

2025-07-01 18:17:27 -04:00 · 2025-05-31 13:32:31 +02:00
parent 6fe0a8784a
commit b343241253
3 changed files with 7 additions and 3 deletions
--- a/whisperx/transcribe.py
+++ b/whisperx/transcribe.py
@ -57,6 +57,7 @@ def transcribe_task(args: dict, parser: argparse.ArgumentParser):
    diarize: bool = args.pop("diarize")
    min_speakers: int = args.pop("min_speakers")
    max_speakers: int = args.pop("max_speakers")
+    diarize_model_name: str = args.pop("diarize_model")
    print_progress: bool = args.pop("print_progress")

    if args["language"] is not None:
@ -204,8 +205,9 @@ def transcribe_task(args: dict, parser: argparse.ArgumentParser):
            )
        tmp_results = results
        print(">>Performing diarization...")
+        print(">>Using model:", diarize_model_name)
        results = []
-        diarize_model = DiarizationPipeline(use_auth_token=hf_token, device=device)
+        diarize_model = DiarizationPipeline(model_name=diarize_model_name, use_auth_token=hf_token, device=device)
        for result, input_audio_path in tmp_results:
            diarize_segments = diarize_model(
                input_audio_path, min_speakers=min_speakers, max_speakers=max_speakers