make diarization faster

2025-07-01 18:17:27 -04:00 · 2023-08-02 10:11:43 +03:00
parent d80b98601b
commit 8de0e2af51
3 changed files with 10 additions and 3 deletions
--- a/whisperx/diarize.py
+++ b/whisperx/diarize.py
@ -4,6 +4,8 @@ from pyannote.audio import Pipeline
 from typing import Optional, Union
 import torch

+from .audio import SAMPLE_RATE
+
 class DiarizationPipeline:
    def __init__(
        self,
@ -16,7 +18,11 @@ class DiarizationPipeline:
        self.model = Pipeline.from_pretrained(model_name, use_auth_token=use_auth_token).to(device)

    def __call__(self, audio, min_speakers=None, max_speakers=None):
-        segments = self.model(audio, min_speakers=min_speakers, max_speakers=max_speakers)
+        audio_data = {
+            'waveform': torch.from_numpy(audio[None, :]),
+            'sample_rate': SAMPLE_RATE
+        }
+        segments = self.model(audio_data, min_speakers=min_speakers, max_speakers=max_speakers)
        diarize_df = pd.DataFrame(segments.itertracks(yield_label=True))
        diarize_df['start'] = diarize_df[0].apply(lambda x: x.start)
        diarize_df['end'] = diarize_df[0].apply(lambda x: x.end)