Whisper czyli nowe fajne do rozpoznawania mowy
Wróć do Nowości, odkrycia, newsy#41 pajper
Jak instalowałeś Pytorcha?
Shoot for the Moon. Even if you miss, you'll land among the stars.
#42 zywek
Nie jest żadnym wyznacznikiem, ale nie będę się z Tobą wykłócał, przecież zawsze wiesz lepiej, nawet jak nie wiesz. W każdym razie u mnie działa i żadnego cuda zainstalowanego nie ma.
#43 Paulinux
Pajper, to była jedna z moich pierwszych myśli jak dowiedziałam się o Whisperze
-- (pajper):
XPS 9500 to świetny komputer, ale nie powstał z myślą o AI i to widać. Na profilu base, czyli tym który poprzednio podrzucałem, osiągana prędkość transkrypcji to ok. 2,5x, na profilu small ok. 1x, na medium (już taki naprawdę dobry) ok. 0,4x i na large 0,2x. Testowane na Tyfloprzeglądzie.
Bije CPU na głowę, ale wciąż nie porywa.
Czekam z zainteresowaniem na wyniki z RTX-ów.
PS. Jak trzeba być nienormalnym, żeby napisać program do generowania syntezatorów z absolutnie wszystkiego, spinając w tandem Whispera i RHVoice do transkrypcji i ćwiczenia z dowolnego audio?
Polecam się na przyszłość! :D
--
#44 pajper
Ehhh. Jeśli Torch nie widzi GPU, to nie ma szans, żeby whisper użył GPU, ponieważ Whisper używa Torcha. Nie wiem, jak jaśniej to wyjaśnić.
Jeśli Torch widzi GPU, a Whisper nie, to już grubszy problem i trochę mnie to dziwi. Najlepszy strzał, to że u tomeckiego jest kilka środowisk Pythona zainstalowanych.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#45 zywek
Ja mam tylko parę plików cuda wrzuconych tam gdzie trzeba i nic poza tym.
#46 tomecki
Whispera via PIP, a co tam sobie dociągał to nie patrzyłem.
#47 pajper
Do kolekcji testów, odcinek 150 puszczony na medium. Robiło się u mnie ponad 12 godzin.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#48 mateponczas
Hej. Mój komp, mimo że mam kartę nvidia RTX 3070 TI, nie widzi Cuda. Instalowałem na dwa sposoby: cudę z pythona i z nvidia. Jakieś pomysły?
#49 pajper
Musisz jeszcze zainstalować odpowiednią, wspierającą Cudę wersję Torcha. Jak wrzucisz w Google Pytorch with Cuda, wyskoczy Ci masa instrukcji.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#50 mateponczas
Aaaa, jasne! Ja o tym wiedziałem! Chodzi Ci o torch py cuda 112 cu 116?
#51 mateponczas
Słuchaj, Dawid, rzeczywiście pomogło. I to po raz pierwszy bez jakichkolwiek uwag ze strony Pythona! Dzięki.
#52 Pitef
A czy ktoś był by w stanie podrzucić jakąś linkę do tego? Jak i skąd to pobrać?
#53 tomecki
A może mieć znaczenie, że nie używam wersji Pythonowskiej tylko załączonego exe?
#54 pajper
Jakiego exe? Whispera? Nie wiedziałem, że jest. Jeśli tak, to na pewno o to chodzi.
Trzeba użyć Pythona.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#55 tomecki
No i po uruchomieniu whisper-script.py nadal pojawia się warnings.warn("FP16 is not supported on CPU; using FP32 instead")
Przy czym zapewne warto powiedzieć, że nadal nie używam żadnego przełącznika, który jakoś zmieniałby processing na gpu. Konkretnie uruchomiłem go tak: python whisper-script.py plik.wav --model small --language Polish
#56 pajper
Czekaj, troszkę się pogubiłem, może po kolei.
1. Instalujesz Cudę,
2. Instalujesz Torcha:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
3. I Whispera:
pip install git+https://github.com/openai/whisper.git
No i powinno śmigać, potem uruchamiasz go:
whisper myfile.wav
Shoot for the Moon. Even if you miss, you'll land among the stars.
#57 tomecki
ale jedynym czymś, co tam się zwie whisper to jest właśnie exe więc wydaje mi się, że wtedy zostanie uruchomiony nie jako skrypt pythonowski tylko właśnie z tego exe. Torch chyba sam sobie zaciągnął, ale spróbuję jeszcze raz wg twojej instrukcji.
#58 tomecki
No i w razie czego pobrałem tego Torcha, o któym pisałeś. Dobrał się torch audio i torch vision, bo ten hm... zwykły już był i nadal dokłądnie to samo nawet jeśli uruchomię bez przełączników tylko z nazwą pliku, dokładnie jak pisałeś.
#59 pajper
Tylko wywal exe Whispera koniecznie. ;)
Shoot for the Moon. Even if you miss, you'll land among the stars.
#60 pajper
Minęliśmy się z wpisami. Ale mój typ pozostaje, upewnij się, że nie masz exe Whispera, żeby nie uruchamiał z tej binarki. Tam prawdopodobnie jest zbundlowany cały Python.
Shoot for the Moon. Even if you miss, you'll land among the stars.