EltenLink

Whisper czyli nowe fajne do rozpoznawania mowy

Wróć do Nowości, odkrycia, newsy

#41 pajper

Jak instalowałeś Pytorcha?


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-02 12:42

#42 zywek

Nie jest żadnym wyznacznikiem, ale nie będę się z Tobą wykłócał, przecież zawsze wiesz lepiej, nawet jak nie wiesz. W każdym razie u mnie działa i żadnego cuda zainstalowanego nie ma.



2022-10-02 13:41

#43 Paulinux

Pajper, to była jedna z moich pierwszych myśli jak dowiedziałam się o Whisperze
-- (pajper):
XPS 9500 to świetny komputer, ale nie powstał z myślą o AI i to widać. Na profilu base, czyli tym który poprzednio podrzucałem, osiągana prędkość transkrypcji to ok. 2,5x, na profilu small ok. 1x, na medium (już taki naprawdę dobry) ok. 0,4x i na large 0,2x. Testowane na Tyfloprzeglądzie.
Bije CPU na głowę, ale wciąż nie porywa.
Czekam z zainteresowaniem na wyniki z RTX-ów.

PS. Jak trzeba być nienormalnym, żeby napisać program do generowania syntezatorów z absolutnie wszystkiego, spinając w tandem Whispera i RHVoice do transkrypcji i ćwiczenia z dowolnego audio?
Polecam się na przyszłość! :D

--


Happy hacking
2022-10-02 14:12

#44 pajper

Ehhh. Jeśli Torch nie widzi GPU, to nie ma szans, żeby whisper użył GPU, ponieważ Whisper używa Torcha. Nie wiem, jak jaśniej to wyjaśnić.
Jeśli Torch widzi GPU, a Whisper nie, to już grubszy problem i trochę mnie to dziwi. Najlepszy strzał, to że u tomeckiego jest kilka środowisk Pythona zainstalowanych.


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-02 14:15

#45 zywek

Ja mam tylko parę plików cuda wrzuconych tam gdzie trzeba i nic poza tym.



Edytowano 2022-10-02 14:58

#46 tomecki

Whispera via PIP, a co tam sobie dociągał to nie patrzyłem.



2022-10-02 20:08

#47 pajper

Do kolekcji testów, odcinek 150 puszczony na medium. Robiło się u mnie ponad 12 godzin.


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-03 00:12

#48 mateponczas

Hej. Mój komp, mimo że mam kartę nvidia RTX 3070 TI, nie widzi Cuda. Instalowałem na dwa sposoby: cudę z pythona i z nvidia. Jakieś pomysły?



2022-10-03 03:27

#49 pajper

Musisz jeszcze zainstalować odpowiednią, wspierającą Cudę wersję Torcha. Jak wrzucisz w Google Pytorch with Cuda, wyskoczy Ci masa instrukcji.


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-03 07:21

#50 mateponczas

Aaaa, jasne! Ja o tym wiedziałem! Chodzi Ci o torch py cuda 112 cu 116?



2022-10-03 07:53

#51 mateponczas

Słuchaj, Dawid, rzeczywiście pomogło. I to po raz pierwszy bez jakichkolwiek uwag ze strony Pythona! Dzięki.



2022-10-03 11:54

#52 Pitef

A czy ktoś był by w stanie podrzucić jakąś linkę do tego? Jak i skąd to pobrać?


Sygnatura? A co to jest i do czego :D
2022-10-03 12:00

#53 tomecki

A może mieć znaczenie, że nie używam wersji Pythonowskiej tylko załączonego exe?



2022-10-03 12:57

#54 pajper

Jakiego exe? Whispera? Nie wiedziałem, że jest. Jeśli tak, to na pewno o to chodzi.
Trzeba użyć Pythona.


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-03 13:13

#55 tomecki

No i po uruchomieniu whisper-script.py nadal pojawia się warnings.warn("FP16 is not supported on CPU; using FP32 instead")
Przy czym zapewne warto powiedzieć, że nadal nie używam żadnego przełącznika, który jakoś zmieniałby processing na gpu. Konkretnie uruchomiłem go tak: python whisper-script.py plik.wav --model small --language Polish



2022-10-03 13:34

#56 pajper

Czekaj, troszkę się pogubiłem, może po kolei.

1. Instalujesz Cudę,
2. Instalujesz Torcha:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
3. I Whispera:
pip install git+https://github.com/openai/whisper.git

No i powinno śmigać, potem uruchamiasz go:
whisper myfile.wav


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-03 13:40

#57 tomecki

ale jedynym czymś, co tam się zwie whisper to jest właśnie exe więc wydaje mi się, że wtedy zostanie uruchomiony nie jako skrypt pythonowski tylko właśnie z tego exe. Torch chyba sam sobie zaciągnął, ale spróbuję jeszcze raz wg twojej instrukcji.



2022-10-03 13:43

#58 tomecki

No i w razie czego pobrałem tego Torcha, o któym pisałeś. Dobrał się torch audio i torch vision, bo ten hm... zwykły już był i nadal dokłądnie to samo nawet jeśli uruchomię bez przełączników tylko z nazwą pliku, dokładnie jak pisałeś.



2022-10-03 13:46

#59 pajper

Tylko wywal exe Whispera koniecznie. ;)


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-03 13:46

#60 pajper

Minęliśmy się z wpisami. Ale mój typ pozostaje, upewnij się, że nie masz exe Whispera, żeby nie uruchamiał z tej binarki. Tam prawdopodobnie jest zbundlowany cały Python.


#StandWithUkraine

Shoot for the Moon. Even if you miss, you'll land among the stars.
2022-10-03 13:47