Whisper czyli nowe fajne do rozpoznawania mowy
Wróć do Nowości, odkrycia, newsy#21 nuno69
Ja mam RTX 3090,TI ciekawe jak u mnie
#22 pajper
@tomecki Musisz zainstalować Cudę.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#23 tomecki
Mam zainstalowaną. Co do cyferek to nie zauważyłem, że Whisper sam sobie różne pliki tworzy w tym taki z samym tekstem.
#24 zywek
Pewnie nie potrafi tych wszystkich plików znaleźć, masz w zmiennej %path% czy jak ona tam isę nazywała te wszystkie odnośniki do katalogów, gdzie cuda jest zainstalowane?
#25 tomecki
Nie wydaje mi się. Path; C:\Users\napis\AppData\Local\Programs\Python\Python39\Scripts\;C:\Users\napis\AppData\Local\Programs\Python\Python39\;C:\Users\napis\AppData\Local\Microsoft\WindowsApps
#26 tomecki
Nie wiem co tam ma być w takim razie do Cuda.
#27 pajper
Najłatwiej sprawdzić, odpalając pythona z konsoli (python lub python3) i wpisując dwie komendy:
import torch
torch.cuda.is_available()
Jak wyskoczy False, Torch nie widzi Cuda, jak True, problem jest gdzieś indziej.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#28 tomecki
No i jest True.
#29 zywek
Dziwne, ja w ogóle nie mam ich zainstalowanych a pewne rzeczy mi działają.
#30 zywek
Torch nie jest żadnym wyznacznikiem, bo u mnie też działa, a nie mam zainstalowanego cuda w ogóle.
#31 tomecki
A nie ma tam jakiegoś przełącznika, który by tym sterował? bo np. co zrobić jeśli mam taką średnią kartę i część modeli mogę ładować na gpu, ale część już nie?
#32 pajper
Torch jest wyznacznikiem, bo Whisper na Torchu stoi.
A masz pewność, że to idzie po CPU? U mnie od razu ładnie wykryło 1650 TI, właśnie teraz sprawdziłem.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#33 pajper
XPS 9500 to świetny komputer, ale nie powstał z myślą o AI i to widać. Na profilu base, czyli tym który poprzednio podrzucałem, osiągana prędkość transkrypcji to ok. 2,5x, na profilu small ok. 1x, na medium (już taki naprawdę dobry) ok. 0,4x i na large 0,2x. Testowane na Tyfloprzeglądzie.
Bije CPU na głowę, ale wciąż nie porywa.
Czekam z zainteresowaniem na wyniki z RTX-ów.
PS. Jak trzeba być nienormalnym, żeby napisać program do generowania syntezatorów z absolutnie wszystkiego, spinając w tandem Whispera i RHVoice do transkrypcji i ćwiczenia z dowolnego audio?
Polecam się na przyszłość! :D
Shoot for the Moon. Even if you miss, you'll land among the stars.
#34 tomecki
No, CPU jest zajęte w 75%, a w ramie zajęte 4.5gb przy medium.
Też myślałem o spięciu Whispera i RH, ale często to chyba nawet zbyt dużo, przy najmniej jeśli chodzi o audiobooki, bo tam z reguły tekst już jest tylko trzeba wiedzieć, gdzie jesteśmy konkretnie w tym tekście i odpowiednio audio poszatkować.
#35 pajper
A jak z GPU? Bo to wygląda, jakby było OK. Przy AI nie jest tak, że procesor nie będzie pracował. GPU wspomaga obliczenia, ale nie zastępuje procka.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#36 pajper
Tak sobie radzi na profilu small. ;)
Shoot for the Moon. Even if you miss, you'll land among the stars.
#37 tomecki
Już lepiej. Testowałem na swoim, bo u mnie było sporo tła no i sam się trochę plątałem.
#38 tomecki
Ustawiłem na wszelki wypadek model na small i GPU nie robi nic, przy najmniej tak pokazuje Armory Crate.
#39 pajper
A dostajesz warning o przeskoku na FP32? Bo jeśli nie, to pracuje na pewno na GPU.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#40 tomecki
Dostaję.