Whisper czyli nowe fajne do rozpoznawania mowy
Back to Nowości, odkrycia, newsy#221 zywek
git to git, współpracuje ze wszystkimi tego typu, gitlab, github, nie wiem co jeszcze :D
#222 midzi
Dokładnie, @balteam nie wprowadzaj w błąd. Github to hosting dla gita, git to system kontroli wersji. A, no i @matius ffmpega też Sobie zainstaluj, bo tego też Whisper potrzebuje.
#223 matius
Tak, dzięki. Tylko gita zabrakło. Znalazłem. Pierwszy wynik w google wystarczył.
#224 matius
No to OK. Torch zainstalowany, a i tak twierdzi, że go nie znalazł. Dziwne. Jak teraz wogule urzyć tego whispera? Ffmpeg mam zainstalowany.
#225 midzi
Jaki masz dokładnie komunikat po uruchomieniu Whispera?
#226 matius
C:\Users\mateu>pip install git+https://github.com/openai/whisper.git
Defaulting to user installation because normal site-packages is not writeable
Collecting git+https://github.com/openai/whisper.git
Cloning https://github.com/openai/whisper.git to c:\users\mateu\appdata\local\temp\pip-req-build-gn8i0dfp
Running command git clone --filter=blob:none --quiet https://github.com/openai/whisper.git 'C:\Users\mateu\AppData\Loc
al\Temp\pip-req-build-gn8i0dfp'
Resolved https://github.com/openai/whisper.git to commit eff383b27b783e280c089475852ba83f20f64998
Preparing metadata (setup.py) ... done
Collecting numpy
Using cached numpy-1.23.5-cp311-cp311-win_amd64.whl (14.6 MB)
ERROR: Ignored the following versions that require a different python version: 1.21.2 Requires-Python >=3.7,<3.11; 1.21.
3 Requires-Python >=3.7,<3.11; 1.21.4 Requires-Python >=3.7,<3.11; 1.21.5 Requires-Python >=3.7,<3.11; 1.21.6 Requires-P
ython >=3.7,<3.11
ERROR: Could not find a version that satisfies the requirement torch (from whisper) (from versions: none)
ERROR: No matching distribution found for torch
[notice] A new release of pip available: 22.3 -> 22.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip
#227 zywek
Torch instalujesz najpierw.
#228 matius
Zainstalowałem anaconde, która powinna torcha zainstalować.
#229 zywek
Nie, sama nie zainstluje, jeśli chciałeś przez anaconde to powinieneś wyklepać conda install coś tam, ale już robisz, także bomba.
#230 matius
Tak, okazało się, że przy instalacji pytorch trzeba było zamienić 116 na 117. Bo komende znalazłem, a nie wiedziałem czemu się nie instaluje i wali eerror. Ale Żywek pomugł i się ciągnie.
#231 Paulinux
Ktoś ubiegł Dawida i zrobił webowe gui do whisper.cpp, ale pod Linuxa, więc ewentualnie na wsl by to mogło stać, w sensie to jest selfhosted, chyba że ktoś znajdzie jakąś instancję
https://codeberg.org/pluja/web-whisper/releases
#232 matius
Ja to czekam na windows exe, bo z tym cpp mam problem taki, że nie mam kompilatora, który by to przerobił.
A z pythonem jest taki problem, że nie może znaleść mi pliku, choć go mam i konsola twierdzi, że znajduje się właśnie w odpowiednim folderze.
#233 matius
Udało się, że konsola znalazła plik, ale jak wpisuje komendę, którą znalazłem w necie, to whisper nie potrafi pliku odpalić.
#234 midzi
Co jakiś czas zerkam na projekty, które inspirowane są Whisperem i ten mnie bardzo zainteresował:
https://github.com/davabase/whisper_real_time
Rozpoznawanie mowy w czasie rzeczywistym z wykorzystaniem Whispera. Muszę przyznać, że działa na prawdę ciekawie. Wyniki są ciut gorsze od tego, co dostajemy przy statycznym pliku, ale i tak działa to imponująco. Jeszcze tak jakby ktoś miał pomysł jak nakarmić danymi wyjściowymi z tego youtube, Zooma czy facebooka, to mamy coś na prawdę ciekawego. :)
#235 Pitef
Ciekawe jakie to ma wymagania karciano graficzne. Jak to w ogóle działa. Sprubuję sam to zainstalować, rozumiem, że na Gicie jest ten pliczuś Readme.MD i z niego trzeba wszystko tak?
#236 tomecki
któym modelem to to umie i jakie ma opóźnienia?
#237 midzi
Ja testowałem na large i u mnie opóźnienie było w granicach kilku sekund, wszystko zależy pewnie od GPU
#238 matius
A ktoś mógłby podesłać, albo wyjaśnić jak to wszystko odpalić? Bo mam wszystko poinstalowane, a jak chce aby odpaliło plik to jest błąd.
Może ja źle wpisuje komende, którą znalazłem w necie?
#239 Pitef
O to to to. Mateponczas swego czasu robił tu instruktarz, jak to zainstalować. Może jakiś update?
#240 zywek
Ale jaki błąd jest konkretnie, przecież Cię pytałem, jak próbujesz cokolwiek na jakimkolwiek pliku zrobić.