Whisper czyli nowe fajne do rozpoznawania mowy
Back to Nowości, odkrycia, newsy#281 Numernabis
Dzięki
#282 balteam
Mam w folderze 3 pliki
ggml-large-v1.bin
whisper.exe
i whisper dll
Otwieram ten folder w terminalu.
No i wpisuję co axm04 pisał na przykład, wyskakuje mi:
whisper.cpp.exe : The term 'whisper.cpp.exe' is not recognized as the name of a cmdlet, function, script file, or opera
Pytanie proste, co robię nie tak? :D
#283 AXM04
najlepiej utworzyć w folderze whisper-a folder "models" lub coś podobnego, tam przekopiować model jakiego chcesz użyć, a potem tylko w lini z parametrami dopisujesz:
"-m /.bin"
-- (balteam):
Mam w folderze 3 pliki
--
#284 balteam
zaraz Potestuję, ale dlaczego whisper.cpp.exe -h pokazuje not recognized?
#285 pajper
Może nie jesteś w tym folderze?
Wpis cd żeby sprawdzić, albo dir/b do wylistowania plików.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#286 balteam
Jak wpisuję cd to mam
PS C:\Users\budyn\Favorites\whisper.cpp\whisper.cpp>
natomiast dir/b wyrzuca też info is not recognized
#287 pajper
Jesteś w Powershellu, nie linii komand.
Shoot for the Moon. Even if you miss, you'll land among the stars.
#288 balteam
Dobra, plik wav jeszcze tak łopatologicznie proszę jak ma wyglądać
mono,
rate 16 khz
bitrate jakie?
Pajper pisał, ale nie rozszyfrowałem wszystkich skrutów, więc no :D
#289 balteam
Czy mogę mu zadeklarować 2 języki i poprawi to rozpoznawanie np. niektórych słów lub zdań w drugim języku?
#290 balteam
gold vawe nie ogarnia tych wytycznych dźwiękowych, ale na stronie
https://audio.online-convert.com/convert-to-wav
można konwertować.
eh 14 na 16 rdzeni, szybkie pisanie ma czasem lagi, jedna minut z 6 minut się konwertuje, ciekawe o ile szybciej jak bym large dał na 16 rdzeni.
#291 balteam
Nie, jednak za długo w 30 minut 4 minuty, a ja myślałem o przemieleniu 1,5 godz :D
Teraz wpisy eltenowe polskie w jakim modelu są robione? Chyba niestety na medium będę musiał przejść.
dlaczego nie mam pl znaków mimo, że wybrałem pl język czyli na koniec dodałm -l pl?
[00:04:29.400 --> 00:04:32.400] ostatecznie sko┼äczy si─Ö tym, ┼╝e zostan─ů prowadzone takie
#292 mateponczas
Hej, dzięki za uznanie, to ja pisałem ten artykuł. Jakby co, wklejam dla Ciebie, Numernabis, pełną wersję, w której masz wszystko opisane. Niestety, ja w pełnej wersji wszystko opisałem, ale mi nie pozwolono wkleić całości do czasopisma, musiałem zatem skrócić.
#293 balteam
Fajnie jak by komuś się chciało i przekleił najważniejsze info do pierwszego postu, albo dał ten artykół Mateponczasa.
Ps. large 9 minut w 1,5 godz, a medium w 30 minut, no różnica ogromna, szkoda, że nie mam 32 rdzeni :D
#294 balteam
Jeśli ktoś chce korzystać z cpp to ta instrukcja Mateponczasa nie do tego.
Wgl gdzie się zapisują wyniki skryptowanego pliku?
#295 AXM04
W folderze gdzie jest plik wejściowy.
Co do pliku:
wav, mono, 16khz, 16bit
-- (balteam):
Jeśli ktoś chce korzystać z cpp to ta instrukcja Mateponczasa nie do tego.
Wgl gdzie się zapisują wyniki skryptowanego pliku?
--
#296 balteam
no to u mnie jest tyle plików co było i żaden nie doszedł, na bank nie ma w folderu wejściowym, może muszę coś wpisać jeszcze w konsoli, albo no nie wiem, zamknąć ją najpierw
#297 matius
Przydałaby się taka łopatologiczna instrukcja do urzywania tego cpp. Jak modele dobrać, jak odpalić. Wszystko.
#298 AXM04
A w lini wywołania whisper.cpp.exe zawarłeś paramert -otxt?
-- (balteam):
no to u mnie jest tyle plików co było i żaden nie doszedł, na bank nie ma w folderu wejściowym, może muszę coś wpisać jeszcze w konsoli, albo no nie wiem, zamknąć ją najpierw
--
#299 AXM04
Nie chciał bym się powtarzać, bo jak wywołać wszystko już pisałem, a skąd pobrać modele się również pojawiło.
Pliki potrzebne do wywołania znajdują sie w załączniku w jednym z poprzednich wpisów pajpera.
-- (matius):
Przydałaby się taka łopatologiczna instrukcja do urzywania tego cpp. Jak modele dobrać, jak odpalić. Wszystko.
--
#300 balteam
Przeczytaj wszystko od wpisu nr 250, ja może napiszę, co do lini, to nie dodałem takiej komendy, teraz wygląda ona tak:
whisper.cpp -m ggml-medium.bin test.wav -t 14 -l pl -ot t
czy git czy jeszcze coś?
Jak pisałem symbole dziwne zamiast polskich znaków są