Forum

Перлы синтезаторов речи

bomberman29

#21 · 2019-10-11 15:41

Transcription

Всем привет! Это я, синтезатор речи от компании Центра речевых технологий. Я очень эмоциональный синтезатор. Если перед словом написать хиштег, то это слово будет ударным в предложение. Я очень интересный мужик. Я очень интересный мужик.

John_Berden

#22 · 2019-10-11 16:06

Transcription

Вау, классно! Вообще, даже лучше, чем у Яндекса.

vlad

#23 · 2019-10-11 17:28

Transcription

Да, лучше бы это, конечно, было воспроизведено с помощью виртуального кабеля, потому что как-то все туда-сюда мелькало, бегало, ну, в смысле, звук. Ну, ладно. Я этим синтезатором в читателе пользовался, есть такое приложение для андроида, это Владимир, по-моему, голос. У него, кстати, есть прикол. Если он зависает, он вот так начинает дышать. Вот как-то так вот. В общем, это довольно-таки интересно. Но книжки читать, в принципе, мне нравилось.

bomberman29

#24 · 2019-10-11 17:31

Transcription

Сейчас я попробую сюда выложить оригинальный WAV-файл чего-нибудь, какого-нибудь текста на этом преобразователе.

sashakozlovskiy

#25 · 2019-10-11 17:33

Transcription

Да, всех приветствую, здравствуйте, Денис. А здесь, по-моему, нельзя в голосовом форуме, только в текстовом можно в файл выкладывать. Да.

spay

#26 · 2019-10-11 21:11

Transcription

Всем попривет! Скажите, пожалуйста, что это за синтезатор такой? Я бы не отказался затестить, если есть он в наличии для скринридеров. Принято. Принято.

John_Berden

#27 · 2019-10-11 21:22

Transcription

Привет, Коля. Это есть у проекта Центра речевой технологии сайт voicefabric.ru Там можно зарегистрироваться и делать тексты, получать звуковые файлы, в общем, классно. И вот тут есть демо на официальном сайте, то есть без регистрации можно брать голос. Тут есть Владимир, Юлия, Александр, Лидия, Мария, Анна, Карл Юэс и Асок Эзет, потом Юлия 8, в общем, разные варианты. Возьмем Владимир 22. И допустим текст. Здравствуйте, меня зовут... Как я говорю, а я не знаю, как я говорю, вам судить. Так, как все. Ставим капчу и скачать. Да. Вот, в итоге мы получаем файл. Вау. И можем послушать. Здравствуйте, меня зовут Владимир. Как я говорю, а я не знаю, как я говорю, вам судить. Вот. Таким вот образом. Ай.

bomberman29

#28 · 2019-10-12 11:04

Transcription

Это всё можно натворить в Telegram. То есть не надо ни на какие демо-сайты заходить, скачивать, капчить и делать. Можно в Telegram-бот STC Text-to-Speech. Напишу я туда slash voices. Предлагает он мне список голосов. Владимир, Анна и Юлия. А, больше никаких голосов, кстати, не выдаёт он. То есть демо всё равно это лучше. Но проще в Telegram написать, например, боту. Боту я текст пишу, он этот текст в голосовом сообщении мне отправляет. Потом могу оттуда каким-то образом скачать. Я только пока ещё не разобрался как. Это на iPhone. Продолжение следует.

spay

#29 · 2019-10-12 18:04

Transcription

Всем поприветую ещё раз. Тема первых синтезаторов речи и в том числе вот эти новые синтезаторы. Да, спасибо тебе конечно за инфу, но блин, жалко что нельзя их использовать в скринридере. А это что-то получается типа Яндекса и Гугла синтезаторов. Ну вообще классные такие синтезаторы. Я до этого момента вот слышал их как-то в одном из спектаклей одной моей знакомой. Думал, что это ей кто-то записывал голоса, типа подражающие синтезаторам. А оказывается есть и такие. Прикольно. Прям вообще круто.

Musicant

#30 · 2019-10-13 20:24

Transcription

Ну, здорово, что кто-то здесь все-таки поделился образчиком синтеза речи от Центра речевых технологий. Хотя технология сегодня принято считать более устаревшей, но тем не менее, в отличие от новомодных, так сказать, синтезаторов, синтезирующих, генерирующих речь по средствам нейронных сетей, все-таки, мне кажется, вариант от ЦРТ звучит гораздо убедительнее. Из новостей по этой теме хочу сказать, что Яндекс поменял в своем голосовом помощнике Алиса, поменял голос, которым зачитываются новости из Яндекс.Новостей. Я сейчас, к своему стыду, не помню, был ли этот голос у Яндекса, и просто они его поменяли, просто заменили голос с одного на другой, или все-таки Яндекс выкосил. Я не знаю, получил ли он какой-то новый голос, не знаю, но любителям Алисы советую послушать, тем, кто еще не слышал, советую послушать Яндекс.Новости. И не просто так советую сделать это именно в этой теме. Кто знает, может быть, найдете какие-то интересные перлы, и запишите сюда. Ну, может быть, и я найду, хотя я сейчас Алисой почти не пользуюсь. Ну, тем не менее, вот такая информация к размышлению.

monstricek

#31 · 2019-10-15 16:01

Transcription

Мне, конечно, очень жаль, что у них так и не вышла версия общедоступная по ЦАПИ-5, которую можно было бы купить. Они планировали в своё время сделать это про ЦРТ. Вроде как говорят, что была какая-то версия, требующая ключ некий USB-шный. Это была версия корпоративная. Но насколько это действительно так, я, честно говоря, не имею никакого понятия. У меня никогда доступа к этому не было. Но вообще, конечно, здорово было бы, если бы был такой синтезатор. Вообще, пожалуй, самая моя большая синтезаторная мечта, это возможность использовать голоса от Яндекса под Windows, как голоса от скринридера. И, собственно говоря, возможность использования Google TTS тоже как голоса скринридера. Ну и, в общем, было бы не дурно, если бы к ЦРТ тоже было бы доступно. Но это, естественно, видимо, не сбудется никогда.

Fenix

#32 · 2019-10-15 16:49

Transcription

таки добрался сюда насчет crt вообще насколько я понимаю в последнее время компания цирка разложилась морально и нравственно честно от них никаких новостей я не видел по поводу развития речевых технологий да и вообще их существование ну а какой-то деятельности раньше говорили что но развивался вот эту тексту спич потом они вроде как на это чуть позабили и стали заниматься обратным процессом то есть преобразованием речи в текст было даже программка какая-то вот вокал что-то там не помню вроде же уходили и и какие-то тестовые версии которые чтобы запустить там надо было какую-то фантастическую кучу операции сделать но это было давно и может уже не пора порождение моей больной фантазии потому что ты сейчас пытался найти все так очень все было очень давно и сейчас тоже сети не сильно много чего-то информативного потом ну а потом как-то и насчет этого что-то новости по утихли потом почему-то не потом неожиданно пропал но кольцоใชко по всему слову детали честно а感емы вот qua switch два в monumental все dev да кажется меня в как же как effective с м leap сидит Dave вот ó в в 来 so здесь aware c vivo gasti centrifugal l он авчанес 10 люди св esper azar dtôi это наверное самое лучшее чем чем бы я сейчас не оказался пользоваться яндексовский голоса очень хороши может по грамматике еще почему-то по какой-то обучаемости возможности их совершенствовать со временем но вот по звучанию не google титис не яндекс вот ну не знаю мне именно такие может более старомодные варианты которые устанавливались в общем которые работали не через интернет чисто по звучанию они мне пока нравится гораздо больше но честно говоря очень хотелось бы что-то качественно наподобие церкви заполучить и кстати интересно вот эти тексты speech в телеграме про который интересно чей он вообще что это официальный какой-то вот вот этой компании или это какой-то какой-то просто чей-то проект если это чей-то проект интересно откуда тогда голоса у этого человека ну точнее откуда то понятно но вот как они работают что они себе представляют

bomberman29

#33 · 2019-10-15 20:06

Transcription

ну где-то я слышал что где-то я слышал что этот текст успеть вроде этот открытый source code у них ну в общем как я рейч войс но может быть я и ошибаюсь кто-то ведь сделал этот telegram вот для преобразования crt может где-то можно взять какую-нибудь сердечную текст успешную программу раз дубасить раз расковырять экзешник какой-нибудь там который в котором есть сердечная читалка текст успеть выковырить текст успеть его и модуль и так далее и там уже разбирать что там в текст успеть и делать его пацапе 5 это насколько это возможно

Musicant

#34 · 2019-10-19 16:51

Transcription

Значит, по поводу САПИ-версии синтезатора от CRT. Действительно небезызвестный в узких кругах Анатолий Попко в одном из своих подкастов говорит, что существует такая версия, и даже ему каким-то образом удалось ее протестировать. Но, в общем, как оказалось, что вот эти алгоритмы, CRT-вские алгоритмы синтеза, они не очень пригодны для того, чтобы использовать этот синтез в работе, потому что очень медленное время отклика. А вообще, да, действительно была идея сделать эту ограниченную версию, не ограниченную, господи, САПИ-версию, защищенную USB-ключом или чем-то, и потом даже ее как-то распространять, или какую-то версию, как раз, да, ограниченную, не случайно я сказал это слово, под скринридеры. Там тоже JOS или под NVDA, чтобы не САПИ-5 это было. Но, к сожалению, внутреннее, само видимо, строение, внутреннее не строение, а устройство синтезатора не позволило получить из него что-то пригодное для работы. Что касается Google TTS, да, наверное, наверное, несмотря на то, что я большой любитель, большой любитель. мыши Волкова, наверное, я бы не отказался от какого-нибудь Google TTS, полноценного, не телефонного, не того вот компактного варианта андроидного, а того, который мы можем услышать в онлайн. Я бы, наверное, не отказался от того, чтобы такой синтезатор работал на компьютере, в том числе и со скринридером, но... Причем, судя по всему, там реально этого добиться. Единственное, что пока сейчас нас останавливает, это очень большое время пинга. И там будет задержка происходить просто вот от этого. Но, как мы знаем, сейчас у нас постепенно запускаются даже сервисы, которые позволяют играть в мощные игры онлайн на слабом железе. Просто потому, что все вычисления проводятся в облаках. Да, и как мы знаем, что когда-то, рано или поздно, грядет 5G. Так что, в принципе, технически, наверное, в течение ближайших нескольких лет это станет реализовать уже, возможно, лет через 5-6. Другое дело, что когда этим кто-то озадачится и озадачится ли, это уже другой вопрос. Потому что и сейчас есть очень много вещей, которые технически реализовать вполне реально. Но, тем не менее, этого никто не делает, либо делает в очень ограниченном, скажем так, масштабе. Поэтому... Ну, в общем, будем посмотреть, что будет происходить дальше.

bomberman29

#35 · 2019-10-19 16:54

Transcription

Ок, я, наверное, ее в балаболке буду использовать, эту CRT-шную, CRT-шный голос.

Musicant

#36 · 2019-10-19 17:29

Transcription

но балаболки его использовать тоже не получится потому что я так понимаю эту версию в итоге завернули вообще и на сегодня я так понимаю реально купить сапи 5 нельзя но и это тоже как бы понять а даже если можно то наверное это уже теперь будет стоить больших денег потому что то о чем я говорю это было это дело там 6 7 летней давности сейчас у crt есть сервис voice фабрик который позволяет конвертировать конвертировать тексты за денежку до в облаке и поэтому я думаю что сейчас им просто нецелесообразно пускать эту версию сапи 5 не сапи 5 если вы даже люди говорят что андроидный читатель теперь ни хрена не работает хотя я им сам не пользовался я не знаю я думаю что наверное теперь уже сказать пролетели мы вместе с балаболкой как фанера над парижем

bomberman29

#37 · 2019-10-19 17:34

Transcription

так ну чё за денежку можно и не конвертировать ничего владимир юлия и еще какой-то там голос я забыл она владимир юлия недоступны за бесплатно в telegram боте то есть нужно зарегистрироваться в telegram на айфоне это легко потому что telegram стал доступен давно стал доступен уже telegram и это уже очень круто и регистрируйтесь значит telegram искать ищите бота stc text-to-speech и можно туда вписывать и слэш войсес это голоса можно вписывать текст и и он отправит аудиосообщение

Musicant

#38 · 2019-10-19 17:37

Transcription

Ну, я так понимаю, вот в Telegram это очень такая утилитарная штука, которая может быть даже больше предназначена для того, чтобы это сообщение, которое он тебе отправит в ответ, потом кому-то переслать Да, но я не думаю, что кто-то настолько щедр, что позволит там конвертировать книжки, например Вот я о чем Потому что, ну, говоря балаболка, все-таки в первую очередь подразумеваются какие-то большие объемы текста значительные

monstricek

#39 · 2019-10-20 16:28

Transcription

Ну, насколько я понимаю, все уперлось в то, что CRT не захотели никак адаптировать свой сенсатор речи. Там не было каких-то прям колоссальных проблем с откликом. Это опять адепты мышки Волкова и Ижа, ведь мы очень сильно переживали, что он откликается там не очень сразу, а чуточку сразу. Потому что я слышал мнение человека, который говорил, что в принципе оно работало-то ничего. Но беда в том, что мы этого уже естественно не протестируем и найти это нигде не найдем, потому что я подозреваю, что CRT ничего такого не стало ни в каком виде выпускать. Кто-то когда-то где-то говорил, что была версия под САПИ-5, рассчитанная на фирмы, стоила это каких-то денег таких довольно серьезных, и CRT не продавала это физическим лицам. Поэтому, ну... Тут вопрос тоже такой, что как к этому получить доступ? Насколько мне известно, на Вейсфабрике, может быть я опять путаю, но вроде бы там есть демо, и возможно тот самый бот прогоняет текст через демо на Вейсфабрике. Вот и все. Но если нет, любопытно было бы узнать, как он это делает.

John_Berden

#40 · 2019-10-20 16:35

Transcription

Привет, Саш! Я смотрел эту фойсфабрику, там только глюк произошёл с казахским синтезатором, я не знаю почему, но казахский синтезатор нормального, сколько там, 22 получается, или сколько там он, он не читает, то есть он как бы заикается очень сильно, только 8, вот. Что касается САПИ, ну можно спросить у кого-нибудь в рассылке, может быть у кого-то эта штука осталась, вот которую тестировали, да, но что касается САПИ-5, вообще я не вижу смысла, сейчас, секунду, я не вижу смысла делать это в САПИ-5, потому что там есть дыхание и так далее, я не вижу этот смысл этот синтезатор использовать именно вот под САПИ. САПИ-5.

Poprzednia 2 / 12 Następna