![]() |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Опубликована AI-модель ChatTTS для синтеза речи" | +/– | ![]() |
Сообщение от opennews (??), 29-Май-24, 15:18 | ||
Проект ChatTTS опубликовал модель и связанный с ней инструментарий машинного обучения для синтеза эмоциональной речи. Проект ChatTTS специально оптимизирован для использования в диалоговых системах, таких как интерактивные помощники, и нацелен на воспроизведение свойств естественного эмоционального общения. Поддерживается взаимодействие с несколькими говорящими и построение интерактивного диалога. Корректно отслеживаются и воспроизводятся при синтезе просодические элементы, такие как смех, паузы и междометия... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по ответам | RSS] |
2. Сообщение от Аноним (2), 29-Май-24, 15:18 | +2 +/– | ![]() |
А можно синтезировать синтезатор Стивена Хокинга с его помощью? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
3. Сообщение от Tron is Whistling (?), 29-Май-24, 15:24 | +11 +/– | ![]() |
> для защиты от использования модели для совершения мошеннических и криминальных действий при обучении модели использована подстановка высокочастотного шума и задействован максимальный уровень сжатия звука | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #5, #12 |
4. Сообщение от Tron is Whistling (?), 29-Май-24, 15:31 | +/– | ![]() |
И да, сторонники альтернативной теории информации - ну что, отделите шум от плевел в данном вопросе? Если бы было так легко - всё бы было легко и просто. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #6, #11 |
5. Сообщение от Аноним (-), 29-Май-24, 15:31 | +/– | ![]() |
Держу пари, что только в бесплатной версии. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 |
6. Сообщение от Аноним (6), 29-Май-24, 15:50 | +1 +/– | ![]() |
А что это ещё за альтернативная теория информации? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 Ответы: #10, #22 |
7. Сообщение от Аноним (7), 29-Май-24, 16:12 | +1 +/– | ![]() |
> для русского языка можно рекомендовать фреймворк TTS и модель XTTS-v2, которые кроме синтеза поддерживают клонирование голоса по короткой записи речи, в том числе для синтеза на другом языке | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #19 |
8. Сообщение от Аноним (8), 29-Май-24, 17:01 | +2 +/– | ![]() |
Microsoft Agent и Ivona как-то же работают без RTX4090. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
9. Сообщение от Женя Вертолёт (?), 29-Май-24, 17:46 | +2 +/– | ![]() |
Где это можно попробовать онлайн? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
10. Сообщение от n00by (ok), 29-Май-24, 17:50 | –2 +/– | ![]() |
Это где T9 называют "ИИ". | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #6 Ответы: #15 |
11. Сообщение от Женя Вертолёт (?), 29-Май-24, 17:52 | +/– | ![]() |
Ты сам то понял что написал?! | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
12. Сообщение от Женя Вертолёт (?), 29-Май-24, 17:54 | +4 +/– | ![]() |
Вообще нездоровая тенденция. Почему кто-то ограничивает одних, ради того, чтобы огородить других? Это примерно из той же оперы, когда государство лезет к тебе на кухню и отнимает ножи, веди ими зарэзать можно. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 Ответы: #17 |
13. Сообщение от Женя Вертолёт (?), 29-Май-24, 17:57 | +3 +/– | ![]() |
> Кроме того, для защиты от использования модели для совершения мошеннических и криминальных действий при обучении модели использована подстановка высокочастотного шума и задействован максимальный уровень сжатия звука, используя формат MP3. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #39 |
14. Сообщение от InuYasha (??), 29-Май-24, 18:13 | +1 +/– | ![]() |
> Для генерации 30-секундной записи требуется GPU с 4 ГБ памяти. На GPU NVIDIA GeForce RTX 4090D скорость генерации составляет приблизительно 7 семантических токенов в секунду. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #23, #28, #41 |
15. Сообщение от Аноним (15), 29-Май-24, 18:29 | +/– | ![]() |
вот только это уже давно и близко не t9, внутри там все очень сложно | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #10 Ответы: #24 |
17. Сообщение от Аноним (-), 29-Май-24, 18:35 | –1 +/– | ![]() |
> Вообще нездоровая тенденция. Почему кто-то ограничивает одних, ради того, чтобы огородить других? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #12 Ответы: #25, #43, #56 |
19. Сообщение от Аноним (-), 29-Май-24, 18:46 | +3 +/– | ![]() |
> Нет, лучше уж модель TTS от OpenAI. Она хоть и проприетарная, и с американским | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #7 |
22. Сообщение от Tron is Whistling (?), 29-Май-24, 18:59 | +/– | ![]() |
> А что это ещё за альтернативная теория информации? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #6 Ответы: #33 |
23. Сообщение от Аноним (23), 29-Май-24, 20:18 | +/– | ![]() |
| ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #14 |
24. Сообщение от Аноним (24), 29-Май-24, 20:36 | +/– | ![]() |
Ничего сложного там и в помине нету... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 |
25. Сообщение от Аноним (25), 29-Май-24, 21:06 | +4 +/– | ![]() |
Вот когда их огородят на столько что ограда вокруг тебя сомкнется - вот тогда-то ты запоешь по другому.. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #17 Ответы: #42 |
26. Сообщение от Аноним (26), 29-Май-24, 21:16 | +/– | ![]() |
Когда они наконец сделают рилтайм замену голоса. Я давно хочу попробовать под гитару попеть голосом челентано, или бейонсе, или... ну короче не своим отстойным голосом, а заипадым вокалом. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #38, #40, #53 |
27. Сообщение от Геймер (?), 29-Май-24, 21:23 | –2 +/– | ![]() |
Юниксвей для нейросеток. Нейросетка должна делать что-то одно и делать это хорошо, и весить не более 50 мегабайт. ChatTTS всё таки ещё не юниксвей. Но может им быть. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #29 |
28. Сообщение от Аноним (28), 29-Май-24, 21:26 | +/– | ![]() |
Послушал. Поржал. По-моему, даже SAM естественнее звучит. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #14 |
29. Сообщение от Аноним (28), 29-Май-24, 21:29 | –1 +/– | ![]() |
> и весить не более 50 мегабайт. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #27 Ответы: #30, #31, #48 |
30. Сообщение от Геймер (?), 29-Май-24, 21:38 | –1 +/– | ![]() |
"640 КБ должно хватить для любых задач" | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #29 |
31. Сообщение от Геймер (?), 29-Май-24, 21:42 | –3 +/– | ![]() |
Если нейросеть заточена под только одну функцию и при этом может работать вместе с другими нейрсетями, используя универсальный текстовой интерфейс, то её объём не будет стремиться к бесконечности. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #29 |
33.
Сообщение от Аноним![]() | +/– | ![]() |
Эксперды в __теории__ безопасности, важно учесть. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #22 Ответы: #35 |
35. Сообщение от Tron is Whistling (?), 29-Май-24, 22:06 | +/– | ![]() |
В практике, думаю, выйдут не хуже ;) | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #33 |
38. Сообщение от Аноним (25), 29-Май-24, 22:34 | +/– | ![]() |
RVC | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 |
39. Сообщение от Аноним (25), 29-Май-24, 22:58 | –2 +/– | ![]() |
переводи в wav. выводи синтез на колонки и снимай с них микрофоном | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #13 |
40. Сообщение от nshmyrev (ok), 29-Май-24, 23:39 | +/– | ![]() |
Скорее на основе RVC https://github.com/w-okada/voice-changer | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 |
41. Сообщение от nshmyrev (ok), 29-Май-24, 23:41 | +/– | ![]() |
Попробуйте https://github.com/alphacep/vosk-tts. Качество выше, скорость высокая. На CPU 0.06xRT | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #14 Ответы: #46 |
42. Сообщение от Аноним (42), 29-Май-24, 23:57 | +/– | ![]() |
тех кого государство не отгородило от придурков на встречной уже не запоют вааще никак... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #25 Ответы: #45 |
43. Сообщение от Аноним (43), 30-Май-24, 02:10 | +1 +/– | ![]() |
Если бы государство не ограничивала тебя от решения своих проблем, то нехороших людей на встречке, паркующихся чудаков, бухих самокатчиков было бы сильно меньше и жили бы они не долго. Но т.к. максимум что ты можешь с ними сделать это смириться, то страдай и плати налоги, может часть из них пойдёт на отбойники и столбики. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #17 |
45. Сообщение от нейм (?), 30-Май-24, 07:57 | +/– | ![]() |
нет, ну технически, у них сейчас тоже оградка есть и практическм сомкнутая | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #42 |
46. Сообщение от InuYasha (??), 30-Май-24, 11:26 | +/– | ![]() |
> Languages Python 99.9% | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #41 |
47. Сообщение от InuYasha (??), 30-Май-24, 11:30 | +/– | ![]() |
Кстати, а никто не знает, какой MLG voice использовали Pendulum в своём эпичном Blood Sugar? :) | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
48. Сообщение от _kp (ok), 30-Май-24, 12:57 | +/– | ![]() |
Минимальный TTS на Spectrum влазил в 0.7 кБ! Качество соответсвующее, но размер, точнее его отсутствие, все равно впечатляет. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #29 Ответы: #49 |
49. Сообщение от Аноним (28), 30-Май-24, 13:11 | +/– | ![]() |
Предпочитаю впечатляться качеством, а не размером, всё-таки не времена спектрумов. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #48 Ответы: #50 |
50. Сообщение от _kp (ok), 30-Май-24, 13:44 | +/– | ![]() |
Про качество логично. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #49 Ответы: #51 |
51. Сообщение от Аноним (28), 30-Май-24, 14:45 | +/– | ![]() |
Требования-то, конечно, да, но размер модели меня не напрягает. ≈Гигабайт локально, если будет _нормальный_ голос — это ни о чём. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #50 Ответы: #52 |
52. Сообщение от _kp (ok), 30-Май-24, 15:17 | +/– | ![]() |
Проблема не в ги6абайтах, что дешево, в том что для генерации на лету надо ещё и толстую видеокарту, которая не будет выводить видео, а займется синтезом речи. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #51 Ответы: #54 |
53. Сообщение от Аноним (53), 30-Май-24, 16:40 | +1 +/– | ![]() |
Так голос поменять не проблема, проблема в вокале. Если петь ты не умеешь то меняй хоть на голос шакиры - будешь голосом шакиры, но так же как и раньше хреново петь. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 |
54. Сообщение от Аноним (28), 31-Май-24, 10:10 | +1 +/– | ![]() |
Ветка началась с мерянья пиписьками, у кого меньше. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #52 |
55. Сообщение от rvs2016 (ok), 31-Май-24, 10:23 | +/– | ![]() |
Из описания не понял - можно ли эту "модель" использовать где-то у себя и какой пакадж для этого установить надо? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
56. Сообщение от Аноним (-), 31-Май-24, 17:08 | +/– | ![]() |
> Еще бы что-то с бухими самокатчиками сделать и вообще будет ништяк! | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #17 |
57. Сообщение от Аноним (57), 31-Май-24, 19:40 | +/– | ![]() |
Если почитать сабж в Гите то оно обучалось на китайском и английском языках. Поэтому основное применение его именно там. Хотеть от нее хорошего русского... Ну такое... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |