The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]



"Обновление голосовых данных Mozilla Common Voice 8.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от opennews (ok), 31-Янв-22, 09:25 
Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч людей. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился на 30% -  с 13.9  до 18.2 тысяч часов речи. Число поддерживаемых языков возросло с 67 до 87...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=56608

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноньимъ (ok), 31-Янв-22, 09:25 
Есть же аналог GPL для медиа файлов?
Общественное достояние защищает от претензий?

А как насчёт согласия людей в этих данных?

Ответить | Правка | Наверх | Cообщить модератору

11. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Анонимemail (11), 31-Янв-22, 10:13 
> А как насчёт согласия людей в этих данных?

( ͡° ͜ʖ ͡°)

Ответить | Правка | Наверх | Cообщить модератору

13. "Обновление голосовых данных Mozilla Common Voice 8.0"  +4 +/
Сообщение от Жироватт (ok), 31-Янв-22, 10:18 
1. Семейство лицензий Creative Commons - это он и есть. Аналог копилефта не на программный код, а на творческие произведения.
2. Да, кроме близких к собственническим CC BY-NC-ND и CC BY-NC-SA. CC0 - аналог общественного достояния
https://creativecommons.org/licenses/?lang=ru
3. "Отправляя ваши данные ... бла-бла-бла ... вы согласны, что они будут распространятся под СС0 и отказываетесь от всех претензий". Тут уже был срачи про такие договоры, вполне себе легальная акцепт-офертная схема
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

15. "Обновление голосовых данных Mozilla Common Voice 8.0"  –1 +/
Сообщение от Аноньимъ (ok), 31-Янв-22, 10:46 
Спасибо, интересно.

Ответить | Правка | Наверх | Cообщить модератору

2. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Корец (?), 31-Янв-22, 09:29 
>распространение записей во вносящем искажения формате MP3.

И что им мешает использовать другой формат?

Ответить | Правка | Наверх | Cообщить модератору

3. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (3), 31-Янв-22, 09:33 
А что тебе мешает забить на это? Ну серьезно, не пофиг ли?
Ответить | Правка | Наверх | Cообщить модератору

12. "Обновление голосовых данных Mozilla Common Voice 8.0"  –1 +/
Сообщение от Анонимemail (11), 31-Янв-22, 10:14 
FLAC рулит! Благо сейчас накопители большого объема — не роскошь.
Ответить | Правка | Наверх | Cообщить модератору

5. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (5), 31-Янв-22, 09:39 
На что денег хватило.
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору

9. "Обновление голосовых данных Mozilla Common Voice 8.0"  –2 +/
Сообщение от Жироватт (ok), 31-Янв-22, 10:10 
Современные "погромисты" из мозиллы вряд ли знают что-то кроме МРЗ - Московского РадиоЗаавода.
Про OGG слышали, наверное, единицы, а про форматы без потерь так вообще одни легенды ходят.
А может все гораздо проще? Функции-заклинания из библиотеки-гримуара для эмпэтри они вызывать научились, а потом просто тяп-ляп и в продакшн?
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору

27. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Skullnetemail (ok), 31-Янв-22, 15:50 
> Про OGG слышали, наверное, единицы, а про форматы без потерь так вообще одни легенды ходят.

opus лучше.

Ответить | Правка | Наверх | Cообщить модератору

32. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (-), 01-Фев-22, 07:19 
opus - патентованное говно.
Ответить | Правка | Наверх | Cообщить модератору

37. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Анонимemail (37), 05-Фев-22, 19:10 
Можно поподробнее? Какие ограничения у opus?
Ответить | Правка | Наверх | Cообщить модератору

38. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Ууууу... (?), 07-Фев-22, 13:31 
Нет, не лучше. Он вносит кучу отсебятины в исходный сигнал, чтобы замаскировать искажения от потерь. На слух терпимо, а вот по приборам - сущий ад. Самый честный в этом плане в настоящий момент - AAC. Ну или LossyFlac/LossyWav.
Ответить | Правка | К родителю #27 | Наверх | Cообщить модератору

16. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Alice Ventusemail (?), 31-Янв-22, 11:17 
А зачем?
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору

17. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (17), 31-Янв-22, 11:29 
А затем, чтобы не приходилось при использовании модели кодировать/раскодировать звук из микрофона в mp3 для лучшего распознавания.
Ответить | Правка | Наверх | Cообщить модератору

4. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Генри Форд (?), 31-Янв-22, 09:35 
Некогда один из лучших браузеров успешно закопали, теперь можно и в синтез речи поиграться.
Ответить | Правка | Наверх | Cообщить модератору

18. "Обновление голосовых данных Mozilla Common Voice 8.0"  –1 +/
Сообщение от Аноним (18), 31-Янв-22, 12:01 
Синтез речи это здорово на самом деле. Правда нее очень понятно, почему этим занимается "браузер".
Ответить | Правка | Наверх | Cообщить модератору

6. "Обновление голосовых данных Mozilla Common Voice 8.0"  +2 +/
Сообщение от Владимир (??), 31-Янв-22, 09:43 
Они что, всех белорусов опросили? Откуда такой большой скачок для них?
Ответить | Правка | Наверх | Cообщить модератору

14. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (14), 31-Янв-22, 10:43 
> Они что, всех белорусов опросили?

Хаха... А ещё, судя по всему, всех оставшихся в мире носителях русского языка: "русского языка охватывает 2452 участника".

> Откуда такой большой скачок для них?

Простой гуглинг подсказывает, что была новость на самом большом (по посещаемости) сайте байнета (новостном). И куча перепечаток на новостных сайтах поменьше.

Ответить | Правка | Наверх | Cообщить модератору

23. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Андрей (??), 31-Янв-22, 15:13 
Просто выступления Лукашенко под разными именами записали))
Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

19. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (-), 31-Янв-22, 12:10 
>распространение записей во вносящем искажения формате MP3

Использовать для хранения Ogg Vorbis не судьба?

Ответить | Правка | Наверх | Cообщить модератору

20. "Обновление голосовых данных Mozilla Common Voice 8.0"  +2 +/
Сообщение от Жироватт (ok), 31-Янв-22, 12:15 
Чува-а-а-ак, это надо раскуривать либы к ворбису. А это НЕ потраченное на смуззи и травлю сторонников Трампа в твиттере время. Смекаешь?
Ответить | Правка | Наверх | Cообщить модератору

21. "Обновление голосовых данных Mozilla Common Voice 8.0"  +1 +/
Сообщение от Аноним (21), 31-Янв-22, 12:21 
затея изначально дно, либо поставляйте лосслесс либо вы саботируете развитие технологий совершая преступление против человечества
Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

22. "Обновление голосовых данных Mozilla Common Voice 8.0"  –1 +/
Сообщение от Аноним (-), 31-Янв-22, 15:08 
Лослесс проприетарный, лучше от него держатся подальше. FLAC - копилефтный формат.
Ответить | Правка | Наверх | Cообщить модератору

24. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Андрей (??), 31-Янв-22, 15:16 
flac к сведению без потерь, плюс есть ещё несколько форматов без потерь, которые свободны. С другой стороны даже флак будет означать, что 5ГБ превратятся в 40-80 ГБ, что ПМСМ совсем плохо, особенно если вообще взять белорусский или английский.
Ответить | Правка | Наверх | Cообщить модератору

25. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (21), 31-Янв-22, 15:25 
Сегодня такой размер датасета это ни о чём, особенно учитывая, в каких условиях будут тренировать сети. Можно хоть вообще wave формат раздавать. И да, голос весьма эффективно жмётся.
Ответить | Правка | Наверх | Cообщить модератору

29. "Обновление голосовых данных Mozilla Common Voice 8.0"  –1 +/
Сообщение от Аноним (-), 31-Янв-22, 18:08 
>Можно хоть вообще wave формат раздавать.

WAVE - маздаевский, его использовать не надо. Всё что создано Microsoft должно быть уничтожено.

Ответить | Правка | Наверх | Cообщить модератору

35. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (35), 02-Фев-22, 11:40 
При этом нормального аналога так и нет.
Кстати, у RIFF ноги ещё с Амиги растут.
Ответить | Правка | Наверх | Cообщить модератору

26. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (21), 31-Янв-22, 15:29 
Флак не копилефтный, копилефтные только консольные утилиты для работы с ним. Мп3 для сравнения как формат только пару лет назад перестал быть проприетарным и требовать отчислений за использование (и то с оговорками емнип) и это как-то не мешало использовать его как в коммерческом так и в свободном софте (в основном конечно в коммерческом, потому что кому интересно платить отчисления).
Ответить | Правка | К родителю #22 | Наверх | Cообщить модератору

30. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (-), 31-Янв-22, 18:10 
Какое жалкое стремление, во чтобы ни стало, держаться MP3, у MP3 подпорченная репутация.
Ответить | Правка | Наверх | Cообщить модератору

28. "Обновление голосовых данных Mozilla Common Voice 8.0"  +1 +/
Сообщение от анон (?), 31-Янв-22, 17:33 
speex /thread
Ответить | Правка | Наверх | Cообщить модератору

33. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от soup2 (?), 01-Фев-22, 08:34 
Двачую xDDDDD
Ответить | Правка | Наверх | Cообщить модератору

34. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от Аноним (34), 01-Фев-22, 12:09 
deprecated
Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

36. "Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от adolfus (ok), 02-Фев-22, 23:38 
Цырк. В стародавние времена (1997???) в составе дистрибутива IBM OS/2 4.0 Merlin было приложение VoiceType. Оно не только "произносило" тексты, но и записывало их под диктовку. Правда, на английском, но отлично обучалось советскому произношению диктовавшего. И все это работало на первом пентиуме со ста двадцатью мегабайтами памяти.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру