The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]



"Обновление голосовых данных Mozilla Common Voice 8.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление голосовых данных Mozilla Common Voice 8.0"  +/
Сообщение от opennews (ok), 31-Янв-22, 09:25 
Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч людей. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился на 30% -  с 13.9  до 18.2 тысяч часов речи. Число поддерживаемых языков возросло с 67 до 87...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=56608

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноньимъ (ok), 31-Янв-22, 09:25   +/
Есть же аналог GPL для медиа файлов?
Общественное достояние защищает от претензий?

А как насчёт согласия людей в этих данных?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #11, #13

2. Сообщение от Корец (?), 31-Янв-22, 09:29   +/
>распространение записей во вносящем искажения формате MP3.

И что им мешает использовать другой формат?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #3, #5, #9, #16

3. Сообщение от Аноним (3), 31-Янв-22, 09:33   +/
А что тебе мешает забить на это? Ну серьезно, не пофиг ли?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #12

4. Сообщение от Генри Форд (?), 31-Янв-22, 09:35   +/
Некогда один из лучших браузеров успешно закопали, теперь можно и в синтез речи поиграться.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #18

5. Сообщение от Аноним (5), 31-Янв-22, 09:39   +/
На что денег хватило.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

6. Сообщение от Владимир (??), 31-Янв-22, 09:43   +2 +/
Они что, всех белорусов опросили? Откуда такой большой скачок для них?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #14, #23

9. Сообщение от Жироватт (ok), 31-Янв-22, 10:10   –2 +/
Современные "погромисты" из мозиллы вряд ли знают что-то кроме МРЗ - Московского РадиоЗаавода.
Про OGG слышали, наверное, единицы, а про форматы без потерь так вообще одни легенды ходят.
А может все гораздо проще? Функции-заклинания из библиотеки-гримуара для эмпэтри они вызывать научились, а потом просто тяп-ляп и в продакшн?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #27

11. Сообщение от Анонимemail (11), 31-Янв-22, 10:13   +/
> А как насчёт согласия людей в этих данных?

( ͡° ͜ʖ ͡°)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

12. Сообщение от Анонимemail (11), 31-Янв-22, 10:14   –1 +/
FLAC рулит! Благо сейчас накопители большого объема — не роскошь.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3

13. Сообщение от Жироватт (ok), 31-Янв-22, 10:18   +4 +/
1. Семейство лицензий Creative Commons - это он и есть. Аналог копилефта не на программный код, а на творческие произведения.
2. Да, кроме близких к собственническим CC BY-NC-ND и CC BY-NC-SA. CC0 - аналог общественного достояния
https://creativecommons.org/licenses/?lang=ru
3. "Отправляя ваши данные ... бла-бла-бла ... вы согласны, что они будут распространятся под СС0 и отказываетесь от всех претензий". Тут уже был срачи про такие договоры, вполне себе легальная акцепт-офертная схема
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #15

14. Сообщение от Аноним (14), 31-Янв-22, 10:43   +/
> Они что, всех белорусов опросили?

Хаха... А ещё, судя по всему, всех оставшихся в мире носителях русского языка: "русского языка охватывает 2452 участника".

> Откуда такой большой скачок для них?

Простой гуглинг подсказывает, что была новость на самом большом (по посещаемости) сайте байнета (новостном). И куча перепечаток на новостных сайтах поменьше.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

15. Сообщение от Аноньимъ (ok), 31-Янв-22, 10:46   –1 +/
Спасибо, интересно.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13

16. Сообщение от Alice Ventusemail (?), 31-Янв-22, 11:17   +/
А зачем?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #17

17. Сообщение от Аноним (17), 31-Янв-22, 11:29   +/
А затем, чтобы не приходилось при использовании модели кодировать/раскодировать звук из микрофона в mp3 для лучшего распознавания.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16

18. Сообщение от Аноним (18), 31-Янв-22, 12:01   –1 +/
Синтез речи это здорово на самом деле. Правда нее очень понятно, почему этим занимается "браузер".
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

19. Сообщение от Аноним (-), 31-Янв-22, 12:10   +/
>распространение записей во вносящем искажения формате MP3

Использовать для хранения Ogg Vorbis не судьба?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #20, #21

20. Сообщение от Жироватт (ok), 31-Янв-22, 12:15   +2 +/
Чува-а-а-ак, это надо раскуривать либы к ворбису. А это НЕ потраченное на смуззи и травлю сторонников Трампа в твиттере время. Смекаешь?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19

21. Сообщение от Аноним (21), 31-Янв-22, 12:21   +1 +/
затея изначально дно, либо поставляйте лосслесс либо вы саботируете развитие технологий совершая преступление против человечества
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19 Ответы: #22

22. Сообщение от Аноним (-), 31-Янв-22, 15:08   –1 +/
Лослесс проприетарный, лучше от него держатся подальше. FLAC - копилефтный формат.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21 Ответы: #24, #26

23. Сообщение от Андрей (??), 31-Янв-22, 15:13   +/
Просто выступления Лукашенко под разными именами записали))
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

24. Сообщение от Андрей (??), 31-Янв-22, 15:16   +/
flac к сведению без потерь, плюс есть ещё несколько форматов без потерь, которые свободны. С другой стороны даже флак будет означать, что 5ГБ превратятся в 40-80 ГБ, что ПМСМ совсем плохо, особенно если вообще взять белорусский или английский.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #22 Ответы: #25

25. Сообщение от Аноним (21), 31-Янв-22, 15:25   +/
Сегодня такой размер датасета это ни о чём, особенно учитывая, в каких условиях будут тренировать сети. Можно хоть вообще wave формат раздавать. И да, голос весьма эффективно жмётся.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #24 Ответы: #29

26. Сообщение от Аноним (21), 31-Янв-22, 15:29   +/
Флак не копилефтный, копилефтные только консольные утилиты для работы с ним. Мп3 для сравнения как формат только пару лет назад перестал быть проприетарным и требовать отчислений за использование (и то с оговорками емнип) и это как-то не мешало использовать его как в коммерческом так и в свободном софте (в основном конечно в коммерческом, потому что кому интересно платить отчисления).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #22 Ответы: #30

27. Сообщение от Skullnetemail (ok), 31-Янв-22, 15:50   +/
> Про OGG слышали, наверное, единицы, а про форматы без потерь так вообще одни легенды ходят.

opus лучше.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #9 Ответы: #32, #38

28. Сообщение от анон (?), 31-Янв-22, 17:33   +1 +/
speex /thread
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #33, #34

29. Сообщение от Аноним (-), 31-Янв-22, 18:08   –1 +/
>Можно хоть вообще wave формат раздавать.

WAVE - маздаевский, его использовать не надо. Всё что создано Microsoft должно быть уничтожено.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #25 Ответы: #35

30. Сообщение от Аноним (-), 31-Янв-22, 18:10   +/
Какое жалкое стремление, во чтобы ни стало, держаться MP3, у MP3 подпорченная репутация.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #26

32. Сообщение от Аноним (-), 01-Фев-22, 07:19   +/
opus - патентованное говно.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27 Ответы: #37

33. Сообщение от soup2 (?), 01-Фев-22, 08:34   +/
Двачую xDDDDD
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #28

34. Сообщение от Аноним (34), 01-Фев-22, 12:09   +/
deprecated
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #28

35. Сообщение от Аноним (35), 02-Фев-22, 11:40   +/
При этом нормального аналога так и нет.
Кстати, у RIFF ноги ещё с Амиги растут.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29

36. Сообщение от adolfus (ok), 02-Фев-22, 23:38   +/
Цырк. В стародавние времена (1997???) в составе дистрибутива IBM OS/2 4.0 Merlin было приложение VoiceType. Оно не только "произносило" тексты, но и записывало их под диктовку. Правда, на английском, но отлично обучалось советскому произношению диктовавшего. И все это работало на первом пентиуме со ста двадцатью мегабайтами памяти.
Ответить | Правка | Наверх | Cообщить модератору

37. Сообщение от Анонимemail (37), 05-Фев-22, 19:10   +/
Можно поподробнее? Какие ограничения у opus?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32

38. Сообщение от Ууууу... (?), 07-Фев-22, 13:31   +/
Нет, не лучше. Он вносит кучу отсебятины в исходный сигнал, чтобы замаскировать искажения от потерь. На слух терпимо, а вот по приборам - сущий ад. Самый честный в этом плане в настоящий момент - AAC. Ну или LossyFlac/LossyWav.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру