The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"анализ звуковых слов"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Программирование под UNIX (Языки программирования)
Изначальное сообщение [ Отслеживать ]

"анализ звуковых слов"  +/
Сообщение от Николай (??) on 16-Дек-11, 18:48 
Доброе время суток всем!
Очень бы хотелось узнать побольше по вопросу анализа звуковых слов...
есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова из файла,который формируется путём произношения в микрофон  в виде wav файла.
Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон ловит звук-создаётся файл wav этого произношения и как только в этом файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая через usb...
никто подобным не разбирался?
Очень было бы интересно узнать и обсудить многое по данной тематике.
Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "анализ звуковых слов"  +/
Сообщение от PavelR (ok) on 16-Дек-11, 20:51 
>[оверквотинг удален]
> Очень бы хотелось узнать побольше по вопросу анализа звуковых слов...
> есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова
> из файла,который формируется путём произношения в микрофон  в виде wav
> файла.
> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
> ловит звук-создаётся файл wav этого произношения и как только в этом
> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
> через usb...
> никто подобным не разбирался?
> Очень было бы интересно узнать и обсудить многое по данной тематике.

в общем-то к программированию под юникс это имеет весьма малое отношение.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 17-Дек-11, 16:09 
>[оверквотинг удален]
>> есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова
>> из файла,который формируется путём произношения в микрофон  в виде wav
>> файла.
>> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
>> ловит звук-создаётся файл wav этого произношения и как только в этом
>> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
>> через usb...
>> никто подобным не разбирался?
>> Очень было бы интересно узнать и обсудить многое по данной тематике.
> в общем-то к программированию под юникс это имеет весьма малое отношение.

не сглашусь..вот к примеру реализация под Unix
http://www.xakep.ru/magazine/xa/133/082/1.asp

Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "анализ звуковых слов"  +/
Сообщение от PavelR (ok) on 18-Дек-11, 00:30 
>[оверквотинг удален]
>>> файла.
>>> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
>>> ловит звук-создаётся файл wav этого произношения и как только в этом
>>> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
>>> через usb...
>>> никто подобным не разбирался?
>>> Очень было бы интересно узнать и обсудить многое по данной тематике.
>> в общем-то к программированию под юникс это имеет весьма малое отношение.
> не сглашусь..вот к примеру реализация под Unix
> http://www.xakep.ru/magazine/xa/133/082/1.asp

с чем "не соглашусь" ?

Работа по созданию "звуковой модели" и движка (festival) или работы по написанию анализатора голоса - не unix-специфичны.

В некотором роде юникс-специфичными будут задачи встраивания уже имеющегося движка, но - он уже должен быть имеющимся.

Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 19-Дек-11, 09:29 
>[оверквотинг удален]
>>>> никто подобным не разбирался?
>>>> Очень было бы интересно узнать и обсудить многое по данной тематике.
>>> в общем-то к программированию под юникс это имеет весьма малое отношение.
>> не сглашусь..вот к примеру реализация под Unix
>> http://www.xakep.ru/magazine/xa/133/082/1.asp
> с чем "не соглашусь" ?
> Работа по созданию "звуковой модели" и движка (festival) или работы по написанию
> анализатора голоса - не unix-специфичны.
> В некотором роде юникс-специфичными будут задачи встраивания уже имеющегося движка, но
> - он уже должен быть имеющимся.

Я имел ввиду может кто уже начинал дел по созданию своей собственно системы распознавания речи,которая работала бы в том числе и в Unix-системах..например аналог Сфинкса(Sphinx) или Julius, которые понимали бы русский язык и русскую речь...вот собственно весь и вопрос
...не столь важно на какой основе они работать будут..главное чтобы понимали русскую речь...просто хотелось бы чтобы эта система работала в Linuxe(более привычнее), но не обязательно конечно...
вопрос касается именно создания(написания) такого рода системы...чтобы эту систему можно было использовать в корпоративной сети без выхода в инет...
подобное реализовала google-команда(google speech recognition api)  и свой сервис дают пока пользоваться, но а что делать если нет выхода в инет?
хотелось бы об этом узнать побольше и реализовать.

Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

5. "анализ звуковых слов"  +1 +/
Сообщение от DeadLoco (ok) on 21-Дек-11, 05:30 
> хотелось бы об этом узнать побольше и реализовать.

Гуглить в сторону "фонемы" и "морфемы".

В общих чертах задача сводится к тому, чтобы в потоке вычленять характерные паттерны по спектру и огибающим, и транслировать их в буквосочетания. Вычленение паттернов сводится к ФФТ в скользящем окне + байесу.

Зд'лаить хъръш - ъзалатьитьсь.

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

6. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 21-Дек-11, 12:37 
>> хотелось бы об этом узнать побольше и реализовать.
> Гуглить в сторону "фонемы" и "морфемы".
> В общих чертах задача сводится к тому, чтобы в потоке вычленять характерные
> паттерны по спектру и огибающим, и транслировать их в буквосочетания. Вычленение
> паттернов сводится к ФФТ в скользящем окне + байесу.
> Зд'лаить хъръш - ъзалатьитьсь.

А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?
просто хотелось бы что-то за основу взять хотя бы...
хотелось бы поподробнее об этом обсудить.


Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

7. "анализ звуковых слов"  +/
Сообщение от DeadLoco (ok) on 22-Дек-11, 03:17 
> А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?

Есть отдельные разработки, которые отлавливают ключевые слова в речи, но все они плотненько засекречены. А то, что есть в цывильном быту - реагирует на пару-тройку слов, произносимых строго одинаково, ибо. Отдельное болото - русская фонетика.

Из всего, что в последнее время попадалось на глаза по теме - вот это наиболее адекватно:

http://www.youtube.com/watch?v=G2Y0oqZOyl0

Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

8. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 23-Дек-11, 03:44 
>> А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?
> Есть отдельные разработки, которые отлавливают ключевые слова в речи, но все они
> плотненько засекречены. А то, что есть в цывильном быту - реагирует
> на пару-тройку слов, произносимых строго одинаково, ибо. Отдельное болото - русская
> фонетика.
> Из всего, что в последнее время попадалось на глаза по теме -
> вот это наиболее адекватно:
> http://www.youtube.com/watch?v=G2Y0oqZOyl0

ролик как-то меньше всего заинтересовал)...мен\ больше сё же технический вопрос интересует-реализация так сказать...однако это и понятно,что есть и побочные эффекты...так сказать наличие акцентов...но в данном случае меня интересует просто нормально произносимые слова на традиционном русском языке без акцентов-единвенная разница-это произносят тект женщины и мужчины...но без какого-либо акцента...
не попадались какие-либо разработки в этой тематике или на базе которых можно попробовать реализовать?


Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

9. "анализ звуковых слов"  +/
Сообщение от DeadLoco (ok) on 23-Дек-11, 05:54 
> в данном случае меня интересует просто нормально произносимые слова на
> традиционном русском языке

Вы хотя бы отдаленно представляете себе, что такое "традиционный русский язык"?

Я совершенно не случайно написал выше "Зд'лаить хъръш - ъзалатьитьсь". Вы понимаете, что здесь написано? Вот так оно звучит. А записывается совершенно иначе. Русский язык в плане фонетики - это безнадега. Полная. Вернее - неполная. Неполногласная. Звуки русской речи глохнут, опускаются или вообще заменяются один на другой. Восприятие этой каши происходит мозгом совершенно неосознанно, точно так же, как неосознанно читается вот такой текст:

94НН03 С006Щ3НN3 П0К4ЗЫ8437, К4КN3 У9N8N73ЛЬНЫ3 83ЩN М0Ж37 93Л47Ь Н4Ш Р4ЗУМ! 8П3Ч47ЛЯЮЩN3 83ЩN! СН4Ч4Л4 Э70 6ЫЛ0 7РУ9Н0, Н0 С3ЙЧ4С Н4 Э70Й С7Р0К3 84Ш Р4ЗУМ ЧN7437 Э70 4870М47NЧ3СКN, Н3 З49УМЫ84ЯСЬ 06 Э70М.

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 25-Дек-11, 07:01 
>[оверквотинг удален]
> Вы хотя бы отдаленно представляете себе, что такое "традиционный русский язык"?
> Я совершенно не случайно написал выше "Зд'лаить хъръш - ъзалатьитьсь". Вы понимаете,
> что здесь написано? Вот так оно звучит. А записывается совершенно иначе.
> Русский язык в плане фонетики - это безнадега. Полная. Вернее -
> неполная. Неполногласная. Звуки русской речи глохнут, опускаются или вообще заменяются
> один на другой. Восприятие этой каши происходит мозгом совершенно неосознанно, точно
> так же, как неосознанно читается вот такой текст:
> 94НН03 С006Щ3НN3 П0К4ЗЫ8437, К4КN3 У9N8N73ЛЬНЫ3 83ЩN М0Ж37 93Л47Ь Н4Ш Р4ЗУМ! 8П3Ч47ЛЯЮЩN3
> 83ЩN! СН4Ч4Л4 Э70 6ЫЛ0 7РУ9Н0, Н0 С3ЙЧ4С Н4 Э70Й С7Р0К3 84Ш
> Р4ЗУМ ЧN7437 Э70 4870М47NЧ3СКN, Н3 З49УМЫ84ЯСЬ 06 Э70М.

Но я думаю не всё же так безнадёга!!!Ведь google как-то разрешил данную задачу....как-то обучил свою систему..и причём неплохо понимает русский язык кстати говоря....может как-то можно создать свою систему и как-то обучить её воспринимать голос дикторов(порядка 100 звуковых файлов wav), чтобы система способна была распознать что говорят именно эти дикторы...разница лишь в том,что дикторы имеются и женские и мужские!...есть какие идеи?

Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

11. "анализ звуковых слов"  +/
Сообщение от anonimouse on 27-Дек-11, 06:53 
> ...есть какие идеи?

А то! Дай гуглу денег за сорцы :)


Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

12. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 27-Дек-11, 07:18 
>> ...есть какие идеи?
> А то! Дай гуглу денег за сорцы :)

)))лучше социальная инженерия, чем монополисту оплачивать)

Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

13. "анализ звуковых слов"  +/
Сообщение от DeadLoco (ok) on 28-Дек-11, 21:05 
> )))лучше социальная инженерия, чем монополисту оплачивать)

Я так понимаю, под "социальной инженерией" понимается раскрутить кого-то решить вашу задачу на халяву?

Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

14. "анализ звуковых слов"  –1 +/
Сообщение от Николай (??) on 29-Дек-11, 02:59 
>> )))лучше социальная инженерия, чем монополисту оплачивать)
> Я так понимаю, под "социальной инженерией" понимается раскрутить кого-то решить вашу задачу
> на халяву?

Да не совсем так! Я имею ввиду под этим термином общедоступное с открытым кодом проект,который могут реализовать любой тех.образованный специалист ...естественно на добровольных началах и цель всего-прогресс в этой области, а не получение какой-либо выгоды...Лично я не ставлю для себя цель-получение какой-либо выгоды, а являюсь энтузиастом с целью самому разобраться в процессе реализации и довести это до любого желающего, который в свою очередь способен что-то дополнить своё и также поделиться своими достижениями в этой области...что в этом плохого?

Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору

15. "анализ звуковых слов"  +/
Сообщение от anonymous (??) on 04-Янв-12, 23:56 
> было использовать в корпоративной сети без выхода в инет...
> подобное реализовала google-команда(google speech recognition api)  и свой сервис дают

Если речь о корпоративной сети, то думаю бесплатность продукта необязательна:
http://www.speechpro.ru/product/recognition/platform/vn

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

16. "анализ звуковых слов"  +/
Сообщение от Николай (??) on 05-Янв-12, 09:30 
>> было использовать в корпоративной сети без выхода в инет...
>> подобное реализовала google-команда(google speech recognition api)  и свой сервис дают
> Если речь о корпоративной сети, то думаю бесплатность продукта необязательна:
> http://www.speechpro.ru/product/recognition/platform/vn

хм...интересная реализация...а может что есть подобное бесплатно и с открытым кодом?


Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

17. "анализ звуковых слов"  +/
Сообщение от Юрий (??) on 10-Янв-12, 12:47 
> хм...интересная реализация...а может что есть подобное бесплатно и с открытым кодvj;tn b

может и есть)))но я думаю врят ли кто поделится этой информацией))уж больно в России энтузиастов мало)))всё за деньги и только)))вот поэтому и прогресса нет)
а идея интересная, соглашусь)

Ответить | Правка | ^ к родителю #16 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру