Проект Google Euphonia: что это такое и как он может помочь людям с нетипичной речью - ОтзывыExpert.net

Содержание:

Anonim

Большинство людей ассоциируют Закон об американцах с ограниченными возможностями с физическими, инфраструктурными изменениями, которые необходимо внести в здания или другие объекты, но по мере того, как определение инвалидности расширяется, люди понимают, что «доступность» также применима к таким вещам, как веб-сайты и распознавание голоса.

В данном случае технологический гигант Google пытается улучшить свое программное обеспечение для распознавания голоса с помощью Project Euphonia. Проект Euphonia - это инициатива по записи образцов голоса добровольцев и их анализу, чтобы люди с БАС, неврологическими расстройствами и другими проблемами речи могли использовать свои интеллектуальные устройства с легкостью «типичного» человека.

Почему я вызвался

Парализованная левая голосовая связка и асимметричный язык из-за опухоли головного мозга привели к моей речевой болезни Дизартрия. Моя невнятная речь и слабый голос мешают друзьям и близким меня понять или услышать, особенно в людном месте. Это сделало меня главным кандидатом на участие в проекте «Евфония», поэтому я вызвался добровольцем, как только прочитал об этом. Записывая образцы на элементарном веб-сайте, я повторил 4500 фраз от «Как мне добраться до Маунтин-Вью, Калифорния?» До «Слушать песни Cardi B».

Помимо соответствия критериям проекта Euphonia, я вызвался добровольцем, потому что впервые познакомился с ведущей программой распознавания голоса Dragon Naturally Speaking в 1997 году - и она потерпела крах. На протяжении многих лет я пробовал аналогичные программы в лаборатории вспомогательных технологий Детской больницы Бостона, а также обновленные версии Дракон, и хотя это программное обеспечение добилось больших успехов, оно все еще пытается определить мой голос.

Это проблематично по двум причинам: я писатель с недостатком мелкой моторики, поэтому печатаю одной рукой или медленно двумя, если устал. С тремя самоизданными сборниками стихов, мемуарами и сборником неопубликованных рассказов, связанных с моим именем, я с содроганием думаю о том, сколько еще я мог бы произвести, если бы набор текста не был такой физически сложной задачей.

Другая причина, по которой распознавание голоса ниже номинала создает для меня барьер, - это распространение продуктов с поддержкой голоса в домах и на телефонах. Просто используя свою историю, если бы я мог получить доступ к компьютерам и интеллектуальным устройствам так, как они должны были использоваться, это дало бы мне больше свободного времени, позволило бы мне полностью выполнять задачи и потенциально изменить мой образ жизни.

Проект Евфония: как это работает?

Итак, как работает Euphonia? После загрузки прототипа приложения с персонализированной моделью распознавания речи на свой телефон, я поместил телефон рядом с ноутбуком и начал диктовать на нем; Делая это, я наблюдал, как все, что я сказал, появлялось в моем Документе Google на моем ноутбуке. Я делал это в течение нескольких месяцев, записывая фразы из романа, который писал, и исправлял любые неточности для Google с помощью приложения.

Спустя еще несколько месяцев без записи фраз я закончил первый черновик романа - 20 000 слов - с помощью приложения. Нельзя сказать, что он безупречный; каждый час, который я пишу, мне приходится возвращаться и час вносить незначительные исправления. Но я не возражаю, потому что Euphonia находится на стадии бета-тестирования, и вместо того, чтобы медленно набирать 100 слов в день, я генерирую 500 слов в день.

Кроме того, Евфония не была предназначена для обработки текстов - она ​​больше для декларативных команд - и мой стиль письма - это то, что они называют `` pantser '' (летать мимо ваших штанов), поэтому у меня много пауз потому что я не знаю, чем закончится предложение - ну, как Майкл Скотт. Однако когда я знаю, что хочу сказать, например, в текстах, электронных письмах или инструкциях своему помощнику, это, безусловно, самое точное распознавание речи, которое я когда-либо использовал.

Когда такие организации, как Google, дают право голоса инвалидам при проектировании архитектуры будущего, позволяя им оставаться самими собой, вместо того, чтобы пытаться преобразовать их во что-то «нормальное», это дает мне надежду на то, что в эпоху искусственного интеллекта преобладает гуманизм.

Если вы хотите посетить веб-сайт проекта Euphonia или у вас есть нарушение речи и вы хотите внести образец голоса, вы можете перейти по этой ссылке: https://sites.research.google/euphonia/about/