Интуитивное управление машинами с помощью распознавания речи

Исследователи из Института цифровых медиатехнологий Фраунгофера IDMT в Ольденбурге разработали решение по распознаванию речи для использования в промышленном производстве.

Система надежно работает даже в шумной среде и может быть гибко адаптирована к потребностям пользователя. Сотрудники используют интуитивно понятные голосовые команды на производстве, что позволяет им держать обе руки свободными и работать гораздо эффективнее. На предварительном показе Hannover Messe 15 февраля 2023 года можно будет впервые ознакомиться с исследовательским проектом, включая практическую демонстрацию.

Ранее считалось, что использование машин с голосовым управлением в производстве чревато ошибками, и в результате эта практика практически не применялась. Теперь Фраунгофер IDMT в Ольденбурге разработал решение, которое позволяет надежно управлять станками с помощью голосовых команд.

Даже в шумном заводском цеху система распознавания речи работает надежно. Сотрудники говорят в беспроводную гарнитуру или стационарный микрофон, а в будущем они смогут использовать технологию «умного слуха», над разработкой которой также работает отделение института слуха, речи и аудиотехники HSA. Громкий окружающий шум почти полностью заглушается с помощью комбинации направленных микрофонов и эффективной системы шумоподавления.

Меньше ходьбы и свободные руки

Марвин Норда, руководитель проекта «Голосовое управление производством» в Fraunhofer IDMT, говорит: «Впервые наша технология позволяет людям управлять машинами на производстве с помощью голосовых команд надежным и интуитивно понятным способом. Для производственных компаний это означает повышение эффективности и снижение затрат».

Технология также имеет преимущества для сотрудников, поскольку бесконтактное управление машинами безопасно и гигиенично для людей. Когда сотрудники управляют несколькими машинами, это сокращает расстояние, которое им нужно пройти — они могут использовать мобильное устройство для подачи голосовых команд оборудованию на расстоянии.

У них свободны обе руки, что позволяет им установить заготовку в рабочую зону и одновременно дать роботу команду, например, «опустить руку» или «захватить заготовку».

Управление машиной с помощью голосовых команд более эффективно, чем с помощью панели управления или сенсорной панели — прохождение через вложенные структуры меню является громоздким и чреватым ошибками процессом, в то время как прямые голосовые команды включают простые инструкции.

«Технология распознавания речи может обрабатывать сотни отдельных команд в зависимости от приложения и не ограничивается определенным голосом. Новые или измененные команды могут быть быстро добавлены и обучены в системе», — добавляет г-н Норда.

Исследователи из Ольденбурга могут опираться на многолетний опыт и знания в области исследований и разработки аудиотехнологий и программного обеспечения для распознавания речи — то, что также приносит пользу более чем 50 компаниям — членам AiP (Audiotechnologie für die intelligente Produktion, аудиотехнологии для интеллектуального производства), промышленной рабочей группы, основанной Fraunhofer IDMT в Ольденбурге.

«Мы разрабатываем адаптируемые системные решения для промышленных клиентов. Система голосового управления может быть настроена в соответствии с их индивидуальными потребностями и быстро введена в эксплуатацию», — говорит г-н Норда. Программное обеспечение для распознавания речи может быть интегрировано в облако или на сервер компании, в зависимости от требований компании. Также можно встроить мини-ПК или даже интегрировать систему в программируемый логический контроллер (ПЛК) машины без каких-либо проблем».

Решение, спонсируемое Министерством науки и культуры Нижней Саксонии и Фондом Volkswagen, уже готово к выходу на рынок и уже тестируется некоторыми промышленными клиентами. Эксперты из Fraunhofer IDMT представят первый взгляд на проект специализированной аудитории на предварительной выставке Hannover Messe 15 февраля 2023 года. На выставке Hannover Messe с 17 по 21 апреля 2023 года посетители смогут ознакомиться с технологией и изучить ее возможности вживую на стенде Фраунгофера в павильоне 16, стенд A12. Демонстрации будут проводиться на фрезерном станке с голосовым управлением.

Исследователи из Института цифровых медиатехнологий Фраунгофера IDMT в Ольденбурге разработали решение по распознаванию речи для использования в промышленном производстве. Система надежно работает даже в шумной среде и может быть гибко адаптирована к потребностям пользователя. Сотрудники используют интуитивно понятные голосовые команды на производстве, что позволяет им держать обе руки свободными и работать гораздо эффективнее. На предварительном…