AcuEdge dev комплект опростява интеграцията на Amazon Alexa Voice Service

Microsemi AcuEdge™ Development Kit for Amazon Alexa AVS (Юли 2019).

$config[ads_text] not found
Anonim

Гласът е все по-важна опция за интерфейс между човек-машина (HMI) за устройства за пренос на данни и персонални цифрови помощници, но изисква експертиза в областта на акустичния хардуер и разработването на алгоритми за точни резултати и положителен опит за крайния потребител. За да опрости и ускори процеса на интегриране на гласовата услуга, Microsemi представи AcuEdge Development Kit за Amazon Alexa Voice Service (AVS).

"Гласът е пътят напред", каза Фархад Мафи, вицепрезидент на корпоративните комуникации и продуктов маркетинг в Microsemi. "Тя улеснява търсенето на информация, така че има по-голямо търсене на информация". Въпреки че това създава възможност на дизайнерите да разработват продукти от първа линия за IoT, индустриален интернет (IoT) и автоматизирана помощ, крайната интелигентност трябва да бъде по-интуитивна. "(Изкуствен интелект (AI)) може да направи това", каза Мафи.

Докато Amazon, Google, Apple, Microsoft, Nuance и други работят за по-интуитивен начин, Microsemi се фокусира върху това, че помага на разработчиците да получат точни гласови данни в системата и в облака, като се започне с AVS на Amazon.

Комплектът разполага с мултиметров аудио процесор на Microsemi ZL38063 Timberwolf, който има и два микрофона, които могат да работят както при режим на приемане на звук от 180˚, така и от 360˚ ( фигура 1 ). Бордът идва с Raspberry Pi конектор за бърза настройка и разработка, както и щанд и говорител, които бързо оценяват производителността.

Фигура 1: комплектът AcuEdge dev се базира на процесора Timberwolf на Microsemi и осигурява платформа за дизайнерите да разработват и внедряват Alexa Voice Services на всяко свързано устройство. (Източник на изображението: Microsemi Corporation)

Заедно с хардуера, Microsemi доставя своя опит в разпознаването на глас, който включва оценка на разликата между аудио за човешкото ухо и аудио за машини. "Когато погледнем назад, виждаме, че аудиото е било направено изключително приятно за човешкото ухо", каза Шахин Садеги, маркетингов директор в Microsemi. "Моторите за разпознаване на реч не са човешки уши: оформянето на аудио за ушите причинява поражения на детектора. Акустичното отменяне на ехо е напълно различно за Алекса. "

Microsemi прекъсва разпознаването на говор до автоматичното разпознаване на реч (ASR) и автоматичното разпознаване на реч (ASR Assist) ( фиг.2 ). ASR се отнася до способността на машината или програмата да приема и тълкува устни команди. ASR Assist се отнася до аудио подобрения за HMI - по-специално, задействане на разпознаване на думи, като "Hi, Alexa".

Фигура 2: Има два основни типа автоматична реч: ASR и ASR Assist. (Източник на изображението: Microsemi Corporation)

ASR Assist също включва "баржа в", което означава, че думите за задействане могат да бъдат открити, когато терминал с алармена сигнализация или аудиосистема са в режим на възпроизвеждане. Другите функции ASR Assist, които Microsemi предлага на масата с помощта на ASR Assist в комплекта AcuEdge (ZLK38AVS), включват комплект лъчи, микрофони за компресор / ограничител / разширител (CLE), намаляване на околния шум и възможности за микрофон. Обърнете внимание, че Raspberry Pi изпълнява клиент на Amazon AVS и Alexa събужда откриване на думи, докато Timberwolf изпълнява цялата аудио обработка отпред, за да осигури точност.

След като бъде внедрен, процесорът Timberwolf е програмиран за полета за актуализации на фърмуера. Наличен сега, AcuEdge струва $ 299.