Шумораи барномаҳо ва аҳамияти интерфейсҳои овозӣ босуръат меафзояд
технология

Шумораи барномаҳо ва аҳамияти интерфейсҳои овозӣ босуръат меафзояд

Як оилаи амрикоӣ дар Портленд, Орегон ба наздикӣ фаҳмид, ки ёвари овозии Алекс сӯҳбатҳои хусусии онҳоро сабт карда, ба дӯсташ фиристод. Соҳиби хона, ки аз ҷониби расонаҳо Даниел номида мешавад, ба хабарнигорон гуфт, ки вай "ҳеҷ гоҳ ин дастгоҳро дигар васл намекунад, зеро ба ӯ бовар кардан мумкин нест."

Дан, ки аз ҷониби баландгӯякҳои Echo (1) ва дигар гаҷетҳо дар даҳҳо миллион хонаҳои ИМА таъмин шудаанд, ҳангоми шунидани ном ё "калимаи занг" аз ҷониби корбар сабтро оғоз мекунад. Ин маънои онро дорад, ки ҳатто агар калимаи "Alexa" дар таблиғи телевизионӣ зикр шавад, дастгоҳ метавонад сабтро оғоз кунад. Маҳз ҳамин чиз дар ин ҳолат рӯй дод, мегӯяд Amazon, паҳнкунандаи сахтафзор.

"Қисми боқимондаи сӯҳбатро ёрдамчии овозӣ ҳамчун фармон барои ирсоли паём маънидод кард", - омадааст дар изҳороти ширкат. "Дар баъзе вақт, Alexa бо овози баланд пурсид: "Ба кӣ?" Идомаи сӯҳбати оилавӣ дар бораи фарши дарахти сахтро мошин бояд ҳамчун ашё дар рӯйхати тамоси муштарӣ қабул мекард." Ҳадди аққал он чизест, ки Amazon фикр мекунад. Ҳамин тариқ, тарҷума ба як қатор садамаҳо кам карда мешавад.

Бо вуҷуди ин, изтироб боқӣ мемонад. Зеро бо кадом сабабе, ки дар хонае, ки мо то ҳол худро ором ҳис мекардем, мо бояд ба як навъ "режими овоз" ворид шавем, бубинем, ки мо чӣ мегӯем, телевизион чӣ пахш мекунад ва албатта, ин сухангӯи нав дар сари синаи чевонхо мегуяд. мо.

бо вуҷуди ин Сарфи назар аз нокомилии технологӣ ва нигарониҳои махфият, бо афзоиши маъруфияти дастгоҳҳо ба монанди Amazon Echo, одамон ба идеяи муошират бо компютерҳо бо истифода аз овози худ одат мекунанд..

Тавре Вернер Фогелс, директори Амазонка, дар ҷаласаи AWS re:Invent дар охири соли 2017 қайд кард, технология то ҳол қобилияти моро дар ҳамкорӣ бо компютерҳо маҳдуд кардааст. Мо калимаҳои калидиро дар Google бо истифода аз клавиатура ворид мекунем, зеро ин ҳоло ҳам маъмултарин ва осонтарин роҳи ворид кардани маълумот ба мошин аст.

Фогельс гуфт. -

чор калон

Ҳангоми истифода аз системаи ҷустуҷӯии Google дар телефон, мо шояд кайҳо пеш аломати микрофонро бо занги гуфтугӯ мушоҳида кардаем. Ин Google ҳоло (2), ки метавонад барои дикта кардани дархости ҷустуҷӯ, ворид кардани паём тавассути овоз ва ғайра истифода шавад. Дар солҳои охир, Google, Apple ва Amazon хеле беҳтар шуданд. технологияи шинохтани овоз. Ёрдамчиёни овозӣ ба монанди Alexa, Siri ва Google Assistant на танҳо овози шуморо сабт мекунанд, балки он чизеро, ки шумо ба онҳо мегӯед, мефаҳманд ва ба саволҳо ҷавоб медиҳанд.

Google Now барои ҳама корбарони Android ройгон дастрас аст. Барнома метавонад, масалан, ҳушдор насб кунад, пешгӯии обу ҳаворо тафтиш кунад ва масирро дар харитаҳои Google тафтиш кунад. Тавсеаи гуфтугӯии Google Now штатҳо Google Assistant () – ёрии виртуалӣ ба истифодабарандаи таҷҳизот. Он асосан дар дастгоҳҳои мобилӣ ва интеллектуалии хона дастрас аст. Баръакси Google Now, он метавонад дар мубодилаи дуҷониба иштирок кунад. Ёрдамчӣ моҳи майи соли 2016 ҳамчун як қисми замимаи паёмнависии Google Allo ва инчунин дар баландгӯяки овозии Google Home (3) баромад кард.

3. Google Home

Системаи IOS инчунин ёвари виртуалии худро дорад, Siri, ки барномаест, ки ба системаҳои оператсионии Apple iOS, watchOS, tvOS homepod ва macOS дохил карда шудааст. Siri бо iOS 5 ва iPhone 4s моҳи октябри соли 2011 дар конфронси "Let's Talk iPhone" баромад кард.

Нармафзор ба интерфейси гуфтугӯӣ асос ёфтааст: он нутқи табиии корбарро эътироф мекунад (бо iOS 11 инчунин имкони ворид кардани фармонҳоро дастӣ кардан мумкин аст), ба саволҳо ҷавоб медиҳад ва супоришҳоро иҷро мекунад. Ба туфайли чорй намудани омузиши мошинй, ёрдамчии бо мурури замон афзалиятхои шахсиро тахлил мекунад истифодабаранда барои пешниҳоди натиҷаҳо ва тавсияҳои бештар мувофиқ. Siri пайвастагии доимии Интернетро талаб мекунад - манбаи асосии иттилоот дар ин ҷо Bing ва Wolfram Alpha мебошанд. iOS 10 дастгирии васеъшавии тарафи сеюмро ҷорӣ кард.

Боз як аз чор калон Кортана. Ин як ёвари шахсии соҳибақл аст, ки аз ҷониби Microsoft сохта шудааст. Он дар платформаҳои Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, Android ва iOS дастгирӣ мешавад. Кортана бори аввал дар конфронси таҳиягарони Microsoft Build моҳи апрели соли 2014 дар Сан-Франсиско муаррифӣ карда шуд. Номи барнома аз номи аломати силсилаи бозии Halo бармеояд. Cortana бо забонҳои англисӣ, итолиёвӣ, испанӣ, фаронсавӣ, олмонӣ, чинӣ ва ҷопонӣ дастрас аст.

Истифодабарандагони барномаи аллакай зикршуда Дан онҳо инчунин бояд маҳдудиятҳои забонро баррасӣ кунанд - ёрдамчии рақамӣ танҳо бо забони англисӣ, олмонӣ, фаронсавӣ ва японӣ ҳарф мезанад.

Amazon Virtual Assistant бори аввал дар баландгӯякҳои интеллектуалии Amazon Echo ва Amazon Echo Dot, ки Amazon Lab126 таҳия кардааст, истифода шудааст. Он ба муоширати овозӣ, бозидани мусиқӣ, эҷоди рӯйхати вазифаҳо, танзими ҳушдор, ҷараёни подкаст, бозидани китобҳои аудиоӣ ва обу ҳаво дар вақти воқеӣ, трафик, варзиш ва дигар иттилооти ахбор, аз қабили ахбор (4) имкон медиҳад. Alexa метавонад якчанд дастгоҳҳои интеллектуалиро идора кунад, то системаи автоматикунонии хонаро эҷод кунад. Он инчунин метавонад барои хариди қулай дар мағозаи Амазонка истифода шавад.

4. Истифодабарандагон Эхо-ро барои чӣ истифода мебаранд (тибқи тадқиқот)

Истифодабарандагон метавонанд таҷрибаи Alexa-ро тавассути насб кардани "маҳоратҳои" Alexa (), хусусиятҳои иловагии аз ҷониби шахсони сеюм таҳияшуда, ки маъмулан ҳамчун барномаҳо ба монанди обу ҳаво ва барномаҳои аудио дар танзимоти дигар номида мешаванд, такмил диҳанд. Аксари дастгоҳҳои Alexa ба шумо имкон медиҳанд, ки ёвари виртуалии худро бо пароли бедоршаванда фаъол созед, ки ном дорад .

Имрӯз, Amazon бешубҳа дар бозори баландгӯякҳои интеллектуалӣ бартарӣ дорад (5). IBM, ки дар моҳи марти соли 2018 хидмати навро муаррифӣ кард, кӯшиш мекунад, ки ба чаҳоргонаи беҳтарин ворид шавад ёрдамчии Уотсон, барои ширкатҳое тарҳрезӣ шудааст, ки мехоҳанд системаҳои ёварони виртуалии худро бо назорати овоз эҷод кунанд. Бартарии ҳалли IBM чист? Ба гуфтаи намояндагони ширкат, пеш аз ҳама, дар бораи имконоти бештари фардӣсозӣ ва ҳифзи дахолатнопазирӣ.

Аввалан, Watson Assistant тамға надорад. Ширкатҳо метавонанд дар ин платформа қарорҳои худро эҷод кунанд ва онҳоро бо бренди худ нишон диҳанд.

Дуюм, онҳо метавонанд бо истифода аз маҷмӯи додаҳои худ системаҳои ёрирасони худро омӯзонанд, ки ба гуфтаи IBM, илова кардани хусусиятҳо ва фармонҳоро ба он система нисбат ба дигар технологияҳои VUI (интерфейси корбари овозӣ) осонтар мекунад.

Сеюм, Watson Assistant ба IBM дар бораи фаъолияти корбар маълумот намедиҳад - таҳиягарони қарорҳо дар платформа танҳо маълумоти арзишмандро дар худ нигоҳ дошта метавонанд. Дар ҳамин ҳол, ҳар касе, ки дастгоҳ месозад, масалан бо Alexa, бояд бидонад, ки маълумоти арзишманди онҳо дар Амазонка ба охир мерасад.

Watson Assistant аллакай якчанд татбиқ дорад. Система, масалан, аз ҷониби Harman истифода шудааст, ки як ёвари овозиро барои мошини консепсияи Maserati офаридааст (6). Дар фурудгоҳи Мюнхен як ёвари IBM роботи Pepperро қудрат медиҳад, то ба мусофирон ҳаракат кунад. Мисоли сеюм Chameleon Technologies мебошад, ки дар он технологияи овозӣ дар ҳисобкунаки хонагии интеллектуалӣ истифода мешавад.

6. Ёвари Ватсон дар мошини консепсияи Maserati

Бояд илова кард, ки технологияи асосии ин ҷо низ нав нест. Watson Assistant дорои қобилиятҳои рамзгузорӣ барои маҳсулоти мавҷудаи IBM, Watson Conversation ва Watson Virtual Agent, инчунин APIҳо барои таҳлили забон ва сӯҳбат мебошад.

Амазонка на танҳо пешвои технологияи овозии интеллектуалӣ аст, балки онро ба тиҷорати мустақим табдил медиҳад. Бо вуҷуди ин, баъзе ширкатҳо бо ҳамгироии Echo хеле пештар озмоиш кардаанд. Sisense, як ширкат дар соҳаи BI ва таҳлил, ҳамгироии Echo-ро дар моҳи июли соли 2016 муаррифӣ кард. Дар навбати худ, Roxy стартап тасмим гирифт, ки нармафзор ва сахтафзори бо овози идорашавандаи худро барои саноати меҳмондорӣ эҷод кунад. Аввали соли ҷорӣ, Synqq як барномаи сабти ёддоштро муаррифӣ кард, ки коркарди овоз ва забони табииро барои илова кардани қайдҳо ва сабтҳои тақвимӣ бидуни чоп кардани онҳо дар клавиатура истифода мебарад.

Хамаи ин корхонахои хурд орзую умеди калон доранд. Аммо, аз ҳама бештар, онҳо фаҳмиданд, ки на ҳар корбар намехоҳад маълумоти худро ба Amazon, Google, Apple ё Microsoft интиқол диҳад, ки муҳимтарин бозигарони бунёди платформаҳои иртиботи овозӣ мебошанд.

Амрикоиҳо харидан мехоҳанд

Дар соли 2016, ҷустуҷӯи овозӣ 20% тамоми ҷустуҷӯҳои мобилии Google-ро ташкил дод. Одамоне, ки ин технологияро ҳамарӯза истифода мебаранд, бароҳатӣ ва бисёр вазифаҳои онро аз бузургтарин бартариҳои он медонанд. (масалан, қобилияти истифодаи системаи ҷустуҷӯӣ ҳангоми рондани мошин).

Таҳлилгарони Visiongain арзиши бозории ассистентҳои рақамии интеллектуалиро 1,138 миллиард доллар арзёбӣ мекунанд.Ин гуна механизмҳо торафт зиёданд. Мувофиқи маълумоти Gartner, то охири соли 2018 аллакай 30% муоширати мо бо технология тавассути гуфтугӯҳо бо системаҳои овозӣ хоҳад буд.

Ширкати пажӯҳишии бритониёии IHS Markit тахмин мезанад, ки бозори ассистентҳои рақамӣ бо сунъӣ то охири соли ҷорӣ ба 4 миллиард дастгоҳ мерасад ва ин рақам то соли 2020 метавонад ба 7 миллиард афзоиш ёбад.

Тибқи гузоришҳои eMarketer ва VoiceLabs, дар соли 2017 35,6 миллион амрикоиҳо ҳадди аққал як маротиба дар як моҳ аз назорати овоз истифода кардаанд. Ин назар ба соли гузашта кариб 130 фоиз зиёд аст. Интизор меравад, ки танҳо бозори ёрирасони рақамӣ дар 2018% афзоиш ёбад. Ин маънои онро дорад, ки шумо аллакай онҳоро истифода мебаред. 60,5 миллион америкоиён, ки дар натичаи ин барои истехсолкунандагони онхо пули конкретй мегардад. RBC Capital Markets тахмин мезанад, ки интерфейси Alexa то соли 2020 барои Amazon то 10 миллиард доллар даромад меорад.

Шустан, пухтан, тоза!

Интерфейсҳои овозӣ торафт далерона ба техникаи маишӣ ва бозорҳои электроникаи маишӣ ворид мешаванд. Инро аллакай дар намоишгоҳи соли гузаштаи IFA 2017 дидан мумкин буд.Ширкати амрикоии Neato Robotics, масалан, роботи чангкашакеро муаррифӣ кард, ки ба яке аз якчанд платформаҳои хонагии интеллектуалӣ, аз ҷумла системаи Amazon Echo пайваст мешавад. Бо сӯҳбат бо баландгӯяки интеллектуалии Echo, шумо метавонед ба мошин дастур диҳед, ки тамоми хонаи шуморо дар вақтҳои муайяни рӯз ё шаб тоза кунад.

Дар намоишгоҳ маҳсулоти дигари бо овоз фаъолшуда аз телевизорҳои интеллектуалӣ таҳти бренди Toshiba, ки ширкати туркӣ Vestel фурӯхтааст, то кӯрпаҳои тафсон аз ширкати олмонии Beurer ба намоиш гузошта шуданд. Бисёре аз ин дастгоҳҳои электрониро метавон аз фосилаи дур бо истифода аз смартфонҳо фаъол кард.

Аммо, ба гуфтаи намояндагони Bosch, ҳоло гуфтан барвақт аст, ки кадоме аз ассистенти хонагӣ бартарӣ хоҳад дошт. Дар IFA 2017 як гурӯҳи техникии олмонӣ мошинҳои ҷомашӯӣ (7), танӯрҳо ва қаҳвамошинҳоеро намоиш дод, ки ба Эхо пайваст мешаванд. Bosch инчунин мехоҳад, ки дастгоҳҳои он дар оянда бо платформаҳои овозии Google ва Apple мувофиқ бошанд.

7. Мошини ҷомашӯии Bosch, ки ба Amazon Echo пайваст мешавад

Ширкатҳо ба монанди Fujitsu, Sony ва Panasonic ҳалли худро дар асоси ёрирасони овозӣ таҳия мекунанд. Sharp ин технологияро ба печҳо ва роботҳои хурде, ки ба бозор ворид мешаванд, илова мекунад. Nippon Telegraph & Telephone барои мутобиқ кардани системаи зеҳни сунъии бо овоз идорашаванда таҷҳизот ва бозичасозонро киро мекунад.

Консепсияи кӯҳна. Оё ниҳоят вақти вай расидааст?

Дарвоқеъ, консепсияи интерфейси корбари овозӣ (VUI) даҳсолаҳост. Ҳар касе, ки солҳои пеш аз ин филми Star Trek ё 2001: A Space Odyssey-ро тамошо карда буд, эҳтимол интизор буд, ки тақрибан дар соли 2000 мо ҳама компютерҳоро бо садои худ идора мекунем. Инчунин, на танҳо нависандагони фантастикаи илмӣ потенсиали ин намуди интерфейсро диданд. Дар соли 1986, муҳаққиқони Nielsen аз мутахассисони IT пурсиданд, ки ба фикри онҳо то соли 2000 бузургтарин тағирот дар интерфейси корбарон чӣ хоҳад буд. Онҳо аксар вақт ба рушди интерфейсҳои овозӣ ишора карданд.

Барои умед ба ин гуна халли масъала сабабхо мавчуданд. Муоширати шифоҳӣ, дар ниҳоят, роҳи табиитаринест, ки одамон ба таври огоҳона мубодилаи афкор мекунанд, аз ин рӯ истифодаи он барои ҳамкории инсон ва мошин то ҳол беҳтарин роҳи ҳалли он ба назар мерасад.

Яке аз аввалин VUI, ном дорад қуттии пойафзол, дар ибтидои солҳои 60-ум аз ҷониби IBM сохта шудааст. Он пешвои системаҳои шинохтани овози имрӯза буд. Аммо, рушди дастгоҳҳои VUI бо маҳдудиятҳои қудрати ҳисоббарорӣ маҳдуд буд. Таҳлил ва тафсири сухани инсон дар вақти воқеӣ заҳмати зиёдро талаб мекунад ва барои расидан ба он ҷое, ки воқеан имконпазир шуд, беш аз панҷоҳ сол лозим шуд.

Дастгоҳҳо бо интерфейси овозӣ дар миёнаҳои солҳои 90-ум дар истеҳсоли оммавӣ пайдо шуданд, аммо маъруфият пайдо накарданд. Аввалин телефон бо идоракунии овозӣ (рақамзанӣ) буд Philips Sparkсоли 1996 бароварда шудааст. Бо вуҷуди ин, ин дастгоҳи навовар ва осон барои истифода аз маҳдудиятҳои технологӣ холӣ набуд.

Телефонҳои дигаре, ки бо шаклҳои интерфейси овозӣ муҷаҳҳаз шудаанд (аз ҷониби ширкатҳои ба монанди RIM, Samsung ё Motorola сохта шудаанд) мунтазам ба бозор мебароянд, ки ба корбарон имкон медиҳанд, ки тавассути овоз занг зананд ё паёмҳои матнӣ фиристанд. Аммо хамаи онхо аз ёд кардани фармонхои мушаххас ва ба шакли мачбурй, сунъй, ки ба имкониятхои дастгоххои он замон мувофик карда шудаанд, талаффуз карданро талаб мекарданд. Ин шумораи зиёди хатогиҳоро ба вуҷуд овард, ки дар навбати худ боиси норозигии корбарон гардид.

Бо вуҷуди ин, мо ҳоло ба давраи нави ҳисоббарорӣ ворид шуда истодаем, ки дар он пешрафтҳо дар омӯзиши мошинсозӣ ва зеҳни сунъӣ потенсиали гуфтугӯро ҳамчун роҳи нави ҳамкорӣ бо технология боз мекунанд (8). Шумораи дастгоҳҳое, ки ҳамкории овозиро дастгирӣ мекунанд, омили муҳиме гардид, ки ба рушди VUI таъсири калон расонидааст. Имрӯз, қариб 1/3 аҳолии ҷаҳон аллакай смартфонҳое доранд, ки метавонанд барои ин намуди рафтор истифода шаванд. Чунин ба назар мерасад, ки аксари корбарон ниҳоят омодаанд интерфейсҳои овозии худро мутобиқ кунанд.

8. Таърихи муосири инкишофи интерфейси овозӣ

Бо вуҷуди ин, пеш аз он ки мо бо компютер озодона сӯҳбат кунем, мо бояд як қатор мушкилотро бартараф кунем. Мошинҳо дар коркарди нозукиҳои забонӣ ҳанӯз чандон хуб нестанд. Гайр аз ин бисёр одамон то ҳол худро нороҳат ҳис мекунанд, ки ба системаи ҷустуҷӯӣ фармонҳои овозӣ медиҳанд.

Омор нишон медиҳад, ки ёрдамчиёни овозӣ асосан дар хона ё дар байни дӯстони наздик истифода мешаванд. Ҳеҷ кадоме аз пурсидашудагон эътироф накардааст, ки ҷустуҷӯи овозиро дар ҷойҳои ҷамъиятӣ истифода барад. Аммо, эҳтимол дорад, ки ин муҳосира бо паҳн шудани ин технология аз байн равад.

саволи аз чихати техникй душвор

Мушкилоте, ки системаҳо (ASR) дучор мешаванд, аз сигнали нутқӣ истихроҷи маълумоти муфид ва пайваст кардани он бо калимаи муайяне мебошад, ки барои шахс маънои муайян дорад. Овозҳои тавлидшуда ҳар дафъа гуногунанд.

Тағйирёбии сигнали нутқ моликияти табиии он аст, ки ба шарофати он мо, масалан, акцент ё интонацияро эътироф мекунем. Ҳар як унсури системаи шинохти нутқ вазифаи мушаххас дорад. Дар асоси сигнали коркардшуда ва параметрҳои он модели акустикӣ сохта мешавад, ки бо модели забонӣ алоқаманд аст. Системаи шинохтан метавонад дар асоси миқдори кам ё зиёди қолабҳо кор кунад, ки андозаи луғатро, ки бо он кор мекунад, муайян мекунад. Онҳо метавонанд луғатҳои хурд дар сурати системаҳое, ки калимаҳо ё фармонҳои алоҳидаро эътироф мекунанд ва базахои калон дорои муодили маҷмӯи забонҳо ва бо назардошти модели забон (грамматика).

Мушкилоте, ки бо интерфейсҳои овозӣ дар ҷои аввал дучор мешаванд нуткро дуруст фахманд, ки дар онхо, масалан, тамоми пай-даромадхои грамматикй аксар вакт хатто холй карда мешаванд, ба хатохои забонй ва фонетикй, хатохо, нуксонхо, нуксонхои нутк, омонимхо, такрори беасос ва гайра дучор мешаванд Хамаи ин системахои ХКИШ бояд зуд ва боэътимод кор кунанд. Ҳадди аққал ин интизориҳост.

Сарчашмаи мушкилот низ сигналҳои акустикӣ ба ғайр аз нутқи эътирофшуда мебошанд, ки ба вуруди системаи шинохт ворид мешаванд, яъне. ҳама намудҳо дахолат ва садо. Дар соддатарин ҳолат, шумо ба онҳо ниёз доред филтр кунед. Ин вазифа ба назар муқаррарӣ ва осон аст - охир, сигналҳои гуногун филтр карда мешаванд ва ҳар як инженери электроника медонад, ки дар чунин вазъият чӣ кор кунад. Аммо, ин бояд хеле бодиққат ва бодиққат анҷом дода шавад, агар натиҷаи шинохти нутқ ба интизориҳои мо мувофиқ бошад.

Филтркунии дар айни замон истифодашаванда имкон медиҳад, ки дар баробари сигнали нутқ, садои берунии тавассути микрофон гирифташуда ва хосиятҳои дохилии худи сигнали нутқ, ки эътирофи онро душвор мегардонад, бартараф карда шавад. Аммо, вақте ки дахолат ба сигнали нутқи таҳлилшуда ... сигнали дигари нутқ, яъне, масалан, баҳсҳои баланд дар атрофи он аст, мушкилоти техникӣ хеле мураккабтар ба миён меояд. Ин савол дар адабиёт бо номи . Ин аллакай истифода бурдани усулхои мураккаби ба номро талаб мекунад. деконволютсия (кушода кардан) сигнал.

Мушкилоти шинохти нутқ бо ин тамом намешавад. Бояд фаҳмид, ки нутқ дорои намудҳои гуногуни иттилоот мебошад. Овози инсон ҷинс, синну сол, хислатҳои гуногуни соҳиб ё вазъи саломатии ӯро нишон медиҳад. Дар ин ҷо як шӯъбаи васеи муҳандисии биотиббӣ мавҷуд аст, ки бо ташхиси бемориҳои гуногун дар асоси зуҳуроти хоси акустикӣ, ки дар сигнали нутқ пайдо мешаванд, машғул аст.

Инчунин барномаҳое ҳастанд, ки ҳадафи асосии таҳлили акустикии сигнали нутқ муайян кардани сухангӯ ё тасдиқи он аст, ки ӯ кӣ будани худро дорад (ба ҷои калид, парол ё рамзи PUK овоз). Ин метавонад муҳим бошад, махсусан барои технологияҳои сохтмони интеллектуалӣ.

Ҷузъи якуми системаи шинохти нутқ ин аст микрофон. Аммо, сигнале, ки микрофон мегирад, одатан каме истифода мешавад. Тадкикхо нишон медиханд, ки шакл ва чараёни мавчи садо вобаста ба шахс, суръати нутк ва кисман табъи хамсухбат хеле фарк мекунад — дар холе ки онхо то андозае худи мазмуни фармонхои гуфтаро инъикос мекунанд.

Бинобар ин, сигнал бояд дуруст коркард карда шавад. Акустика, фонетика ва информатикаи муосир якҷоя маҷмӯи ғании асбобҳоро фароҳам меоранд, ки метавонанд барои коркард, таҳлил, шинохтан ва фаҳмидани сигнали нутқ истифода шаванд. Спектри динамикии сигнал, ба ном спектрограммаҳои динамикӣ. Ба даст овардани онҳо хеле осон аст ва нутқе, ки дар шакли спектрограммаи динамикӣ пешниҳод шудааст, бо истифода аз усулҳои шабеҳ ба усулҳои шинохти тасвир истифодашаванда нисбатан осон аст.

Унсурҳои оддии нутқро (масалан, фармонҳо) аз рӯи шабоҳати оддии тамоми спектрограммаҳо шинохтан мумкин аст. Масалан, луғати телефони мобилии бо овоз фаъолшуда ҳамагӣ аз чанд даҳ то чандсад калима ва ибораҳоро дар бар мегирад, ки одатан пешакӣ ҷамъ карда шудаанд, то онҳоро ба осонӣ ва муассир муайян кунанд. Ин барои вазифаҳои оддии назорат кифоя аст, аммо он барномаи умумиро ба таври ҷиддӣ маҳдуд мекунад. Системаҳои мувофиқи нақша сохташуда, чун қоида, танҳо баландгӯякҳои мушаххасро дастгирӣ мекунанд, ки барои онҳо овозҳо махсус таълим дода шудаанд. Пас, агар касе нав бошад, ки мехоҳад овози худро барои идоракунии система истифода барад, онҳо эҳтимол қабул карда намешаванд.

Натиҷаи ин амалиёт номида мешавад 2-Вт спектрограмма, яъне спектри дучанд. Дар ин блок боз як фаъолияти дигар вуҷуд дорад, ки ба он таваҷҷӯҳ кардан лозим аст - сегментатсия. Умуман, мо дар бораи ба қисмҳо ҷудо кардани сигнали нутқи давомдор, ки онҳоро алоҳида эътироф кардан мумкин аст, сухан меронем. Фақат аз ин ташхисҳои инфиродӣ эътирофи кулли сурат мегирад. Ин тартиб зарур аст, зеро дар як лаҳза сухани дароз ва мураккабро муайян кардан имконнопазир аст. Дар бораи он ки дар сигнали нутқ кадом қисмҳоро ҷудо кардан лозим аст, аллакай ҷилдҳои пурра навишта шудаанд, аз ин рӯ мо ҳоло қарор намедиҳем, ки сегментҳои фарқкунанда бояд фонема (эквивалентҳои садо), ҳиҷо ё шояд аллофон бошанд.

Раванди шинохти автоматӣ ҳамеша ба баъзе хусусиятҳои объектҳо дахл дорад. Барои сигнали нутқ садҳо маҷмӯи параметрҳои гуногун санҷида шудаанд Сигналҳои нутқӣ доранд ба чаҳорчӯбаи эътирофшуда тақсим карда мешавад ва доштани хусусиятҳои интихобшудаки тавассути он ин чаҳорчӯбаҳо дар раванди шинохтан пешниҳод карда мешаванд, мо метавонем иҷро кунем (барои ҳар як чаҳорчӯба алоҳида) таснифот, яъне. таъин кардани идентификатор ба чаҳорчӯба, ки дар оянда онро муаррифӣ мекунад.

Марҳилаи навбатӣ ҷамъ кардани чаҳорчӯба ба калимаҳои алоҳида - аксар вақт ба ном асос ёфтааст. модели моделҳои номуайян Марков (HMM-). Баъд монтажи калимахо меояд ҷумлаҳои комил.

Ҳоло мо метавонем як лаҳза ба системаи Alexa баргардем. Дар мисоли у процесси бисьёрмар-хилаи «фахми» мошини одам нишон дода шудааст — аниктараш: фармони у ё саволе.

Фаҳмидани калимаҳо, фаҳмидани маъно ва фаҳмидани нияти корбар чизҳои тамоман дигаранд.

Аз ин рӯ, қадами оянда кори модули NLP (), ки вазифаи он аст эътирофи нияти корбар, яъне. маънои фармон/савол дар заминае, ки дар он гуфта шудааст. Агар ният муайян карда шавад, пас таъини ба ном махорату махорат, яъне хусусияти мушаххасе, ки аз ҷониби ёрдамчии интеллектуалӣ дастгирӣ мешавад. Дар мавриди савол дар бораи обу ҳаво, манбаъҳои маълумот дар бораи обу ҳаво даъват карда мешаванд, ки бояд дар нутқ коркард карда шаванд (TTS - механизм). Дар натиҷа, корбар ҷавоби саволи додашударо мешунавад.

Овоз? Санъати графикӣ? Ё шояд ҳарду?

Аксари системаҳои мутақобилаи муосири маъруф ба миёнараве, ки ном дорад, асос ёфтааст интерфейси графикии корбар (интерфейси графикӣ). Мутаассифона, GUI роҳи равшантарини муомила бо маҳсулоти рақамӣ нест. Ин талаб мекунад, ки корбарон аввал тарзи истифодаи интерфейсро омӯзанд ва ин маълумотро бо ҳар як амали минбаъда дар хотир нигоҳ доранд. Дар бисёр ҳолатҳо, овоз хеле қулайтар аст, зеро шумо метавонед бо VUI танҳо тавассути гуфтугӯ бо дастгоҳ муошират кунед. Интерфейс, ки корбаронро маҷбур намекунад, ки баъзе фармонҳо ё усулҳои муоширатро дар хотир дошта бошанд ва ба ёд оранд.

Албатта, тавсеаи VUI маънои даст кашидан аз интерфейсҳои анъанавии бештарро надорад - балки интерфейсҳои гибридӣ дастрас хоҳанд шуд, ки якчанд роҳҳои мутақобиларо муттаҳид мекунанд.

Интерфейси овозӣ барои ҳама вазифаҳо дар заминаи мобилӣ мувофиқ нест. Бо он, мо ба дӯсте, ки мошин меронад, занг мезанем ва ҳатто ба ӯ SMS мефиристем, аммо тафтиши интиқолҳои охирин метавонад хеле душвор бошад - аз сабаби миқдори иттилооте, ки ба система () интиқол дода мешавад ва аз ҷониби система (система) тавлид мешавад. Тавре Рейчел Ҳинман дар китоби худ Mobile Frontier пешниҳод мекунад, истифодаи VUI ҳангоми иҷрои вазифаҳое, ки миқдори иттилооти воридотӣ ва баромад кам аст, самараноктар мешавад.

Смартфоне, ки ба интернет пайваст аст, қулай аст, аммо нороҳат аст (9). Ҳар дафъае, ки корбар мехоҳад чизе бихарад ё хидмати навро истифода барад, онҳо бояд барномаи дигарро зеркашӣ кунанд ва ҳисоби нав эҷод кунанд. Дар ин ҷо майдон барои истифода ва рушди интерфейсҳои овозӣ таъсис дода шудааст. Ба ҷои маҷбур кардани корбарон барои насб кардани барномаҳои гуногун ё эҷод кардани ҳисобҳои алоҳида барои ҳар як хидмат, коршиносон мегӯянд, ки VUI бори ин вазифаҳои душворро ба як ёрдамчии овозии сунъӣ интиқол медиҳад. Барои ӯ машқ кардани корҳои вазнин қулай хоҳад буд. Мо ба ӯ танҳо фармон медиҳем.

9. Интерфейси овозӣ тавассути телефони интеллектуалӣ

Имрӯз, на танҳо як телефон ва компютер ба Интернет пайвастанд. Термостатҳои интеллектуалӣ, чароғҳо, чойникҳо ва бисёр дигар дастгоҳҳои ҳамгирошудаи IoT низ ба шабака пайваст шудаанд (10). Ҳамин тариқ, дар атрофи мо дастгоҳҳои бесим мавҷуданд, ки ҳаёти моро пур мекунанд, аммо на ҳамаашон табиатан ба интерфейси графикии корбар мувофиқат мекунанд. Истифодаи VUI ба шумо кӯмак мекунад, ки онҳоро ба муҳити мо ба осонӣ ворид кунед.

10. Интерфейси овозӣ бо Интернети ашё

Эҷоди интерфейси корбари овозӣ ба зудӣ як маҳорати калидии тарроҳон мегардад. Ин як мушкилоти воқеӣ аст - зарурати татбиқи системаҳои овозӣ шуморо водор мекунад, ки бештар ба тарҳрезии проактивӣ таваҷҷӯҳ кунед, яъне кӯшиши фаҳмидани ниятҳои ибтидоии корбар, пешбинии ниёзҳо ва интизориҳои онҳо дар ҳар як марҳилаи сӯҳбат.

Овоз як роҳи самараноки ворид кардани маълумот аст - он ба корбарон имкон медиҳад, ки бо шартҳои худ ба система зуд фармон диҳанд. Аз тарафи дигар, экран роҳи самарабахши намоиши иттилоотро фароҳам меорад: он ба системаҳо имкон медиҳад, ки дар як вақт миқдори зиёди информатсияро намоиш дода, бори хотираи истифодабарандагонро кам кунад. Мантиқан он аст, ки дар як система муттаҳид кардани онҳо рӯҳбаландкунанда аст.

Баландгӯякҳои интеллектуалӣ ба монанди Amazon Echo ва Google Home умуман намоиши визуалӣ пешниҳод намекунанд. Аниқии шинохти овозро дар масофаҳои мӯътадил ба таври назаррас беҳтар карда, онҳо имкон медиҳанд, ки кори дасти озод дошта бошанд, ки дар навбати худ чандирӣ ва самаранокии онҳоро зиёд мекунад - онҳо ҳатто барои корбароне, ки аллакай смартфонҳои дорои назорати овоз доранд, матлубанд. Бо вуҷуди ин, набудани экран як маҳдудияти бузург аст.

Барои огоҳ кардани корбарон дар бораи фармонҳои имконпазир танҳо садоҳои садо истифода бурдан мумкин аст ва хондани баромад бо овози баланд ба истиснои вазифаҳои асосӣ дилгиркунанда мегардад. Ҳангоми пухтупаз насб кардани таймер бо фармони овозӣ хеле хуб аст, аммо водор кардани пурсед, ки чӣ қадар вақт мондааст, шарт нест. Гирифтани пешгӯии мунтазами обу ҳаво барои корбар як озмоиши хотира мегардад, ки вай бояд тамоми ҳафта як қатор далелҳоро бишнавад ва аз худ кунад, на дар як нигоҳ аз экран.

Конструкторон аллакай ҳалли гибридӣ, Echo Show (11), ки экрани дисплейро ба баландгӯяки асосии интеллектуалии Echo илова кардааст. Ин вазифаи тачхизотро хеле васеъ мекунад. Бо вуҷуди ин, Echo Show то ҳол қобилияти иҷрои вазифаҳои асосиро, ки кайҳо боз дар смартфонҳо ва планшетҳо дастрасанд, хеле камтар дорад. Он (ҳанӯз) наметавонад дар интернет сайр кунад, баррасиҳоро нишон диҳад ё мундариҷаи аробаи хариди Amazon-ро намоиш диҳад, масалан.

Намоиши визуалӣ табиатан як роҳи муассиртари таъмини мардум бо иттилооти фаровон аст, на танҳо садо. Тарҳрезӣ бо афзалияти овоз метавонад ҳамкории овозиро ба таври назаррас беҳтар созад, аммо дар оянда, худсарона истифода набурдани менюи визуалӣ ба хотири муошират мисли ҷанг бо як даст дар пушти шумост. Аз сабаби мураккабии афзояндаи интерфейсҳои интеллектуалии овоз ва намоиш, таҳиягарон бояд муносибати гибридии интерфейсҳоро ба таври ҷиддӣ баррасӣ кунанд.

Баланд бардоштани самаранокӣ ва суръати системаҳои тавлид ва шинохти нутқ имкон дод, ки онҳо дар чунин барномаҳо ва соҳаҳо истифода шаванд, масалан:

• ҳарбӣ (фармонҳои овозӣ дар ҳавопаймоҳо ё чархболҳо, масалан, F16 VISTA),

• транскрипсияи автоматии матн (сухан ба матн),

• системаҳои иттилоотии интерактивӣ (Prime Speech, порталҳои овозӣ),

• дастгоҳҳои мобилӣ (телефонҳо, смартфонҳо, планшетҳо),

• робототехника (системаҳои Cleverbot - ASR дар якҷоягӣ бо зеҳни сунъӣ),

• автомобилӣ (назорати дастӣ ба ҷузъҳои мошин, ба монанди Blue & Me),

• замимаҳои хонагӣ (системаҳои хонагии интеллектуалӣ).

Барои бехатарӣ эҳтиёт шавед!

Автомобилӣ, асбобҳои маишӣ, системаҳои гармидиҳӣ / хунуккунӣ ва амнияти хонагӣ ва як қатор асбобҳои маишӣ ба истифодаи интерфейсҳои овозӣ, ки аксар вақт ба AI асос ёфтаанд, оғоз мекунанд. Дар ин марҳила, маълумоте, ки аз миллионҳо гуфтугӯҳо бо мошинҳо гирифта шудааст, фиристода мешавад абрҳои ҳисоббарорӣ. Маълум аст, ки бозоршиносон ба онҳо таваҷҷӯҳ доранд. Ва на танҳо онҳо.

Гузориши ахири коршиносони амнияти Symantec ба корбарони фармони овозӣ тавсия медиҳад, ки хусусиятҳои амниятӣ, аз қабили қулфҳои дарҳоро назорат накунанд, бигзор системаҳои амнияти хонагӣ. Ҳамин чиз барои нигоҳ доштани паролҳо ё маълумоти махфӣ дахл дорад. Амнияти зеҳни сунъӣ ва маҳсулоти интеллектуалӣ то ҳол ба таври кофӣ омӯхта нашудааст.

Вақте ки дастгоҳҳо дар тамоми хона ҳар як калимаро гӯш мекунанд, хатари ҳакерӣ ва сӯиистифодаи система як масъалаи ниҳоят муҳим мегардад. Агар ҳамлакунанда ба шабакаи маҳаллӣ ё суроғаҳои почтаи электронии алоқаманди он дастрасӣ пайдо кунад, танзимоти дастгоҳи интеллектуалиро метавон тағир дод ё ба танзимоти заводӣ баргардонад, ки ин боиси гум шудани маълумоти арзишманд ва ҳазфи таърихи корбар мегардад.

Ба ибораи дигар, мутахассисони амният метарсанд, ки зеҳни сунъии бо овоз ва VUI асосёфта ҳанӯз ба қадри кофӣ доно нест, ки моро аз таҳдидҳои эҳтимолӣ муҳофизат кунад ва вақте ки шахси бегона чизе талаб кунад, даҳони моро пӯшида нигоҳ дорад.

Илова Эзоҳ