„Microsoft Azure“ apžvalga: pažangiausias balso apdorojimas

Turinys:

Anonim

„Microsoft Azure Speech to Text“ yra viena pažangiausių balso atpažinimo platformų. Kaip dalis „Microsoft“ pažintinių kalbų paslaugų produktų asortimento, jis naudoja giluminius mokymosi algoritmus, kad įveiktų prastą garso kokybę, ir gali prisitaikyti prie įvairių kalbėjimo stilių, kad būtų galima tiksliai perrašyti garsą. Šioje „Microsoft Azure“ kalbos į tekstą apžvalgoje atidžiai išnagrinėsime šią paslaugą.

Verta paminėti, kad „Microsoft Azure Speech to Text“ nėra tradicinis patogi diktuoti programinė įranga. Vietoj to, tai yra į kūrėją orientuota platforma, sukurta padėti įmonėms kurti, išbandyti ir valdyti savo produktus. Jei norite tik perrašyti garso failų paketą, alternatyvios kalbos į tekstą programos gali būti geresnis pasirinkimas. Norėdami sužinoti geriausias alternatyvas, peržiūrėkite mūsų „Geriausias kalbos į tekstą“ programinės įrangos vadovą.

„Microsoft Azure“ kalba į tekstą: planai ir kainos

Naudodami „Microsoft Azure Speech to Text“ galite nemokamai perrašyti iki penkių valandų garso įrašą ir sukurti vieną pasirinktinį balso modelį per mėnesį. Tačiau taikant nemokamą planą vienu metu galima gauti tik vieną garso užklausą, o tai reiškia, kad ši parinktis nėra perspektyvi daugumai įmonių.

„Azure“ kalbos paslaugų atsiskaitymas padalijamas į vienos sekundės žingsnius.

Jei norite perrašyti daugiau nei vieną kalbos klipą vienu metu, turėsite naujovinti į standartinę „Azure“ kainų sistemą. Tai kainuoja 1 USD už valandą garso ir palaiko iki 20 vienu metu pateikiamų užklausų. Jei reikia naudoti pasirinktinį garso modelį arba perrašyti daugiakanalius garso failus, taikomi papildomi mokesčiai. Šios papildomos paslaugos kainuoja atitinkamai 1,40 USD ir 2,10 USD už garso valandą.

Nors „Microsoft“ savo kainas nurodo „už garso valandą“ formatu, kaip tai yra pramonės standarte, atsiskaitymas iš tikrųjų yra padalintas į vienos sekundės dalis, todėl nemokėsite už daugiau apdorojimo laiko, nei reikalaujama.

„Microsoft Azure“ kalba į tekstą: funkcijos

Pagrindinė „Azure Speech to Text“ funkcija yra prieiga, kurią ji suteikia galingai „Microsoft“ natūralios kalbos apdorojimo sistemai. Per pastaruosius kelerius metus „Microsoft“ kalbos dirbtinis intelektas pasiekė keletą svarbių etapų. Tai reiškia, kad dabar jis gali atlikti užduotis, kurių anksčiau kalbos atpažinimo tarnybai buvo neįmanoma, pavyzdžiui, tiksliai perrašyti pokalbius mažų grupių pokalbių metu.

„Microsoft Azure“ kalbos į tekstą paslauga gali integruotis su „Office 365“, kad būtų užtikrintas optimalus tikslumas.

„Azure“ veikia su daugybe kalbų ir tarmių ir gali būti mokoma - naudojant pasirinktinius kalbos atpažinimo modelius - geriau prisitaikyti prie vartotojo kalbėjimo stiliaus, foninės aplinkos triukšmo ir žodyno. Jei jūsų organizacija jau yra pasiryžusi „Microsoft“ produktų ekosistemai, galite panaudoti vartotojo „Office 365“ duomenis, kad geriau pagerintumėte kalbos atpažinimo tikslumą pagal konkrečias organizacijas. Ir, svarbiausia, tai galima padaryti nepakenkiant duomenų saugumui, nes „Speech to Text“ galima paleisti vietoje.

„Microsoft Azure“ kalba į tekstą: sąranka

„Microsoft Azure“ skirta kūrėjams, o ne vartotojams. Tai reiškia, kad jo sukūrimas yra susijusi ir šiek tiek sudėtinga procedūra, kurią geriausia palikti asmeniui, turinčiam daug techninės patirties.

„Azure“ nustatymas nėra visiškai paprastas, nebent turite kodavimo patirties.

Greičiausias būdas konfigūruoti „Azure“ yra naudoti „Azure Speech SDK“ programavimo kalba, pvz., „Java“ arba „C ++“. Norėdami tai padaryti, turėsite užsiregistruoti gauti nemokamą „Azure“ paskyrą ir sukurti tuščią projektą savo kūrimo aplinkoje. Tada turėsite naudoti „Microsoft Visual Studio“ ir parašyti trumpą programą, kad inicializuotumėte „Microsoft“ objektą „SpeechRecognizer“.

„Microsoft Azure“ kalba į tekstą: sąsaja

Kaip ir kitas masinio perrašymo platformas, „Microsoft Azure Speech to Text“ ketinama paleisti kaip programų programavimo sąsają (API), pridėti prie „Office 365“ programų arba integruoti į naujas platformas ir paslaugas. Dėl šios priežasties nėra vienos „Azure“ kalbos į tekstą sąsajos. Tai, ką pamatys galutinis vartotojas, priklauso nuo to, kaip buvo integruota „Azure“ kalba į tekstą.

„Azure“ internetinis portalas yra intuityvus ir lengvai naudojamas.

Tuo tarpu „Azure“ valdantis kūrėjas tai padarys per „Microsoft“ internetinį „Azure“ portalą, kuris jaučiasi modernus ir lengvai valdomas. Užtenka kelių minučių, kol rasite kalbos paslaugų išteklių puslapį, o pridėjus egzempliorių prie jūsų paskyros, stebėjimo įspėjimus ir naudojimą galima peržiūrėti viename lange.

„Microsoft Azure“ kalba į tekstą: našumas

Atlikdami „Microsoft Azure“ kalbos į tekstą apžvalgą, norėjome sužinoti, kaip ši platforma susidorojo su neapdorotų balso įrašų apdorojimo iššūkiu, todėl, kai mūsų „Azure“ paskyra buvo pasirengusi pradėti, įkėlėme įvairaus lygio foninio triukšmo klipus. . Visuotinai, „Azure“ gerai apdorojo mūsų pavyzdžius, nes vertinimo metu nematėme daugiau nei kelių klaidų.

Įgalinus pasirinktinį „Azure“ kalbos modelį, mūsų transkripcijos tikslumas pagerėjo.

„Azure“ iš pradžių šiek tiek kovojo apdorodama neįprastas ar specialias frazes, tokias kaip sporto komandų pavadinimai ir moksliniai terminai, tačiau tai buvo greitai išspręsta įjungus pasirinktinio modelio išvesties parinktį. Kai būsime suaktyvinę šią parinktį, „Azure“ sugebėjo prisitaikyti prie unikalaus mūsų naudojamo žodyno ir kalbėjimo stiliaus.

„Microsoft Azure“ kalba į tekstą: palaikymas

Norėdami sužinoti, kaip sąveikauti su „Azure Speech Services SDK“ naudojant skirtingas programavimo kalbas ir integruoti „Azure Speech to Text“ funkcijas į savo platformą, jums tikrai reikės pagalbos. Laimei, „Microsoft“ sukūrė išsamų „Azure“ platformos mokymo medžiagos katalogą, kuriame rasite kodų pavyzdžių ir naudingų patarimų.

„Azure“ svetainės mokymų skyriuje yra daug naudingų išteklių.

Be to, visi „Azure“ klientai gauna nemokamą atsiskaitymo ir prenumeratos valdymo palaikymą, prie kurio galima prisijungti per bilietų sistemą. Išsamesnį palaikymą galite pridėti prie savo sąskaitos už pasikartojantį mokestį, pradedant nuo 29 USD per mėnesį.

„Microsoft Azure“ kalba į tekstą: galutinis verdiktas

„Azure Speech to Text“ platforma naudoja pažangiausias technologijas, kad teiktų beveik tobulą transkripcijos paslaugą. Tai labiausiai tinka įmonėms, kurios jau yra investavusios į „Microsoft Office 365“ ekosistemą, nes pasirinktinius balso ir žodyno modelius galima saugiai sugeneruoti iš esamo dokumentų archyvo. Kai kurios mažos įmonės gali kovoti su „Azure“, nes norint tinkamai ją nustatyti, reikia kvalifikuoto „Microsoft“ debesų kūrėjo dėmesio.

Varžybos

„Amazon Transcribe“, „Google Cloud Speech-to-Text“ ir „Watson Speech to Text“ yra tiesioginiai „Microsoft Azure“ konkurentai. Šios trys platformos taip pat gali tiksliai atlikti didelės apimties paketines transkripcijas. „Google Cloud“ yra vienintelis artimas konkurentas, galintis dirbti su daugiau kalbų nei „Azure“, tačiau jis yra brangesnis, jo pradinis rodiklis siekia vos 0,006 USD per 15 sekundžių, palyginti su „Azure“ 0,017 USD per minutę (0,00425 USD per 15 sekundžių).

Norėdami rasti kitų „Microsoft Azure Speech to Text“ alternatyvų, perskaitykite mūsų geriausios kalbos į tekstą programinės įrangos vadovą.