Watson yra natūrali IBM kalbų apdorojimo kompiuterinė sistema. Tai maitina garsųjį superkompiuterį, į kurį atsakoma į klausimus, taip pat daugybę dirbtiniu intelektu pagrįstų įmonės produktų, įskaitant „Watson Speech to Text“. Peržiūrėdami „Watson Speech to Text“, apžvelgsime vieną iš geriausių kalbų į tekstą programų, idealiai tinkančių tiems, kurie nori konvertuoti garsą į tekstą masto.
„Watson“ kalbos apdorojimo platformą galima rasti „IBM Cloud“. Tai universalus įrankis ir gali būti naudojamas įvairiuose kontekstuose, įskaitant diktavimą ir konferencinių pokalbių transkripciją. Be to, skirtingai nei daugumoje kitų kalbą į tekstą naudojančių programų, ji yra prieinama kaip API, leidžianti kūrėjams, be kitų dalykų, ją įterpti į balso valdymo sistemas.
Watson „Kalbėjimas į tekstą“: planai ir kainos
Norėdami nemokamai apdoroti iki 500 minučių garso įrašą per mėnesį, galite naudoti „Watson Speech to Text“. Jei norite konvertuoti daugiau nei į tai, turėsite mokėti už kiekvieną garso minutę, o tarifas pasikeis atsižvelgiant į apdoroto garso trukmę. Išlaidos svyruoja nuo 0,01 USD iki 0,02 USD per minutę, o jei reikalingas „IBM Custom Language Model“, taikomas papildomas 0,03 USD per minutę mokestis. Galimi ir aukščiausios kokybės „Watson“ planai, skirti tik citatoms. Jie suteikia prieigą prie patobulintų duomenų privatumo funkcijų ir veikimo laiko garantijų.
„Watson“ kalbos į tekstą paslaugos kaina nustatoma atsižvelgiant į turinio, kurį reikia perrašyti, kiekį.Taip pat prie „Watson Speech to Text“ sistemos galite prisijungti per bendrosios paskirties „IBM Cloud“ prenumeratą. Natūralios kalbos apdorojimas yra tik viena programa įvairiausiose dirbtinio intelekto paslaugose, kurias galite gauti naudodamiesi „IBM Cloud“, todėl tai yra geras pasirinkimas bet kuriai organizacijai, kuriai reikalinga prieiga prie spartaus duomenų perdavimo, pokalbių robotų ar teksto į kalbą įrankių.
Watson „Kalbėjimas į tekstą“: funkcijos
Dėl lanksčios API integracijos ir kitų iš anksto sukurtų IBM įrankių „Watson“ kalbos atpažinimo paslauga viršija pagrindinę transkripciją. Pavyzdžiui, jei norite jį naudoti klientų aptarnavimo kontekste, „Watson“ padėjėją galima nustatyti taip, kad jis tiesiogiai apdorotų natūralios kalbos klausimus arba atsakytų į klausimus telefonu.
Watsone IBM sukūrė daug funkcijų turinčią natūralios kalbos apdorojimo platformą.Watsonas dirba su tiesioginiu garsu 11 kalbų ir gali importuoti garsus įvairiais iš anksto įrašytais formatais. Perduodant srautą, realaus laiko diagnostinė pagalba reiškia, kad Watsonas gali paskatinti vartotojus priartėti prie savo mikrofono ar pakeisti aplinką. Taip pat įspūdingas faktas, kad Watsonas gali atskirti skirtingus garsiakalbius bendrame pokalbyje dėka „Speaker Diarization“ funkcijos, vis dar atliekančios beta versijos testavimą.
„Watson“ kalba į tekstą: sąranka
Norėdami naudoti „Watson“, pirmiausia turite sukurti „IBM Bluemix“ paskyrą. Registracija yra nemokama ir neskausminga, reikalaujant tik el. Pašto adreso ir slaptažodžio. Prisijungę turite pridėti nuostatą savo kalboje į „Speech to Text“ paslaugą. Šiame etape jums bus suteikta pora įgaliojimų, kuriuos turėtumėte išsaugoti savo įrašuose.
Norint pasiekti visą „Watson“ funkcijų rinkinį, būtina užsiregistruoti „IBM Bluemix“ paskyroje.Tai padarius, viskas žymiai komplikuojasi. Norėdami pasiekti „Watson“, turėsite pridėti šiuos kredencialus prie kliento vienodo išteklių lokatoriaus (cURL) kodo partijos ir paleisti jį savo kompiuteryje. Norėdami sužinoti, kokią komandą tiksliai iškviesti, peržiūrėkite šį patogų vadovą. Arba, jei norite tik pamatyti, kaip gerai veikia „Watson“ sistema, nereikia peršokti visų ratų, galite tai išbandyti „IBM“ demonstracinėje svetainėje.
Watson Kalba į tekstą: sąsaja
Skirtingai nuo vartotojams skirtų balso-teksto programų, „Watson“ paslaugos yra sukurtos taip, kad būtų galima pasiekti per API ir kodą, įterptą į kitas sistemas. Dėl šios priežasties nėra tikros Watson "sąsajos". Vietoj to, prie Watsono galima prisijungti per tris skirtingus interneto protokolus. Tai yra „WebSockets“, „REST API“ ir „Watson Developer Cloud“.
„Watson“ kalbą į tekstą galima valdyti per „Watson Developer Cloud“ sistemą.Norėdami valdyti Watsoną, turėsite naudoti komandinės eilutės įrankį, kuris jungiasi prie IBM debesies vienu iš šių trijų maršrutų. Sąsają, kurią mato su „Watson“ bendraujantis galutinis vartotojas, turės sukurti kažkas iš jūsų kūrimo komandos atskirai.
Watson Kalba į tekstą: atlikimas
Apskritai mums padarė įspūdį tai, kad ši natūralių kalbų apdorojimo platforma tvarkė tikrą kalbą. Mes naudojome Watsoną norėdami perrašyti klipus, kuriuos įrašėme įvairiose sudėtingose aplinkose, taip pat garsių kalbų garsus, pasakytus keliomis iš 11 Watsono palaikomų kalbų.
Mes nustatėme, kad Watsonas puikiai pasirodė su iš anksto įrašyta kalba.Nors klipuose, kuriuose yra daug foninio triukšmo, klaidų daugėjo, apskritai Watsonas davė neįtikėtinai tikslius rezultatus. Remdamiesi savo bandymais įvertinome, kad nepagrįstų klaidų pasitaikydavo vidutiniškai tik kartą per 150 žodžių. Tačiau tapo aišku, kodėl Watsono garsiakalbių parinkimo funkcija lieka BETA testavime, nes kelis kartus mūsų vertinimo metu vienas balsas buvo neteisingai pažymėtas kaip atskiri garsiakalbiai.
Watson Kalba į tekstą: palaikymas
„IBM“ išteklių centre pateikiama daugybė dokumentų, kurie padės geriau suprasti, kaip pritaikyti „Watson“ konkrečiam naudojimo atvejui. Taip pat verta pasinaudoti „Watson“ kūrėjų bendruomenės sukurtais ir „GitHub“ paskelbtais API integravimais ir SDK.
„Watson API GitHub“ puslapis yra geras „Watson“ kalbos į tekstą paslaugos palaikymo šaltinis.Jei nerandate ten savo problemos sprendimo, galite tiesiogiai susisiekti su IBM atidarydami palaikymo bilietą arba susisiekę su juo telefonu. Kol pasirinksite vieną iš aukščiausios kokybės „Watson“ paketų, „Watson“ naudojimas bus apsaugotas paslaugų lygio „Uptime“ sutartimi.
Watson Kalba į tekstą: galutinis nuosprendis
Jei jūsų organizacija turi žinių ir išteklių, kad tinkamai integruotų „IBM Watson Speech to Text“ platformą į savo sistemą, jums bus naudingos pažangios funkcijos, tokios kaip garso aplinkos realiu laiku diagnostika ir tarpinių transkribavimo rezultatai. Tačiau mažos įmonės ir organizacijos susidurs su techniniu iššūkiu tinkamai įkurti Watsoną.
Varžybos
„IBM Watson Speech to Text“ paslauga yra tiesioginė masinių transkribavimo paslaugų „Google Cloud Speech-to-Text“ ir „Amazon Transcribe“ konkurentė. Abi šios yra žymiai pigesnės nei „Watson“, pavyzdžiui, „Google Cloud“ transkribavimas prasideda nuo 0,006 USD per minutę. Visoms trims paslaugoms yra panašios funkcijos, pvz., Pritaikytas žodynas, tačiau vienos ypatybės, kurios labai trūksta „IBM Watson“, tačiau ji prieinama abiem konkurentams, yra automatinis skyrybos ženklų atpažinimas.
Ieškote kito „spoeech-to-text“ sprendimo? Peržiūrėkite mūsų geriausios kalbos į tekstą programinės įrangos vadovą.