Jatkuva puheentunnistus

Johdanto

Äänitunnistus on avainteknologia ihmisen ja tietokoneen vuorovaikutuksessa, ja se on edistynyt nopeasti viime vuosikymmeninä. Perinteinen akustinen mallinnustapa perustuu piilotettuun Markovin viitekehykseen ja puheakustisten ominaisuuksien todennäköisyysjakauma kuvataan Gaussian MixTureModelilla (GMM). Koska piilotettu Markov-malli kuuluu tyypilliseen matalaan oppimisrakenteeseen, vain yhteen rakenteeseen, joka muuntaa alkuperäisen tulosignaalin tietyksi ongelmatilan ominaisuudeksi, sen suorituskyky on rajoitettu massiivisessa datassa.

Jatkuva puheentunnistus viittaa jatkuvan äänivirran tunnistamiseen (eli puheesta suoraan puheesta tai äänisignaaleista puhelimessa tai muussa ääni- ja videoalueessa), joka muuntaa äänitiedon automaattisesti tekstiksi. Kun tuloääni, luotettava ääni, sulje pois mykistys, taustamelu, musiikki jne. miesten ja naisten määrittämiseksi ja lähetä puheentunnistusdekooderi reaaliajassa.

menetelmä

1, implisiittinen Markovin malli

Continuous speech recognition

piilotettu Markov-malli on tilastollinen malli, jota käytetään kuvaamaan 1 implisoitu Tuntemattomien parametrien Markov-prosessia käytetään laajalti puheentunnistuksessa. 1 Järjestelmä luo ensin puhemallin suurella määrällä sanoja, sitten poimii akustiset ominaisuudet ja tunnistustulos saadaan Viterbi-dekoodauksen jälkeen.

2, menetelmä, joka perustuu konvoluutiohermoverkkoon

Konvoluutio Neuraaliverkko analysoi paikallisia piirteitä konvolverin kautta ja parantaa polymerointikerroksen erottamaa ominaista kestävyyttä. Lopuksi luodaan malli kaikille verkkokerroksille lopullisen luokittelutuloksen saamiseksi. Konvoluutiokerros tarkkailee konvoluutiohermoverkkoa ja sitten saadaan lopulta koko verkkokerroksen tietointegraatio, jolla on parempi fyysinen merkitys kuin syvällä hermoverkolla.

Sovellus

1. Turvallisuusalalla asianomainen osasto yhdistää asiaan liittyvät palvelut ehdottaakseen vastaavia tarpeita; koulutuksen alalla mandariinikiinan yleisen tason koe ja suullinen arviointi koulutusalalla tarvitsee kiireesti objektiivista, Automaattinen arviointitekniikka;

2, televiestinnän, kotimaisen ja ulkomaisen puheentunnistusteknologian ja osastot ovat tulleet Kiinan markkinoille;

3, sulautetuilla markkinoilla, kuten matkapuhelin, autonavigointi jne. Puheentunnistustekniikka kasvaa myös;

4, alalla ihmisen kone, ääni kumppanit, mobiilipääte puheen haku jne. Laaja sovellus.

Siksi puheentunnistusteknologialla on erittäin laajat näkymät teknologialle erittäin tärkeänä ihmisen ja tietokoneen välisenä vuorovaikutuksena.

Related Articles
TOP