Verdienen Sie Geld mit Ihren Tech-Blogs, Gadgets und Tipps

Ilmainen puheentunnistusohjelmisto PC:lle

Huomautus: Seuraava artikkeli auttaa sinua: Free Speech Recognition Software for PC

Kun tulemme omiin, huomaamme joskus, että puhumme enemmän digitaalisille laitteillemme kuin ympärillämme oleville. Digitaaliset avustajat käyttävät puheentunnistusta tunnistaakseen, mitä sanomme. Voimme hallita elämämme eri puolia pelkällä keskustelulla puhelimessamme tai älykaiuttimessamme.

Vaikka puheentunnistus on niin suuri osa jokapäiväistä elämäämme, emme yleensä tutki tämän prosessin toimintaa. Tässä tekniikassa on monia taustaongelmia, joita käsittelemme tässä artikkelissa.

Mikä on puheentunnistus?

Nykyaikaisissa älylaitteissa on yleensä puheavustaja ja puheentunnistusohjelma, joka tekee tietyt asiat laitteessa. Puheentunnistus on joukko algoritmeja, jotka auttavat muuttamaan äänesi digitaalisiksi signaaleiksi, jotka määrittävät tarkalleen, mitä sanot. Ohjelmat kuten Microsoft Office Käytä tätä etua asiakirjojen kirjoittamiseen.

Ensimmäinen puheentunnistusjärjestelmä

Ensimmäinen puheentunnistusjärjestelmä tunnettiin nimellä AUDREY. Se on Bell Labsin vuonna 1952 keksimä lyhenne sanoista “Automated Digit Recognition”. AUDREY osasi tunnistaa numeromerkit. Kaiutin sanoo numeron ja laite sytyttää yhden kymmenestä valosta jokaiselle numerolle.

Vaikka tämä keksintö oli uraauurtava, se ei otettu hyvin vastaan. Tämä laite yksin oli 6 jalkaa korkea ja vei paljon tilaa. Koon lisäksi laite pystyi tunnistamaan vain numerot 0-9, mikä oli myös herkkä tietyille äänille. Siksi tätä laitetta voi käyttää vain tietty henkilö.

AUDREYn virheistä huolimatta tämä oli ensimmäinen askel seikkailunhaluisella matkalla nykypäivän äänentunnistussensorien kehitykseen. Ei kestänyt kauan, kun myöhemmät puheentunnistuslaitteet tunnistivat sanasarjan.

Puheentunnistusprosessi alkaa äänen muuntamisesta digitaalisiksi merkeiksi.

Puheentunnistusjärjestelmät ottavat tiettyjä vaiheita ymmärtääkseen, mistä puhumme. Kun mikrofoni poimii äänesi, se muuntaa sen sähköiseksi signaaliksi, joka syötetään analogia-digitaalimuuntimeen. Tämä muunnin muuntaa analogisen virtasignaalin digitaaliseksi binäärisignaaliksi.

Analogi-digitaali-muunnin myös poimii näytteitä virtayksikköä kohti tämän virran kulkiessa ja määrittää näiden näytteiden jännitteen. Näistä virtanäytteistä otettuja jännitteitä kutsutaan näytteiksi. Kunkin näytteen pituus on vain muutama sekunnin tuhannesosa. Muunnin lajittelee kahdeksan binaarimerkkiä (yksi tavu dataa) näiden esimerkkien avulla.

Ääni käsitellään sen terävyyden lisäämiseksi.

Koska laitteen on tiedettävä tarkalleen, mitä sanomme, se on käsiteltävä sen vastaanottaman äänen selkeyden lisäämiseksi. Joskus laitetta käytetään ympäristöissä, joissa on melua ja tämä ääni on purettava. Siksi taustamelun poistamiseksi asennetaan suodattimet. Jotkut puheentunnistusjärjestelmät eivät ota huomioon ihmisen kuuloalueen ylä- ja alapuolella olevia taajuuksia.

Tämä järjestelmä poistaa ei-toivotut taajuudet, mutta myös vahvistaa tiettyjä taajuuksia, jotta tietokone tunnistaa ne paremmin kuin kohina.

Jotkut puheentunnistusjärjestelmät myös jakavat äänen useille eri taajuuksille. Muut ominaisuudet, kuten nopeus ja äänenvoimakkuus, on säädetty vastaamaan paremmin vertailuääntä. Tämä kohinan suodatus auttaa todella parantamaan yleistä tarkkuutta.

Puheentunnistus alkaa muodostaa sanoja.

Tässä järjestelmässä on kaksi tapaa analysoida kieltä. Ensimmäinen on salainen Markovin malli ja toinen on neuroverkko.

Piilotettu Markovin malli

Tätä mallia käytetään useimmissa puheentunnistusjärjestelmissä, joissa sanat jaetaan sanoiksi. Koska kussakin kielessä on rajoitettu määrä sanoja, tämä menetelmä on erittäin hyödyllinen.

Englannin kielessä on noin 40 foneemia, ja kun järjestelmä tunnistaa yhden, se osaa myös arvata seuraavan foneemin.

Jos järjestelmä esimerkiksi havaitsee theta-foneemin, seuraava foneemi on todennäköisesti p ja sana tap muodostuu. On myös mahdollista, että nämä ovat seuraavat foneemit, mutta tämä mahdollisuus on kaukana odotetusta. Jos seuraava laitteen vastaanottama kirjain on hyvin samanlainen kuin kärki, voi olla pitkälti varmaa, että se on arvattu oikein.

hermoverkko

Hermoverkko on kuin digitaaliset aivot, jotka oppivat yhtä paljon kuin ihmisen aivot. Neuroverkot ovat käytännöllinen työkalu syvän oppimisen edistämiseen tekoälyn avulla.

Puheentunnistuksessa käytetty hermoverkko on RNN:n toistuva tyyppi. RNN toimii siten, että edellisen vaiheen operaation lähtöä käytetään tulona uudessa vaiheessa. Tämä tarkoittaa, että kun RNN käsittelee vähän, se käyttää edellisen vaiheen dataa vaikuttaakseen seuraavan datan toimintaan ja lyhyesti sanottuna käyttää kokemusta oppimisen työkaluna.

Mitä enemmän RNN:itä alttiina tietylle kielelle, sitä tarkempi puheentunnistus on. Jos järjestelmä havaitsee ta-äänen 100 kertaa ja sitten P:n ääni on olemassa 90 kertaa tällä hetkellä, verkko voi periaatteessa oppia, että p tulee yleensä ta:n jälkeen.

Tästä syystä kun puheentunnistusjärjestelmä tunnistaa foneemin, se käyttää keräämiään tietoja ennustaakseen, mikä foneemi todennäköisimmin seuraa. Koska RNN:t oppivat jatkuvasti, mitä enemmän niitä käytetään, sitä tarkempaa puheentunnistusta tulee.

Kun sanantunnistusjärjestelmä on tunnistettu (käyttäen joko Markovin salaista mallia tai RNN:tä), nämä tiedot lähetetään prosessorille. Tämän jälkeen järjestelmä suorittaa tehtävän, joka on suoritettava.

Puheentunnistuksesta on tullut yksi tärkeimmistä nykyaikaisista teknologioista.

Puheentunnistuksesta on tullut tärkeä osa nykyaikaista teknologista näkemystämme. Toteutettu eri toimialoilla ja palveluissa ympäri maailmaa. Itse asiassa monet ihmiset hallitsevat koko elämänsä ääniavustajien avulla. Voit nähdä avustajia, kuten Siri, latautuvan Apple Watchiin. Se, mikä oli vain unta vuonna 1952, on muuttunut todeksi, eikä se näytä loppuvan lähiaikoina.

Mikä on paras puheentunnistusohjelmisto Windows 10:lle?

Vertaa parhaita puheentunnistusohjelmistoja.

  • 1) Ammattimainen lohikäärme. #
  • 2) Lohikäärmeitä kaikkialla.
  • 3) Google nyt.
  • 4) Google Cloud Speech API.
  • 5) Äänikirjoitus Google Docsissa.
  • 6) Siri.
  • 7) Amazon Lex.

Onko Windows 10:ssä puheentunnistusohjelmistoa?

Voit opettaa Windows 10:n tunnistamaan äänesi. Määritä se seuraavasti: Kirjoita tehtäväpalkin hakukenttään “Windows Speech Recognition” ja valitse sitten tulosluettelosta “Windows Speech Recognition”. Valitse sitten Helppokäyttöisyys > Puheentunnistus > Kouluta tietokoneesi ymmärtämään sinua paremmin.

Onko Windows 10 puheentunnistus hyvä?

300 sanan kappaleessamme puheentunnistus menetti keskimäärin 4,6 sanaa ja välimerkit olivat suurimmaksi osaksi oikein, muutamalla pilkulla ja pisteillä. Jos etsit yksinkertaista ja ilmaista transkriptioohjelmaa, Windows on hyvä vaihtoehto, vaikka se ei olekaan yhtä tarkka kuin Dragon.

Kuinka voin parantaa puheentunnistusta Windows 10:ssä?

Paranna puheentunnistuksen tarkkuutta

  • Napsauta tai napauta tehtäväpalkin tehtäväpalkkia.
  • Napsauta tai napauta mikrofonikuvaketta avataksesi äänentunnistuksen asetusvalikon.
  • Valitse “Asetukset”.
  • Valitse sitten “Paranna puheentunnistusta”.

Onko Dragon Dictation ilmainen?

Voit ladata tai täydentää Dragon Dictation -sovelluksen iPhonelle tai Androidille. Onko Dragon NaturallySpeaking sen arvoinen?

Kyllä, Dragon NaturallySpeaking kannatti kirjoittaa nopeammin. Uusilla temppuilla ponnistus Dragonin kanssa kannatti, vaikka en olekaan hidas kirjoittaja. Edellisestä viestistä tiedät, että Dragon haluaa hyvän mikrofonin, minun tapauksessani Blue Yetin USB-inkarnaation.

Kuinka aktivoin äänisyötön?

Ota äänitulo käyttöön

  • Kosketa aloitusnäytössä Sovellukset-kuvaketta.
  • Avaa Asetukset-sovellus.
  • Valitse kieli ja syöttötapa. Tämän komennon nimi voi olla “Input & Speech” joissakin puhelimissa.
  • Varmista, että Google Voice Typing -kohde on käytössä. Jos ei, kosketa sitä aktivoidaksesi Google Voice -kirjoituksen.

Mikä on paras ilmainen puhe tekstiksi ohjelmisto Windowsille?

Paras sananvapaus ohjelmia kirjoitettaessa

  • Google Gboard.
  • Paina vain äänittää.
  • Kaiutin.
  • Windows 10 puheentunnistus

Kuinka käytän Windowsin puheentunnistusta?

Käytä puheentunnistusta

Pyyhkäise sisään sivun oikeasta reunasta ja napauta sitten Hae. …Kirjoita hakukenttään “puheentunnistus” ja napauta tai napsauta sitten “Windows Speech Recognition”. Sano “Aloita kuuntelu”, napauta mikrofonipainiketta tai napsauta aloittaaksesi kuuntelutilan.

Voiko Cortana kääntää puheen tekstiksi?

Cortanan julkaisun myötä voit nyt täyttää lomakkeita, sanella tekstiä ja antaa komentoja vain puhumalla tietokoneellesi. Ota tekstistä tekstiksi sanelu käyttöön Windows 10:ssä painamalla Windows-näppäintä ja H-näppäintä (Windows H-näppäin).Kuinka ohjaan tietokonettani äänikomennoilla?

Kuinka ohjaan Windows 10:tä äänelläni?

  • Kirjoita Cortanan hakupalkkiin Windows Speech ja avaa se napauttamalla Windowsin puheentunnistusta.
  • Aloita napsauttamalla ponnahdusikkunassa Seuraava.
  • Valitse mikrofonisi ja napsauta Seuraava. …
  • Asenna mikrofoni Noudattamalla näytön ohjeita. Kun olet valmis, napsauta Seuraava.

Voinko sanella Microsoft Wordilla?

Sanele-ominaisuuden avulla voit käyttää sanaa tekstinä Microsoft Wordissa. Microsoft Wordin Sanele-ominaisuuden avulla voit kirjoittaa käyttämällä mikrofonia ja ääntä. Kun käytät sanelua, voit luoda uuden kappaleen sanomalla “New Line” ja lisätä välimerkkejä vain sanomalla sen ääneen.Kuinka korjaat puheentunnistuksen?

Android-puhelimien ja -tablettien vianetsintä

Sano Android-puhelimella tai -tabletilla “Hei Google, avaa Assistant-asetukset” tai siirry Assistantin asetuksiin. Napauta Suositut asetukset -osiossa Voice Match. Ota Google käyttöön ja käynnistä Voice Match .

Kuinka voin parantaa puheentunnistusta?

Siirry puhelimesi Asetukset-sovellukseen ja valitse “Kieli ja syöttö” tekstistä puheeksi -tulostusta varten. Napauta Asetukset-painiketta Google Text-to-Speech Engine -kohdan vieressä ja napauta sitten Asenna puhetiedot. Valitse kieli ja lataa “korkealaatuinen” ääni, jos se on saatavilla. Kuinka voin parantaa puheentunnistustani?

Parantaaksesi puheentunnistusta entisestään, valitse Puheentunnistus-valintaikkunassa “Kokeile tietokoneesi ymmärtämään sinua paremmin”, seuraa ohjeita mikrofonin hienosäätämiseksi (tarvittaessa) ja lue sitten tietokoneellesi, jotta ymmärrät oppimasi paremmin. Ymmärrä äänimallisi.

Ohjaa tietokonettasi viidellä äänentunnistuskomennolla

Lohikäärmeitä

Dragon on ollut äänentunnistusohjelmisto pitkään ja se on ollut yksi parhaista. Nykyään käyttäjät etsivät ohjelmistoja, jotka voivat lisätä eri asioiden suoritusnopeutta helpottaakseen heidän työtään. Ohjelmisto, jossa käyttäjät käyttävät uusia teknologioita uskoakseen asiansa heille, jotta he voivat tarjota tuloksen käyttäjille automaattisesti. Nykyään monet yritykset tuottavat sellaisia ​​ohjelmistoja, jotka liittyvät itse asiassa tekoälyn tyyppiin.

Tämän ohjelmiston avulla voit kommunikoida tietokoneesi kanssa ja muuntaa puheesi tekstiksi! Kyllä, sinun ei enää tarvitse kirjoittaa, ja tekstisi kirjoitetaan yksinkertaisesti nojaamalla tuoliisi ja puhumalla mikrofoniin!Dragon oli pitkään ainoa saatavilla oleva ohjelmisto tähän, mutta se ei enää pidä paikkaansa. On parempi tarkistaa muut ohjelmistot ja ominaisuudet.

Windowsin puheentunnistus:

Uusia puheentunnistusohjelmiston versioita esitellään käyttäjille uuden Microsoft Windowsin mukana, ja olen aina ajatellut, että Microsoft ei voi tehdä hienoa puheentunnistusohjelmistoa yksinään. Minun on nyt kuitenkin myönnettävä, että olin väärässä. Olin erittäin vaikuttunut tästä ilmaisesta ohjelmasta, ja voit nyt käyttää tätä ohjelmistoa Windows Vista-, Windows 7- ja Windows 8 -käyttöjärjestelmissä.

Aktivoi Windowsin puheentunnistusohjelma siirtymällä Käynnistä-valikkoon ja kirjoittamalla sana puheentunnistus hakukenttään.

Napsauttamalla avattua ohjelmistoa voit aktivoida haluamasi toiminnot ja lukea lyhyen tekstin nähdäksesi miltä tallentamasi ääni on.Pääset myös kaikkiin Ohjauspaneelin toimintoihin.

Kun olet tehnyt kaikki asetukset, voit aloittaa työskentelyn tällä ohjelmalla.Sano ensin “Aloita kuuntelu” mikrofoniin, sitten kuulet ohjelmasta piippauksen ja ohjelma odottaa seuraavaa komentoasi.

Voit tehdä melkein mitä tahansa tietokoneellasi Windowsin puheentunnistuksen avulla. Se voi esimerkiksi avata uusia välilehtiä selaimissa ja mikä tärkeintä, avata Microsoft Office -sovelluksia ja työskennellä niiden kanssa. Kun avaat Microsoft Word -sovelluksen, voit lukea tekstisi ja nähdä, mitä Sovelluksessa on kirjoitettu.

Voit pyytää tietokonettasi sammumaan tai jopa käynnistämään uudelleen. Kun olet lopettanut tämän ohjelman, sano “Lopeta kuunteleminen”. Työsi päättyy ja ohjelma pysähtyy, kunnes käynnistät sen uudelleen. Tämä sovellus on helppo ja ilmainen käyttää.

Googlen puhehaku:

Chromen käyttäjät ovat luultavasti huomanneet pienen mikrofonin Google-hakupalkin oikealla puolella. Tämä mikrofoni on sama kuin Google Voice Search.

Googlen aiemmat puheentunnistuspalvelut sisältävät hakukone- ja käännöspalvelut. Google-äänihakua käytetään vain Chrome-selaimessa, joka on saatavilla useisiin käyttöjärjestelmiin. Siirry Chrome-selaimella Googlen etusivulle ja napsauta mikrofonia.

Olettaen, että mikrofonisi on kytketty tietokoneeseen (tai kuulokemikrofoniin), Google kysyy, sallitko mikrofonin käytön. Jos näin on, sinua pyydetään puhumaan ja aloittamaan haluamasi aiheen etsiminen. Tulokset näkyvät nopeasti näytölläsi ilman, että sinun tarvitsee kirjoittaa mitään.

Googlen puheentunnistusalgoritmi on suhteellisen hyvä ja voi ymmärtää mitä sanot. Minulla on ollut hyviä tuloksia muiden murteiden, kuten saksan ja skotlannin, kanssa.

Dragon NaturallySpeaking Premium:

Dragon on yksi parhaista ja vanhimmista puheentunnistusohjelmistoista. Dragon NaturallySpeakingin alkuperäisen ja kotiversion hinta on kuitenkin noin 75 dollaria, ja lisämaksu nostaa hinnan 150 dollariin.

Kun avaat Dragon NaturallySpeakingin ensimmäisen kerran, sinun tulee täyttää käyttäjäprofiilisivu. Ohjelmasi käynnistyy, kun mikrofonin logo on oranssi, mikä tarkoittaa, että Dragon ei kuuntele sinua. Yksi tämän sovelluksen hienoista ominaisuuksista on sen yhteensopivuus Gmailin kanssa. Tämän sovelluksen avulla voit kirjoittaa sähköpostisi ja lähettää ne yleisöllesi. Voit myös kertoa hiiren osoittimelle, mihin se asetetaan.

TalkTyper:

TalkTyper on online-puheentunnistussovellus, joka antaa sinulle perusvaihtoehdot, mitä tehdä tekstilläsi. Niille, joilla ei ole suuria odotuksia, äänentunnistusohjelma voi olla hyvä vaihtoehto.

TalkTyper käyttää Googlen puheentunnistusalgoritmia, joten tarvitset Google Chromen. Napsauta vihreää mikrofonia ja sanele haluamasi teksti Muita vaihtoehtoja ovat kopioiminen leikepöydälle ja tekstin lähettäminen sähköpostitse sekä tulostus ja kääntäminen toiselle kielelle.

Jos haluat kääntää tekstisi toiselle kielelle, napsauta Käännä ja valitse haluamasi kieli. TalkTyper avaa automaattisesti Chrome-selaimessa uuden välilehden, joka sisältää tekstisi. TalkTyper ei tunnista kovin hyvin erilaisia ​​aksentteja ja sitä tulisi käyttää yksinkertaisempiin tehtäviin. Ehkä on parempi käyttää sähköpostin sisältöä. Jälleen, Dragonin käyttö on parempi vaihtoehto.

Tazty

Se, mikä lausutaan myös “maukkaaksi”, on toinen äänentunnistusohjelma. Tällä ohjelmalla on kaksi tärkeintä eroa muihin ohjelmiin verrattuna: ensimmäinen on, että tällä ohjelmalla voit hallita tietokoneen komentoja ja tietokonepelejä, ja toinen on se, että voit lisätä tai muuttaa siihen komentoja.

  • Tällä ohjelmistolla voit avata tai poistaa kansion.
  • Voit myös käyttää napsautus- ja kaksoisnapsautuskomentoja ilman hiirtä.
  • Voit käyttää tätä ohjelmaa ilmaiseksi 15 päivää ja maksaa sitten 15 dollaria.

Mikään ohjelmista ei saavuta lohikäärmettä. Kaikkien viiden ohjelman testaamisen jälkeen on selvää, että Dragon NaturallySpeaking voitti nämä vertailut. Huolimatta ilmaisesta Windows-ohjelmasta ja jopa helppokäyttöisyydestä Google Chromessa, monet käyttäjät ovat valmiita maksamaan 150 dollaria ja hyötymään täydellisestä ohjelmasta. Näppäimistön poistaminen on helpottanut käyttäjiä huomattavasti.