Verdienen Sie Geld mit Ihren Tech-Blogs, Gadgets und Tipps

Mikä on konvoluutiohermoverkko ja miten se toimii?

Huomautus: Seuraava artikkeli auttaa sinua: Mikä on konvoluutiohermoverkko ja miten se toimii?

Torsion Neural Network tai Convolution Neural Network! Kuulostaa oudolta sanayhdistelmältä! Yhdistelmä eri tieteitä, kuten matematiikkaa, biologiaa ja tietokoneita. Nämä verkot ovat yksi tietokonenäön tärkeimmistä innovaatioista. Sana “hermoverkko” tuli erittäin suosituksi vuonna 2012; Tänä vuonna Alex Krichevsky käytti hermoverkkoa voittaakseen ImageNet-palkinnon (Annnual Computer Vision Olympics). Cherishevsky pienensi luokitusvirhettä 26 prosentista 15 prosenttiin.

Tämä vähennys oli erittäin merkittävä ja sitä pidettiin suurena menestyksenä. Sen jälkeen monet yritykset ovat käyttäneet sitä syvä oppiminen tuotteidensa ytimenä. Facebook käyttää hermoverkkoa kuvien automaattiseen merkitsemiseen; Google käyttää tätä tekniikkaa myös kuvien etsimiseen. Yritykset, kuten Amazon, Instagram ja Pinterest, käyttävät myös Convolution Neural Network (CNN Neural Network) -verkkoa tarjotakseen käyttäjilleen asiaankuuluvia tarjouksia; Kuvankäsittely on kuitenkin hermoverkkojen yleisin sovellus.

Mitkä ovat vaatimukset konvoluutiohermoverkon käytölle?

Kuvan luokittelu on prosessi, jossa poimimme syötteestä useita kuvia. Tulostettaessa ilmoitamme heidän luokkansa (koira, auto, talo jne.) tai todennäköisyyden kuulua kuhunkin luokkaan. Tämä on lähes itsestään selvää; Syntymästämme aikuisuuteen opimme sen ajan myötä ja luonnollisesti. Näemme kaiken ympärillämme ilman virheitä. Tarkemmin sanottuna, kun katsomme ympäristöämme, tunnistamme kaikki objektit ja annamme niille tunnisteen. Tämän tekeminen, eli objektien tunnistaminen ja nimeäminen ympäristössä, ei ole niin helppoa tietokoneelle!

Syöttö ja lähtö konvoluutiohermoverkossa tai CNN:ssä

Kun tietokone vastaanottaa kuvan syötteenä, se näkee sen numerosarjana. Taulukon määrä riippuu kuvan koosta (pikseleiden mukaan). Jos esimerkiksi välitämme tietokoneelle värikuvan JPG-muodossa ja kooltaan 480×480 pikseliä, sen korvaavassa taulukossa on 480x480x3 solua (numero 3 palaa RGB:hen). Jokaisella talolla on myös numero väliltä 0-255.

Tämä numero ilmaisee pikselivoimakkuuden. Vaikka nämä luvut näyttävät meistä merkityksettömiltä, ​​luokittelemme kuvia kouristushermoverkon avulla, vain sellaiset luvut ovat käsissämme. Perusideana on antaa tietokoneelle samanlainen lukujoukko kuin kuvasimme. Tietokone tunnistaa jotain tällaista tulosteessa: Tässä kuvassa on 80 prosentin mahdollisuus näyttää kissa, 15 prosentin todennäköisyydellä koira ja 5 prosentin todennäköisyydellä lintu.

Mikä on kouristushermoverkon tehtävä?

Toistaiseksi olemme perehtyneet aiheeseen ja tuloksiin. Mietitään kuinka ongelma ratkaistaan. Haluamme tietokoneen katsovan kuvia ja tunnistavan tietyn kohteen, kuten kirjan, ainutlaatuiset ominaisuudet ja sen, onko kirja kuvassa vai ei. Me ihmiset myös suoritamme tämän prosessin alitajuisesti tunnistaessaan esineitä. Esimerkiksi kun näemme koiran, erottuaksemme tarkastelemme ensin sen yksityiskohtaisempia raajoja, kuten kulmia, kynsiä, jalkoja jne.

Kun olemme tottuneet mielissämme oleviin malleihin, ymmärrämme, että se, mitä näemme, on koira. Ymmärtääkseen monimutkaisia ​​kuvia, kuten koiraa, tietokone tunnistaa ensin kuvan yksinkertaisemmat piirteet, kuten reunat ja käyrät. Neuroverkossa on useita kerroksia; Jokaisessa näistä tasoista tunnistetaan erityispiirteet ja lopulta viimeisessä kerroksessa kuva on täysin tunnistettu. Kuvaamamme prosessi oli kuinka kouristeleva hermoverkko toimii. Menemme nyt tähän tarkemmin.

Vääntöhermoverkon ja biologian yhteys!

Tässä osiossa haluaisimme tutkia joitain perustavanlaatuisempia käsitteitä. Kun kuulet ensimmäisen kerran termin kouristushermoverkko, muistat todennäköisesti biologian ja neurotieteen. Et tietenkään mennyt liian pitkälle! Aivojen visuaalinen aivokuori inspiroi vääntöhermoverkon (CNN) rakennetta. Vuonna 1962 kaksi tiedemiestä, Hubble ja Wiesel, suorittivat mielenkiintoisen kokeen. He osoittivat, että tietyt aivojen visuaalisen aivokuoren solut stimuloituvat, kun nähdään reunat eri muodoissa. Esimerkiksi vaakasuuntaisten viivojen näkeminen stimuloi tiettyjä soluja.

Eri solut osoittavat herkkyytensä näkemällä viivat kohtisuorassa toisiaan vastaan. Hubble ja Wiesel havaitsivat, että nämä solut oli järjestetty pylväiksi ja erittäin siististi yhteen ja että heidän yhteistyönsä tuloksena saimme hyvän visuaalisen havainnon ympäristöstämme. Räjähtävän hermoverkon perusta on kuin aivomme visuaalinen aivokuori! Itse asiassa CNN:ssä on useita kerroksia, joista jokainen on erityisesti suunniteltu tunnistamaan tiettyjä elementtejä. Lopuksi kuvahavaintomallin tulos on valmis.

Miten vääntöhermoverkko rakennetaan?

Kuten aiemmin mainittiin, vääntöhermoverkossa tietokone ottaa kuvan syötteeksi; Tämä kuva liitetään sitten monimutkaiseen verkkoon, jossa on useita vääntö- ja epälineaarisia kerroksia. Toiminnot suoritetaan jokaisessa näistä kerroksista ja lopussa tulosteessa näytetään luokka tai prosenttiosuus useiden eri luokkien esiintymisestä. Vaikea osa on keskitie ja kuinka ne toimivat! Alla menemme tärkeimpiin kerroksiin.

Ensimmäinen kerros konvoluutiohermoverkossa. Matemaattiset käsitteet

Torsionaalisen hermoverkon ensimmäinen kerros on aina konvoluutiokerros. Kuten aiemmin mainittiin, tämän kerroksen syöte on numerotaulukko. Hermoverkon ensimmäinen kerros toimii taskulamppuna! Kuvittele pimeässä huoneessa taskulamppu, jonka heijastamme kuvan vasempaan yläkulmaan ja kuvan alue syttyy ja näemme sen osan. Sitten osoitamme taskulampun kuvan muihin osiin nähdäksemme ainakin koko kuvan.

Kerrotaan nyt kertomiamme tarinoita koneoppiminen Kieli! Tätä taskulamppua kutsutaan suodattimeksi (tai hermosoluksi tai ytimeksi). Kuvaa, johon taskulamppu paistaa, kutsutaan vastaanottavaksi kentäksi. On huomattava, että suodattimet ovat itse numerotaulukoita. Suodattimen lukuja kutsutaan painoiksi tai parametreiksi. On huomattava, että tämän suodattimen syvyyden tulee vastata kuvan syvyyttä. Esimerkiksi suodattimen tulee olla sama, jos kuva on 5*5*3-taulukko (syvyys 3).

Suodatin näkee osan kuvasta kussakin näkymässä. Sitten se siirtyy kuvan yli skannatakseen myös muita alueita. Tätä suodattimen liikettä kuvassa kutsutaan konvoluutioksi.

Kun suodatin kulkee kuvan läpi, suodattimen numerot kerrotaan kuvan pikselien numeerisella järjestelyllä. Lopuksi kaikki osumien tulokset lasketaan yhteen ja saadaan numero. Oletetaan, että haluamme nähdä kuvan, jonka mitat ovat 32*32*3 käyttämällä 5*5*3-suodatinta. Kuvaamallamme toiminnolla tämä suodatin tuottaa lopulta numeerisen taulukon, jonka mitat ovat 1 x 28 x 28 (syy, miksi se on 28 x 28, johtuu siitä, että käytät 784-tilassa 5 x 5 suodattimen 32 x 32 kuvaa). . Tuloksena olevaa 28*28*28 matriisia kutsutaan viime kädessä aktivointikartaksi tai ominaisuuskartaksi. Jos käytämme kahta suodatinta yhden sijaan, saamme 28 x 28 x 2 matriisin. Tämä voi lisätä tarkkuuttamme suuremmissa mitoissa.

Ensimmäinen kerros konvoluutiohermoverkossa. Käytännön käsitteitä

Katsotaanpa ylhäältä ja katsotaan mitä CNN tekee. Jokaista edellisessä osiossa mainittua suodatinta voidaan pitää ominaisuuden tunnisteena. Ominaisuus tarkoittaa tässä esimerkiksi suoraa viivaa, yksinkertaista väriä tai kaarevuutta. Oletetaan, että ensimmäinen suodatin on 7 x 7 x 3 suodatin ja kaarevuusilmaisin. Tämä suodatin on seuraavanlainen numeerinen matriisi, jossa tämän matriisin arvoilla on korkeammat numeeriset arvot kaarevuuskohdissa. Nyt asetamme tämän suodattimen kuvan osaan. Sitten, kuten alla olevassa kuvassa, kerromme solujen luvut summalla ja kerrannaisilla.

Kuten näet, tulos on suuri luku. Suuri numero ilmaisee kaarevuutta kyseisellä alueella, kuten suodattimen kaarevuutta.

Alla olevassa kuvassa tuote on kerrottu pienellä numerolla, koska suodatin ei vastaa syötettyä kuvaa. Kuten mainittiin, etsimme aktivointikorttia; Toisin sanoen joukko numeroita, joiden mitat ovat 26 * 26 * 1 (olettaen, että käytämme vain käyräilmaisinsuodatinta). Tämän aktivointikartan vasemmassa yläkulmassa on 660. Tämä suuri luku osoittaa, että kuvan tietyllä alueella on todennäköisesti käyrä. Huomaa, että käytimme tässä vain yhtä suodatinta. Jotta voimme poimia kuvasta enemmän tietoa, meidän on käytettävä enemmän suodattimia. Enemmän suodattimia tarkoittaa suurempia mittoja.

Konvoluutiohermoverkon syvemmät kerrokset

Neuroverkossa kuvatun kerroksen lisäksi on muita kerroksia. Näillä tasoilla on erilaisia ​​tehtäviä ja toimintoja. Yleensä sisäkerrokset ovat vastuussa epälineaaristen mittojen ja asioiden ylläpidosta ja ylläpidosta. Viimeinen kerros kouristushermoverkossa on myös erityisen tärkeä.

Viimeinen kerros vääntöhermoverkossa

Konvoluutiohermoverkon viimeisessä kerroksessa vastaanotetaan muiden kerrosten lähtö tulona. Viimeisen tason lähtö on seuraava N vektori. N on käytettävissä olevien luokkien lukumäärä. Jos verkkosi on esimerkiksi numeroiden tunnistusverkko, luokkien lukumäärä on kymmenen; Koska meillä on kymmenen numeroa. Jokainen komponentti edustaa todennäköisyyttä, että luokka esiintyy seuraavassa N-vektorissa. Neuraaliverkon viimeinen kerros on, että se tarkastelee ylempien kerrosten Ominaisuuksia ja vertaa, missä määrin nämä ominaisuudet vastaavat kutakin luokkaa. Mitä suurempi vastaavuus, sitä suurempi on todennäköisyys, että luokka toteutuu.

Kuinka kouristushermoverkko toimii?

Tähän mennessä olet oppinut paljon vääntöhermoverkoista; Mutta luultavasti sinulla on vielä paljon kysymyksiä, ja uusia kysymyksiä on muodostunut päässäsi. Kysymykset, kuten suodattimien valmistus tai kuinka tietokone voi määrittää suodattimille sopivat arvot harjoitusprosessin aikana. Tätä prosessia kutsutaan backpropagaatioksi. Kun synnyimme, me ihmiset emme ymmärtäneet ympärillämme olevia asioita. Ajan kuluessa näimme erilaisia ​​esineitä, ja ympärillämme olevat ihmiset kertoivat meille näiden esineiden nimet ja opimme. Tietokoneet palvelevat samanlaista tehtävää; Aluksi suodatinmatriisin numerot ovat satunnaisia ​​ja satunnaisia. Ajan mittaan eri kuvien katseleminen tietokoneella korjaa suodattimen numeroita hyväksyttävän Suorituskyvyn saavuttamiseksi.

CNN-testi neuroverkoille

Kun mallimme on valmis, on aika testata. Mallin testaamiseen käytetään monia kuvia, jotta tiedämme sen sisällön. Välitämme kuvan mallin tuloon näyttämään meille tulos. Tarkistamme sitten, toimiiko se oikein.

Miten yritykset käyttävät konvoluutiohermoverkkoja?

Nykyään enemmän tietoa keräävät yritykset päihittävät varmasti kilpailijansa. Data on uuden maailman kultaa! Mitä enemmän dataa lisäämme syväoppimismalliin, sitä enemmän malli muuttuu ja lopulta sitä tehokkaampi se on. Yritykset, kuten Facebook (Instagram) ja Pinterest, voivat käyttää valtavia määriä videodataa luodakseen ainutlaatuisia malleja.