radiális alapfunkciók, RBF kernelek, & RBF hálózatok egyszerűen elmagyarázva

más tanulási paradigma

Andre Ye

követés

Sep 26, 2020 * 7 perc olvasás

itt van egy egydimenziós adatkészlet: az Ön feladata, hogy megtalálja a módját, hogy tökéletesen elkülönítse az adatokat két osztályba egy sorral.

első pillantásra ez lehetetlen feladatnak tűnhet, de csak akkor, ha egy dimenzióra korlátozzuk magunkat.

vezessünk be egy f(x) hullámos függvényt, és térképezzük fel az x minden értékét a megfelelő kimenetre. Kényelmesen Ez teszi az összes kék pontot magasabbra, a piros pontokat pedig alacsonyabbá a megfelelő helyeken. Ezután rajzolhatunk egy vízszintes vonalat, amely tisztán osztja az osztályokat két részre.

ez a megoldás nagyon alattomosnak tűnik, de valójában általánosíthatjuk a radial basis functions (rbfs) segítségével. Bár sok speciális felhasználási esetük van, az RBF eredendően egyszerűen olyan függvény, amelynek pontjait a központtól való távolságként határozzák meg. Az RBF-eket használó módszerek alapvetően megosztják a tanulási paradigmát, amely eltér a szokásos gépi tanulási viteldíjaktól, ami annyira erőssé teszi őket.

például a haranggörbe az RBF példája, mivel a pontokat az átlagtól való szórások számaként ábrázolják. Formálisan definiálhatunk egy RBF-et olyan függvényként, amelyet így lehet írni:

vegye figyelembe, hogy a kettős csövek (informálisan, ebben a használati esetben) a ‘távolság’ gondolatát képviselik, tekintet nélkül az X méretére. például

ez a ‘sugár’ aspektusa a ‘radiális alapfüggvény’. Azt mondhatjuk, hogy a radiális alapfunkciók szimmetrikusak az eredet körül.

a fent említett feladat-a pontok varázslatos elválasztása egy vonallal-radial basis function kernel néven ismert, az alkalmazások A erőteljes Support Vector Machine (SVM) algoritmusban vannak. A ‘kernel trükk’ célja az, hogy az eredeti pontokat valamilyen új dimenzióba vetítse úgy, hogy egyszerű lineáris módszerekkel könnyebb legyen elválasztani.

Vegyünk egy egyszerűbb példát a feladatra három ponttal.

rajzoljunk egy normál eloszlást (vagy egy másik tetszőleges RBF függvényt) az egyes pontok középpontjába.

ezután megfordíthatjuk az összes radiális alapfunkciót egy osztály adatpontjaihoz.

ha minden X pontban hozzáadjuk a radiális bázisfüggvények összes értékét, akkor egy köztes ‘globális’ függvényt kapunk, amely így néz ki:

elértük hullámos globális funkciónkat (nevezzük g(x))! Mindenféle adatelrendezéssel működik, az RBF függvény jellege miatt.

választott RBF függvényünk-a normál eloszlás-sűrű az egyik központi területen, és kevésbé az összes többi helyen. Ezért nagyon sok befolyása van a g(x) értékének eldöntésében, amikor az X értékei közel vannak a helyéhez, a távolság növekedésével csökkenő erővel. Ez a tulajdonság teszi RBF funkciók erős.

ha a x helyen lévő összes eredeti pontot kétdimenziós térben a (x, g(x)) pontra térképezzük fel, az adatok mindig megbízhatóan elválaszthatók, feltéve, hogy nem túl zajosak. Az átfedő RBF függvények miatt mindig az adatok megfelelő sűrűségének megfelelően lesz leképezve.

valójában a— összeadás és szorzás — radiális Alapfüggvények lineáris kombinációi felhasználhatók szinte bármilyen függvény közelítésére.

a funkció (Fekete) modellezésére használt adatpontok (lila) áll több RBF funkciók (szilárd színes vonalak). Forrás. Image free to share

Radial Basis Networks vegye ezt az elképzelést, hogy a szív beépítésével ‘radial basis neuronok’ egy egyszerű kétrétegű hálózat.

a bemeneti vektor az n-dimenziós bemenet, amelyben osztályozási vagy regressziós feladatot (csak egy kimeneti neuront) hajtanak végre. A bemeneti vektor másolatát elküldjük a következő radiális bázisú neuronok mindegyikéhez.

minden RBF neuron egy központi vektort tárol — ez egyszerűen egy egyedi vektor a képzési készletből. A bemeneti vektort összehasonlítjuk a központi vektorral, a különbséget pedig egy RBF függvényhez csatlakoztatjuk. Például, ha a központi és a bemeneti Vektorok azonosak lennének, a különbség nulla lenne. A normális eloszlás x = 0-nál 1, tehát a neuron kimenete 1 lenne.

ezért a ‘központi’ vektor az RBF függvény középpontjában lévő vektor, mivel a bemenet adja a csúcs kimenetet.

hasonlóképpen, ha a központi és a bemeneti Vektorok különböznek, a neuron kimenete exponenciálisan nulla felé bomlik. Az RBF neuron tehát úgy tekinthető, mint a bemeneti és a központi Vektorok közötti hasonlóság nemlineáris mértéke. Mivel az idegsejt radiális-sugáralapú-a különbségvektor nagysága, nem pedig az irány számít.

végül az RBF csomópontokból származó tanulságokat a kimeneti réteghez való egyszerű kapcsolaton keresztül súlyozzuk és összegezzük. A kimeneti csomópontok nagy súlyértékeket adnak az RBF neuronoknak, amelyek különös jelentőséggel bírnak egy kategória szempontjából, kisebb súlyokat pedig azoknak az idegsejteknek, amelyek kimenetei kevésbé számítanak.

miért veszi a radiális bázishálózat a ‘hasonlóság’ megközelítést a modellezéshez? Vegyük a következő példát kétdimenziós adatkészlet, ahol húsz RBF csomópont központi vektorai ‘+’ – val vannak ábrázolva.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.