Kernel Medico
Os dados clínicos têm a particularidade de apresentar variáveis de quais os valores se encontram quase sempre dentro de um intervalo onde é fácil encontrar os outliers, e estas variáveis dependem muitas das vezes desse mesmo intervalo pois para diferentes populações o mesmo valor poderá ter diferentes significados, sendo exemplos disto a idade, pressão arterial e altura. Tendo em conta estas condições é necessário que o kernel utilizado não destrua os dados ao ignorar o intervalo das variáveis, algo que garantidamente aconteceria com um kernel polinomial ou um simples kernel radial.
k(Zi,Zj)=(r-|Zi-Zj|)/r
Onde r é igual a diferença entra o maior e menor valor e k(Zi,Zj) é a variável z para os objectos i e j. Para variáveis binárias k(Zi,Zj)=1 se Zi=Zj ou k(Zi,Zj)=0 se Zi=!Zj
Para se calcular a matriz final do kernel temos 1/n*Sumatorio(k(Zi,Zj))
Daemen, A and Timmerman, D and Van, den Bosch T and Bottomley, C and Kirk, E and Van, Holsbeke C and Valentin, L and Bourne, T and De, Moor B,Improved modeling of clinical data with kernel methods,2012