lavoro ancora alle nuove formule

2025-02-21 13:59:47 +01:00
parent 828fea5d6a
commit 46cca564f4
4 changed files with 58 additions and 2 deletions
--- a/BIN
+++ b/BIN
--- a/classificatore_singolo.c
+++ b/classificatore_singolo.c
@@ -71,6 +71,7 @@ void main() {
                //gradienti è un array bidimensionale, la prima dimensione identifica il layer, la seconda il percettrone nel layer
                //gradienti[indice_layer][indice_percettrone]
                //Questo vettore identifica i gradienti dei percettroni
                double **gradienti = (double**)malloc(sizeof(double*) * NUM_LAYERS);
                //Alloco la dimensione per ogni layer
@@ -88,7 +89,27 @@ void main() {
                    - gradiente dell'errore retropropagato = peso del ne
                */
-                gradienti[NUM_LAYERS-1][0] = (output_corretto - sigmoidi[NUM_LAYERS-1][0]);
+                
                double gradiente_errore = (output_corretto - sigmoidi[NUM_LAYERS-1][0]);
                double derivata_sigmoide_out = sigmoidi[NUM_LAYERS-1][0] * (1 - sigmoidi[NUM_LAYERS-1][0]);
                gradienti[NUM_LAYERS-1][0] = gradiente_errore * derivata_sigmoide_out;
                //Ricorda di partire dal penultimo layer in quanto l'ultimo è già fatto
                discesa_gradiente(rete_neurale, sigmoidi, gradienti);
                /* A questo punto ho tutti i gradienti dei percettroni, non mi resta che trovare i gradienti dei pesi e correggerli
                */
               //Applico la correzione dal penultimo layer andando indietro fino al secondo (il primo si fa diverso)
               for(int indice_layer = NUM_LAYERS - 2; indice_layer > 0; indice_layer--) {
                    //Applico la correzione a tutti i percettroni del layer dal primo a seguire
                    for(int indice_percettrone = 0; indice_percettrone <= rete_neurale.layers[indice_layer].size; indice_percettrone++) {
                        correggi_pesi_percettrone();
                    }
                }
                //gradienti[NUM_LAYERS-1][0] = (output_corretto - sigmoidi[NUM_LAYERS-1][0]);
                errore_totale += gradienti[NUM_LAYERS-1][0];
                correggi_layer_interni(&rete_neurale, gradienti, sigmoidi);
--- a/percettroni.h
+++ b/percettroni.h
@@ -44,6 +44,9 @@ double *funzioni_attivazione_layer_double(Layer, double*);
 void correggi_layer_interni(ReteNeurale*, double**, double**);
 void correggi_layer_input(Layer*, double**, double**, byte*, int);
 double calcola_gradiente_layer(ReteNeurale, int, int, double**);
 void discesa_gradiente(ReteNeurale, double**, double**);
 int previsione(double);
 void salvaReteNeurale(const char*, ReteNeurale*);
@@ -211,7 +214,6 @@ void correggi_layer_interni(ReteNeurale *rete, double **gradienti, double **sigm
        }
    }
 }
 //Questa funzione prende tutti i parametri della precedente + gli input passati dal dataset per correggere il layer di ingresso
 void correggi_layer_input(Layer *layer, double **gradienti, double **sigmoidi, byte *inputs, int n_layers) {
    //L'indice del layer d'ingresso che prende byte per input
@@ -227,6 +229,39 @@ void correggi_layer_input(Layer *layer, double **gradienti, double **sigmoidi, b
    }
 }
 void discesa_gradiente(ReteNeurale rete, double **sigmoidi, double **gradienti) {
    //For che scorre i layer dal penultimo al primo QUINI SIZE -2
    for(int indice_layer = rete.size -2; indice_layer >= 0; indice_layer--) {
        //printf("Mi trovo nel layer %d, ho %d percettroni\n", indice_layer, rete.layers[indice_layer].size);
        //For che scorre i percettroni del layer partendo dal primo
        //Per ogni percettrone mi devo prendere il gradiente disceso dal livello sopra e moltiplicarlo per la derivata di attivazione
        for(int indice_percettrone = 0; indice_percettrone < rete.layers[indice_layer].size; indice_percettrone++) {
            double derivata_attivazione = sigmoidi[indice_layer][indice_percettrone] * (1 - sigmoidi[indice_layer][indice_percettrone]);
            //Passo anche l'indice del percettrone perchè corrisponde all'indice del peso del livello sopra
            double gradiente_disceso = calcola_gradiente_layer(rete, indice_layer + 1, indice_percettrone, gradienti);
            gradienti[indice_layer][indice_percettrone] = gradiente_disceso * derivata_attivazione;
        }
    }
 }
 double calcola_gradiente_disceso(ReteNeurale rete, int livello, int indice_peso, double **gradienti) {
    //printf("Qui ci arrivo\n");
    double sommatoria = 0.0;
    //printf("Layer %d: N_percettroni: %d\n", livello, rete.layers[livello].size);
    //Calcolo la sommatoria dei gradienti dei percettroni per i pesi
    for(int indice_percettrone = 0; indice_percettrone < rete.layers[livello].size; indice_percettrone++) {
        sommatoria += (gradienti[livello][indice_peso] * rete.layers[livello].percettroni[indice_percettrone].pesi[indice_peso]);
    }
    return sommatoria;
 }
 //Una volta finito il ciclo delle epoche viene salvato lo stato della rete neurale
 void salvaReteNeurale(const char *filename, ReteNeurale *rete) {
    FILE *file = fopen(filename, "wb");
--- a/BIN
+++ b/BIN