niente, non converge nemmeno con mnist

2025-02-14 16:55:56 +01:00
parent e49dcb42b7
commit b1104d9fb4
9 changed files with 48 additions and 40 deletions
--- a/percettroni.h
+++ b/percettroni.h
@@ -2,11 +2,15 @@
 #include <stdlib.h>
 #include <math.h>

+char *file_pesi = "rete_pesi.bin";
+char *file_immagini = "mnist/t10k-images.idx3-ubyte";
+char *file_label = "mnist/t10k-labels.idx1-ubyte";
+
 // Siccome il char è un byte che rappresenta il valore tra 0 e 255. Per evitare confusioni definisco il tipo "byte" come in Java
 typedef unsigned char byte;


-double LRE = 0.1;
+double LRE = 0.2;
 double soglia_sigmoide = 0.5;

 typedef struct {
@@ -47,7 +51,7 @@ ReteNeurale *caricaReteNeurale(const char*);
 //Questa funzione genera un valore reale random compreso nell'intervallo [-1, 1]
 double randomico() {
    // Genero numeri nell'intervallo [-1,1]
-    return ((double)(rand() % 101 * 0.01 * 2 ) -1);
+    return (double)((rand() / RAND_MAX) * -1);//((double)(rand() % 101 * 0.01 * 2 ) -1);
 }

 //Questa funzione inizializza il percettrone allocando la memoria in base al numero dei pesi che voglio ed inizializza il loro valore usando randomico()
@@ -130,6 +134,7 @@ double *funzioni_attivazione_layer_byte(Layer layer, byte *inputs) {
    
    for(int i = 0; i < layer.size; i++) {
        funzioni[i] = sigmoide_byte(layer.percettroni[i], inputs, layer.percettroni[i].size);
+        //printf("\tsigmoide layer input %f\n", funzioni[i]);
    }

    return funzioni;
@@ -142,6 +147,7 @@ double *funzioni_attivazione_layer_double(Layer layer, double *inputs) {
    
    for(int i = 0; i < layer.size; i++) {
        funzioni[i] = sigmoide_double(layer.percettroni[i], inputs, layer.percettroni[i].size);
+        //printf("\tsigmoide layer %d: %f\n", i, funzioni[i]);
    }

    return funzioni;
@@ -162,9 +168,9 @@ void correggi_layer_interni(ReteNeurale *rete, double **gradienti, double **sigm
        for(int indice_percettrone = 0; indice_percettrone < rete->layers[indice_layer].size; indice_percettrone++) {//Numero percettroni

            for(int indice_peso = 0; indice_peso < rete->layers[indice_layer].percettroni[indice_percettrone].size; indice_peso++) {//Numero pesi
-                gradienti[indice_layer][indice_percettrone] = gradienti[rete->size-1][0] * (sigmoidi[indice_layer][indice_percettrone] * (1 - sigmoidi[indice_layer][indice_percettrone]));
-                rete->layers[indice_layer].percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[indice_layer][indice_percettrone] * LRE * sigmoidi[indice_layer-1][indice_percettrone]);           
-                //rete->layers[indice_layer].percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[rete->size-1][0] * LRE * sigmoidi[indice_layer-1][indice_percettrone]);
+                //gradienti[indice_layer][indice_percettrone] = gradienti[rete->size-1][0] * (sigmoidi[indice_layer][indice_percettrone] * (1 - sigmoidi[indice_layer][indice_percettrone]));
+                //rete->layers[indice_layer].percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[indice_layer][indice_percettrone] * LRE * sigmoidi[indice_layer-1][indice_percettrone]);           
+                rete->layers[indice_layer].percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[rete->size-1][0] * LRE * sigmoidi[indice_layer-1][indice_percettrone]);
            }
            rete->layers[indice_layer].percettroni[indice_percettrone].bias += (gradienti[indice_layer][indice_percettrone] * LRE);
            //printf("bias: %f\n", rete->layers[indice_layer].percettroni[indice_percettrone].bias);
@@ -179,9 +185,9 @@ void correggi_layer_input(Layer *layer, double **gradienti, double **sigmoidi, b
    for(int indice_percettrone = 0; indice_percettrone < layer->size; indice_percettrone++) {//Numero percettroni
        for(int indice_peso = 0; indice_peso < layer->percettroni->size; indice_peso++) { //Numero pesi

-            gradienti[indice_layer][indice_percettrone] = gradienti[n_layers-1][0] * (sigmoidi[indice_layer][indice_percettrone] * (1 - sigmoidi[indice_layer][indice_percettrone]));
-            layer->percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[indice_layer][indice_percettrone] * LRE * inputs[indice_peso]);
-            //layer->percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[n_layers-1][0] * LRE * inputs[indice_peso]);
+            //gradienti[indice_layer][indice_percettrone] = gradienti[n_layers-1][0] * (sigmoidi[indice_layer][indice_percettrone] * (1 - sigmoidi[indice_layer][indice_percettrone]));
+            //layer->percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[indice_layer][indice_percettrone] * LRE * inputs[indice_peso]);
+            layer->percettroni[indice_percettrone].pesi[indice_peso] += (gradienti[n_layers-1][0] * LRE * inputs[indice_peso]);
        }
        layer->percettroni[indice_percettrone].bias += (gradienti[n_layers-1][0] * LRE);
    }