Rida, Ricostruzione Informazioni con Donazione Automatica, è un metodo di correzione delle variabili errate (individuate in una fase precedente di check) che utilizza la metodologia del donatore. In poche parole, la correzione si esegue prelevando la risposta da un record corretto simile al record errato. La similitudine si calcola utilizzando alcune variabili, dette di "match", scelte sulla base della loro correlazione con la variabile da correggere.
Questo metodo presuppone che le variabili di match utilizzate per calcolare la distanza, misura matematica della similitudine fra record errato e donatore, siano corrette.
Per la ricerca del donatore si dovrebbe confrontare il record errato con tutti i record esatti e scegliere quello con distanza minima. Si dovrebbero individuare più donatori per i record con più variabili errate, reiterando i calcoli.
RIDA permette d’accelerare i tempi di calcolo individuando il donatore con una funzione di distanza mista, su un insieme ristretto di record, eliminando subito quelli con distanze più elevate.
Le variabili, utilizzate per individuare la similitudine fra i record, si distinguono in variabili di strato e variabili match.
Le variabili di strato s'utilizzano per individuare gruppi di record, relativamente numerosi, che definiscono insiemi non simili fra loro. La ricerca del donatore s'esegue all’interno degli strati, limitando il numero dei confronti.
Le variabili di match s'utilizzano per calcolare la funzione di distanza mista minima per tutti i record dello strato. Il donatore sarà più vicino al record errato, cioè quello con distanza minima.
RIDA è stato sviluppato da C.Runci, T.Buglielli e R.Colosi su workstation UNIX e si lancia con il comando rida
