Files
ecoparasite-data-analyse/src/ecoparasite/completion/Completion.java

68 lines
2.4 KiB
Java
Raw Normal View History

package ecoparasite.completion;
2026-04-01 16:41:01 +02:00
import ecoparasite.input.InputFactory;
import ecoparasite.input.InputFileException;
import ecoparasite.input.RawData;
import ecoparasite.input.RawDataOverflow;
import ecoparasite.poisson.Mackerel;
import ecoparasite.poisson.Poisson;
import java.util.HashSet;
2026-04-01 16:41:01 +02:00
import java.util.concurrent.Callable;
import java.util.function.*;
2026-04-01 16:20:41 +02:00
/**
2026-04-01 16:41:01 +02:00
* Permet de faire de la complétion de données.
* Si une valeur est manquante, elle sera remplacé par la moyenne ou par regression linéaire.
2026-04-01 16:20:41 +02:00
*/
public class Completion {
2026-04-01 16:41:01 +02:00
/**
* Permet de remplacer les valeurs inexistantes d'un paramètre d'un HashSet par la moyenne des autres valeurs (non nulles).
* Exemple d'utilisation : T = Poisson, V = Double, getValue = Poisson::getInfestation, setValue = Poisson::setInfestation.
*
* @param list La liste de données cobaye.
* @param getValue La fonction (Getter) qui permet d'obtenir la valeur que l'on veut vérifier
* @param setValue La fonction (Setter) qui permet de remplacer la valeur si null.
* @return Le HashSet avec les valeurs remplacés.
* @param <T> Le type de données cobaye. Exemple : Poisson, Population
* @param <V> Le type de la donnée à vérifier, doit être un Wrapper Number. Exemple : Double.
*/
public static <T,V extends Number> HashSet<T> completeColumnsMoyenne(HashSet<T> list, Function<T,V> getValue, BiConsumer<T,V> setValue ){
2026-04-01 16:41:01 +02:00
Double mean = calculateMean(list, getValue);
for(T item : list){
if( getValue.apply(item) == null ){
setValue.accept( item, (V) mean);
}
}
2026-04-01 16:41:01 +02:00
return list;
}
2026-04-01 16:41:01 +02:00
/**
* Permet de calculer la moyenne d'une donnée des valeurs non nulles.
* @param list La liste de données cobaye.
* @param getValue La fonction qui permet d'obtenir la valeur de notre champ.
* @return La moyenne calculé.
* @param <T> Le type de données cobaye/ Exemple : Poisson
* @param <V> Le type de la donnée à vérifier, doit être un wrapper Number. Exemple : Double.
*/
public static <T,V extends Number> double calculateMean(HashSet<T> list, Function<T,V> getValue ){
2026-04-01 16:41:01 +02:00
double mean = 0.0;
int i = 0;
2026-04-01 16:41:01 +02:00
for( T item : list ){
V value = getValue.apply(item);
if( value != null) {
mean += value.doubleValue();
i++;
2026-04-01 16:20:41 +02:00
}
}
2026-04-01 16:41:01 +02:00
return mean / i;
}
}