Files
ecoparasite-data-analyse/src/ecoparasite/completion/Completion.java

142 lines
4.9 KiB
Java
Raw Normal View History

package ecoparasite.completion;
2026-04-01 16:41:01 +02:00
import ecoparasite.input.InputFactory;
import ecoparasite.input.InputFileException;
import ecoparasite.input.RawData;
import ecoparasite.input.RawDataOverflow;
import ecoparasite.poisson.Mackerel;
import ecoparasite.poisson.Poisson;
import java.util.HashSet;
2026-04-01 16:41:01 +02:00
import java.util.concurrent.Callable;
import java.util.function.*;
2026-04-01 16:20:41 +02:00
/**
2026-04-01 16:41:01 +02:00
* Permet de faire de la complétion de données.
* Si une valeur est manquante, elle sera remplacé par la moyenne ou par regression linéaire.
2026-04-01 16:20:41 +02:00
*/
public class Completion {
2026-04-01 16:41:01 +02:00
/**
* Permet de remplacer les valeurs inexistantes d'un paramètre d'un HashSet par la moyenne des autres valeurs (non nulles).
* Exemple d'utilisation : T = Poisson, V = Double, getValue = Poisson::getInfestation, setValue = Poisson::setInfestation.
*
* @param list La liste de données cobaye.
* @param getValue La fonction (Getter) qui permet d'obtenir la valeur que l'on veut vérifier
* @param setValue La fonction (Setter) qui permet de remplacer la valeur si null.
* @return Le HashSet avec les valeurs remplacés.
* @param <T> Le type de données cobaye. Exemple : Poisson, Population
* @param <V> Le type de la donnée à vérifier, doit être un Wrapper Number. Exemple : Double.
*/
public static <T,V extends Number> HashSet<T> completeColumnsMoyenne(HashSet<T> list, Function<T,V> getValue, BiConsumer<T,V> setValue ){
2026-04-01 16:41:01 +02:00
Double mean = calculateMean(list, getValue);
for(T item : list){
if( getValue.apply(item) == null ){
setValue.accept( item, (V) mean);
}
}
2026-04-01 16:41:01 +02:00
return list;
}
2026-04-01 16:41:01 +02:00
/**
* Permet de calculer la moyenne d'une donnée des valeurs non nulles.
* @param list La liste de données cobaye.
* @param getValue La fonction qui permet d'obtenir la valeur de notre champ.
* @return La moyenne calculé.
* @param <T> Le type de données cobaye/ Exemple : Poisson
* @param <V> Le type de la donnée à vérifier, doit être un wrapper Number. Exemple : Double.
*/
public static <T,V extends Number> double calculateMean(HashSet<T> list, Function<T,V> getValue ){
2026-04-01 16:41:01 +02:00
double mean = 0.0;
int i = 0;
2026-04-01 16:41:01 +02:00
for( T item : list ){
V value = getValue.apply(item);
if( value != null) {
mean += value.doubleValue();
i++;
2026-04-01 16:20:41 +02:00
}
}
2026-04-01 16:41:01 +02:00
return mean / i;
}
2026-04-08 11:24:57 +02:00
/**
* Permet de remplacer les valeurs inexistantes par les valeurs les plus probables avec une regression linéaire
* @param list La liste des données
* @param getX Le getter de la valeur en x
* @param getY Le getter de la valeur en y
* @param setY Le Setter de la valeur en y qui est à compléter
* @return Une liste des valeurs compléters
* @param <T> Le type des données de la liste
* @param <V> Le type des données numériques
*/
2026-04-08 10:32:11 +02:00
public static <T,V extends Number> HashSet<T> completeColumnsLinear(HashSet<T> list, Function<T,V> getX, Function<T,V> getY, BiConsumer<T,V> setY ){
double meanX = calculateMean(list, getX);
double meanY = calculateMean(list, getY);
double a = calculateLinearA(list,getX,getY,meanX,meanY);
double b = calculateLinearB(meanX,meanY,a);
for(T item : list){
if( getY.apply(item) == null && getX.apply(item) != null ){
Double value = a * getX.apply(item).doubleValue() + b;
setY.accept( item, (V) value );
}
}
return list;
}
/**
* Permet de calculer le coefficient A de notre regression linéaire.
* @param list
* @param getX
* @param getY
* @param meanX
* @param meanY
2026-04-08 11:24:57 +02:00
* @return La valeur du a de la formule de regression linéaire
2026-04-08 10:32:11 +02:00
* @param <T>
* @param <V>
*/
public static <T,V extends Number> double calculateLinearA(
HashSet<T> list,
Function<T,V> getX,
Function<T,V> getY,
double meanX,
double meanY
){
double numerateur = 0.0;
double denominateur = 0.0;
for( T item : list ){
if( getX.apply(item) == null || getY.apply(item) == null ){
continue;
}
numerateur += ( getX.apply(item).doubleValue() - meanX ) * ( getY.apply(item).doubleValue() - meanY );
denominateur += ( getX.apply(item).doubleValue() - meanX ) * ( getX.apply(item).doubleValue() - meanX );
}
return numerateur / denominateur;
}
2026-04-08 11:24:57 +02:00
/**
* Permet de calculer b dans une regression linéaire
* @param meanX
* @param meanY
* @param valueA
* @return La valeur de b dans la formule de regression linéaire
*/
2026-04-08 10:32:11 +02:00
public static double calculateLinearB(
double meanX,
double meanY,
double valueA
){
return meanY - valueA * meanX;
}
}