¿Cómo eliminar puntos singulares para datos que no obedecen a la distribución normal?
Primero: para el primer piso, si desea hacer un modelo de regresión, puede transformar los datos. Si los datos no obedecen al supuesto normal, puede realizar un análisis de regresión. En cuanto a qué tipo de transformación utilizar, le sugiero que utilice la familia de transformaciones Box-Cox y controle el tipo de transformación a través de parámetros. El ejemplo que diste es un caso especial. Para obtener más detalles, consulte "Introducción a los modelos lineales" de Wang Songgui et al (P175).
Segundo: si desea hacer un modelo de regresión, pero centrarse en el análisis de impacto de los datos, le sugiero que utilice un modelo lineal generalizado. Para obtener más información, consulte el diagnóstico estadístico de Wei Bocheng et al., o alguna otra información relacionada. Hay mucha información en línea.
En tercer lugar, simplemente desea proponer algunos puntos singulares o puntos de alto impacto y no conoce ninguna información previa sobre la distribución de la muestra. Se recomienda utilizar algunos métodos no paramétricos, que generalmente son mejores, pero los datos son más efectivos. Un método no paramétrico típico es el bootstrap.