Cuénteme sobre el algoritmo de descomposición de LU de matriz CUDA. Por favor, da algunos consejos de varios dioses. Puede resolver puntos de bonificación posteriores.
No escribo programas CUDA, las siguientes son solo mis sugerencias
1. Escriba un programa para la descomposición de LU serial o descomposición cholesky en la CPU. Asegúrese de que el serial esté escrito. correctamente primero
(Tenga en cuenta que la descomposición de lu requiere un costo O(n^3), es decir, hay tres bucles, que parecen faltar en su programa)
2. Escriba el producto interno del vector x^ Ty, el vector de multiplicación de matrices y=Ax y la matriz de multiplicación de matrices C=AB programa cuda (m*n = m*k x k*n, las tres dimensiones deben ser diferentes, no solo cubre una amplia gama de situaciones, pero también facilita las pruebas), de modo que al menos Garantiza que pueda usar CUDA para controlar el bucle triple más simple
3 Haga una copia del programa de descomposición de LU en serie y cámbielo gradualmente a CUDA. Utilice la versión en serie original como referencia para la depuración