Hola, ¿cómo definir el tipo de punto flotante de media precisión float16 en lenguaje C?
En las CNN en el campo del aprendizaje profundo, el tipo float16 se usa a menudo para la compresión de modelos y la inferencia acelerada porque float32 ocupa demasiado espacio.
En numpy:
float16 número de coma flotante de media precisión, que incluye 1 bit de signo, 5 bits de exponente y 10 bits de mantisa
float32 flotante de precisión simple número de punto Número de punto, que incluye: 1 bit de signo, 8 bits de exponente, 10 bits de mantisa: 1 bit de signo, 8 bits de exponente, 23 bits de mantisa
float64 Número de punto flotante de doble precisión, que incluye: 1 bit de signo: 1 bit de señal. 11 bits de exponente, 52 bits de mantisa
Pero float16 existe en algunos marcos de inferencia relacionados con chips (implementaciones de c/c++) y no está claro cómo se implementa.