Cómo leer remotamente datos HDFS en hadoop desde CDH
Debe agregar la ruta del puerto de HDFS en la configuración instanciada. No se requiere ningún archivo de configuración excepto el paquete jar de hadoop. El código principal es el siguiente:
static Configuration conf=new Configuration()
static Configuration conf=new Configuration(); p >
static FileSystem fs=null;
static{
try {
//El número de puerto FS predeterminado de fs.hadoop predeterminado es 8020 y debe coincidir con La configuración del clúster es la misma
conf.set("fs. defaultFS", "hdfs://dnode1:8020/"); .get(conf);
p>} catch (IOException e) {
log.error("¡Error al inicializar el sistema de archivos!", e);
}
}
OK, con esta simple línea, podemos leer los datos en HDFS