Copia de seguridad y restauración de Solr
En la actualidad, utilizamos principalmente la versión 6.x de solr, que también tiene funciones similares de copia de seguridad y restauración. Sin embargo, las pruebas reales encontraron que solo puede funcionar en un determinado núcleo y no puede funcionar en toda la colección. Lo que realmente se utiliza es el modo solrCloud de Solr, no el modo de copia de seguridad maestro o independiente.
Entonces, en este caso, solo podemos usar otros métodos para realizar copias de seguridad y restaurar datos.
Al consultar la documentación de ayuda de solr, descubrí que la API de la interfaz HTTP de solr tiene una función para eliminar una copia. Después de una inspección cuidadosa, descubrí que cuando se elimina la copia, los datos se pueden conservar sin eliminarlos. ¿No es esto exactamente lo que necesitamos?
Después de que todas las réplicas estén fuera de línea, state.json se convierte en:
La reconstrucción del índice en este momento informará un error porque ya existe.
Después de llamar a cada réplica mediante sondeo, toda la colección estará completamente fuera de línea.
Pero después de desconectarse, la colección todavía existe en la interfaz de Solr y todavía consume algunos recursos. Lo mejor que puede hacer es eliminar la información state.json porque solr todavía está escuchando este nodo en zookeeper.
Cuando te conectes, restaurarás varias réplicas en orden, aunque el orden no importa cuál réplica se restaura primero.
La declaración de recuperación es la siguiente:
mand=backupamp; location=/data/aus/tmpDiramp; name=test4_ 20180109140508amp; :
p>1. Ubicación: es la ubicación de los datos a respaldar /data/aus/tmpDir debe existir y tener permisos en el 23 host.
2. nombre: es el nombre del sufijo de la carpeta de copia de seguridad. Según la operación anterior, la carpeta real es: test4_20180109140508
3. Las carpetas en el directorio de copia de seguridad son. Todos los datos del índice, no incluyen registros de transacciones.
4. Si no se proporciona ningún parámetro de nombre, la información de la marca de tiempo es snapshot.xxxxx xxxx.
5. numberToKeep es el número máximo de copias de seguridad que se pueden guardar y pueden proporcionarse o no.
La propia API de Solr puede operar en toda la colección, pero solo puede operar en la API llamada y no puede realizar operaciones distribuidas.
Pasos de copia de seguridad:
1) Cada nodo solr debe llamar a las siguientes operaciones:
mand=backupamp; =test4_20180109140508amp; wt=json
Nota:
1. Ubicación: es la ubicación de los datos a respaldar /data/aus/tmpDir debe existir en el host número 23 y. tiene permisos.
2. nombre: es el nombre del sufijo de la carpeta de copia de seguridad. Según la operación anterior, la carpeta real es: test4_20180109140508
3. Las carpetas en el directorio de copia de seguridad son. Todos los datos del índice, no incluyen registros de transacciones.
4. Si no se proporciona el parámetro de nombre, la información de la marca de tiempo es snapshot.xxxxx xxxx.
5. numberToKeep es el número máximo de copias de seguridad que se pueden guardar, que pueden proporcionarse o no.
El método de llamada para restaurar la información recopilada es el siguiente:
mand=restoreamp;/data/aus/tmpDiramp;
Nota:
1. nombre no puede proporcionar el nombre completo con el mismo nombre que la copia de seguridad original.
2. Si teme que tomará demasiado tiempo, puede proporcionar una identificación asincrónica con el parámetro: async = xxxid y luego ver los resultados de la ejecución llamando a:
/admin/collections?action=REQUESTSTATUSamp; requestid=request-id
3. Para replicationFactor y max, utilice "request-id". autoAddReplicas también proporciona funcionalidad de reescritura para replicationFactor y maxShardsPerNode.
Ventajas y desventajas del programa:
Ventajas: Todo el proceso es sencillo, con pocos parámetros las copias de seguridad aparecen en forma de carpetas, que son fáciles de comprimir o almacenar en diferentes lugares;
Desventajas: no se pueden realizar copias de seguridad de varios casos en un nodo Solr porque también hay replicación y variables que consumen mucho tiempo, se pueden utilizar métodos asincrónicos.