Cómo instalar wgt en un servidor Linux
Wget puede rastrear enlaces en páginas HTML y descargarlos en secuencia, crear una versión local del servidor remoto y reconstruir completamente la estructura de directorios del sitio original. A esto se le suele llamar "descarga recursiva". Al realizar descargas recursivas, wget sigue los criterios de exclusión de robots (/robots.txt). wget puede convertir enlaces en archivos locales durante la descarga, lo que facilita la navegación sin conexión.
Wget es muy estable y altamente adaptable cuando el ancho de banda es estrecho y la red es inestable. Si la descarga falla por motivos de red, wget seguirá intentándolo hasta que se descargue el archivo completo. Si el servidor interrumpe el proceso de descarga, se conectará nuevamente al servidor y reanudará la descarga desde donde se detuvo. Esto es útil para descargar archivos grandes desde servidores con tiempos de enlace limitados.
1. Formato del comando:
wget[parámetro] [dirección URL]
2. Función del comando:
Se utiliza para descargar desde. la red Descargar recursos sin especificar un directorio Los recursos descargados se encuentran de forma predeterminada en el directorio actual. Aunque wget es poderoso, es relativamente simple de usar:
1) Admite la función de descarga de punto de interrupción, este también fue el mayor punto de venta de netants y FlashGet en esos años. Ahora Wget también puede utilizar esta función, y aquellos usuarios cuya red no sea muy buena pueden estar tranquilos;
2) Admite dos modos de descarga: FTP y HTTP, aunque la mayoría del software ahora se puede descargar a través de HTTP; A veces todavía es necesario descargar software a través de FTP.
3) Admite servidor proxy; para sistemas con alta intensidad de seguridad, el sistema generalmente no está expuesto directamente a Internet, por lo que admitir proxy es una función necesaria para descargar software.
4) La configuración es conveniente y simple; quizás los usuarios que están acostumbrados a las interfaces gráficas no estén acostumbrados a la línea de comando, pero la línea de comando en realidad tiene más ventajas en la configuración. Al menos, el mouse puede hacerlo. se puede hacer clic muchas veces menos y no hay necesidad de preocuparse por si el mouse hace un clic incorrecto;
5) El programa es pequeño y se pueden considerar programas pequeños porque el disco duro actual también lo es; grande; debemos considerar la libertad total. Aunque hay muchos programas llamados gratuitos en Internet, los anuncios de estos programas no son lo que nos gustan.
3. Parámetros del comando:
Parámetros de inicio:
-V, -version muestra la versión de wget y sale.
-h, ayuda imprime ayuda de sintaxis
-b, -Una vez iniciado el fondo, se transferirá al fondo para su ejecución.
-e, -execute=COMMAND ejecuta el comando en `. Formato "wgetrc". Consulte /etc/wgetrc o ~/.wgetrc para conocer el formato wgetrc.
Registra e ingresa los parámetros del archivo:
-o, -output-FILE=FILE escribe el registro en el archivo.
-a,-append-output=FILE Agregar registros a un archivo.
-d, -debug imprime la salida de depuración
-q, -modo silencioso (sin salida)
-v, -modo detallado (este es el configuración predeterminada)
-nv, -non-verbose desactiva el modo detallado, pero no desactiva el modo silencioso.
-i,-input-FILE=FILE Descarga la URL que aparece en el archivo FILE.
-F, -force-html trata los archivos de entrada como archivos html.
-B, -base=URL antepone la URL como un enlace relativo que aparece en el archivo especificado por el parámetro -F -i.
–-sslcertfile = ARCHIVO certificado de cliente opcional
–-sslcertkey =Archivo de clave para el certificado de cliente opcional.
–egd-file = file especifica el nombre de archivo del socket EGD.
Parámetros de descarga:
–bind-bind-ADDRESS = DIRECCIÓN especifica la dirección local (nombre de host o IP, utilizada cuando hay varias IP o nombres localmente).
-t, -tries=NUMBER establece el número máximo de intentos de enlace (0 significa ilimitado).
-O –- O-output-document = FILE escribe el documento en un archivo.
-nc,-no-clobber No sobrescribe archivos existentes ni los utiliza. #prefijo.
-c, -Continuar y descargar los archivos sin terminar.
–progress=Establece la bandera de la barra de progreso.
-N, -timestamp No vuelve a descargar el archivo a menos que sea más reciente que el archivo local.
-s, –server-response imprime la respuesta del servidor.
-La araña no descarga nada.
-T, -timeout=SECONDS establece el número de segundos para el tiempo de espera de respuesta.
-w,-wait=SECONDS El intervalo entre dos intentos es de segundos.
–-Esperar reintento = Número de segundos de espera entre reenlaces 1... segundos.
–-random-WAIT Espere 0…2* segundos entre descargas.
-Y,-proxy=on/off activa o desactiva el proxy.
-Q, -quota=NUMBER establece el límite de capacidad de descarga.
–-limit-RATE = RATE = RATE limita la velocidad de descarga.
Parámetros del directorio:
-nd-no-directory no crea un directorio.
-x, -force-directory fuerza la creación del directorio.
-nH,-no-host-directory no creará un directorio de host.
-P,-directory-prefix=PREFIJO Guardar archivos en el prefijo de directorio/…
--cut-cut-dirs=NÚMERO Ignorar directorios remotos para la capa #.
Parámetros de opciones HTTP:
–/WordPress-3.1-zh_cn.zip
Descripción:
El siguiente ejemplo es de Descargar un archivo de Internet y guárdelo en el directorio actual. Durante el proceso de descarga, se mostrará una barra de progreso que incluye (porcentaje de finalización de la descarga, bytes de descarga, velocidad de descarga actual y tiempo de descarga restante).
Ejemplo 2: use wget -O para descargar y guardar con diferentes nombres de archivo.
Comando:
: wget -O WordPress zip/descargar . id=1080
Descripción:
De forma predeterminada, wget utilizará el último carácter que coincida con "/" para ejecutar el comando. Para descargar enlaces dinámicos, el nombre del archivo suele ser incorrecto.
Error: El siguiente ejemplo descargará un archivo llamado download.aspx? Id=1080 guardar.
wget/descargar? id=1
Aunque el archivo descargado está en formato zip, ¿todavía está descargado? ID=1080 comando.
Correcto: Para resolver este problema, podemos usar el parámetro -O para especificar un nombre de archivo:
wget-O WordPress zip/download . id=1080
Ejemplo 3: use wget -limit -rate para descarga con velocidad limitada
Comando:
wget-limit-rate = 300k/WordPress- 3.1 -zh _ cn . zip
Descripción:
Cuando ejecutas wget, todas las descargas de ancho de banda posibles estarán ocupadas de forma predeterminada. Pero cuando vas a descargar un archivo grande y necesitas descargar otros archivos, es necesario acelerar.
Ejemplo 4: utilice el punto de interrupción wget -c para continuar la transmisión
Comando:
wget-c/WordPress-3.1-zh _ cn . >
Descripción:
Usar wget -c para reiniciar la descarga de archivos interrumpidos es muy útil para descargar archivos grandes que se interrumpen repentinamente debido a la red y otras razones. Podemos continuar descargando en lugar de volver a descargar un archivo. Cuando necesite reanudar una descarga interrumpida, puede utilizar el parámetro -c.
Ejemplo 5: use wget -b para descarga en segundo plano
Comando:
wget-b/WordPress-3.1-zh _ cn .
Descripción:
Para descargar archivos muy grandes, podemos usar el parámetro -b para la descarga en segundo plano.
wget-b/WordPress-3.1-zh_cn . zip
Continuar en segundo plano, pid 1840.
La salida se escribirá en "wget-log".
Puedes verificar el progreso de la descarga usando el siguiente comando:
tail -f wget-log
Ejemplo 6: Descarga de nombre de proxy disfrazado
Comando:
wget-user-agent = "Mozilla/5.0(Windows;u;windows NT 6.1;en-US)apple WebKit/534.16(KHTML, como gecko)Chrome/10.0 . 648 . 204 Safari/534.16 "/WordPress-3.1-zh _ cn . zip
Descripción:
Algunos sitios web pueden rechazar su solicitud de descarga al considerar que el nombre del proxy no es un navegador. Sin embargo, puedes falsificarlo mediante el parámetro --user-agent.
Ejemplo 7: utilice wget -spider para probar el enlace de descarga
Comando:
wget - spider URL
Descripción: p>
Cuando planee descargar regularmente, debe probar si el enlace de descarga funciona a la hora programada. Podemos agregar el parámetro araña para verificar.
wget - URL de araña
Si el enlace de descarga es correcto, se mostrará.
wget - URL de araña
Habilitar el modo araña. Compruebe si el archivo remoto existe.
Solicitud HTTP enviada, esperando respuesta...200 OK
Longitud: sin especificar [text/html]
El archivo remoto existe y puede contener enlaces adicionales ,
pero la recursividad está deshabilitada: no se puede recuperar.
Esto garantiza que la descarga se completará a la hora programada, pero cuando proporcionas un enlace incorrecto, se mostrará el siguiente error.
wget - URL de araña
Habilita el modo araña. Compruebe si el archivo remoto existe.
Solicitud HTTP enviada, esperando respuesta...404 No encontrado
El archivo remoto no existe - ¡enlace roto! ! !
Puedes utilizar el parámetro spider en las siguientes situaciones:
Para programar una verificación previa a la descarga.
Comprueba que el sitio web esté disponible cada cierto tiempo.
Comprueba si hay enlaces inactivos en las páginas del sitio web.
Ejemplo 8: uso de wget: intenta aumentar el número de reintentos
Comando:
wget: URL de intentos=40
Descripción :
Si hay un problema con la red, o la descarga de archivos grandes también puede fallar. De forma predeterminada, Wget volverá a intentar descargar un archivo 20 veces. Si es necesario, puede utilizar --try para aumentar el número de reintentos.
Ejemplo 9: use wget -i para descargar varios archivos
Comando:
wget -i lista de archivos
Descripción:
Primero, guarde un archivo de enlace de descarga.
cat gtfilelist.txt
url1
url2
url3
url4
Luego use este archivo y el parámetro -i para descargar.
Ejemplo 10: utilice wget -mirror para reflejar el sitio web.
Comando:
wget-mirror-P-convert-links-P ./local URL
Descripción:
Convierte todo el sitio web Descargar a local.
––Mirror: Descarga del espejo de apertura de cuenta
-p: Descarga todos los archivos que se muestran normalmente en la página html.
--Convert-Link: después de la descarga, conviértalo en un enlace local.
-P ./LOCAL: guarda todos los archivos y directorios en el directorio local especificado.
Ejemplo 11: use wget -reject para filtrar descargas en un formato específico.
Comando:
wget - rechazar=gif ur
Descripción:
Para descargar un sitio web, pero no quiero descargarlo imágenes, puede utilizar el siguiente comando.
Ejemplo 12: use wget -o para almacenar información de descarga en un archivo de registro.
Comando:
wget -o download.log URL
Descripción:
No desea que la información descargada se muestre directamente en la terminal pero en el archivo de registro, puedes usarlo.
Ejemplo 13: Utilice wget -Q para limitar el tamaño total de los archivos descargados.
Comando:
wget -Q5m -i file list.txt
Descripción:
Cuando desea descargar un archivo que supera los 5 M y se puede utilizar al salir de la descarga. Nota: Este parámetro no se aplica a descargas de archivos individuales y solo es efectivo durante descargas recursivas.
Ejemplo 14: utilice wget -r -A A para descargar archivos en el formato especificado.
Comando:
wget -r -A.pdf url
Descripción:
Puedes utilizar esta función en las siguientes situaciones:
Descargar todas las imágenes de un sitio web.
Descargar todos los vídeos de un sitio web.
Descargar todos los archivos PDF de un sitio web.
Ejemplo 15: Descarga usando wget FTP
Comando:
wget ftp-url
wget-FTP-user =nombre de usuario- FTP -PASSWORD = url de contraseña
Descripción:
Puedes usar wget para descargar el enlace ftp.
Descarga ftp anónima usando wget:
wget ftp-url
Descarga ftp usando autenticación de nombre de usuario y contraseña de wget
wget-FTP - usuario=nombre de usuario-FTP-PASSWORD=contraseña url
Nota: compilar e instalar
Utilice los siguientes comandos para compilar e instalar:
# tar zxvf wget- 1 . 9 . . tar . gz
# cd wget-1.9.1
# ./configuración
#fabricación
#Instalar