Cómo determinar si un archivo sin sufijo está codificado en GBK T
El rango de codificación GB2312-80 es el bit alto 0xa1-0xfe, y el bit bajo es 0xa1-0xfe. El rango de caracteres chinos es 0xb0a1 y 0xf7fe. , solo necesita verificar si el byte alto es mayor o igual a 0xa1 es suficiente, y el byte alto de los caracteres de ancho completo son todos iguales a 0xa3, por lo que es fácil distinguir los caracteres de ancho completo.
Unicode: FF, FE
Big endian Unicode: FE, FF
UTF-8: EF, BB, BF
Estos Puedes usar UltraEdit para verlo
Codificación GBK:
Primer byte: 0x81-0xFE (129-254)
Segundo byte: 0x40-0xFE (64 -254)
UTF-8: EF, BB, BF
Utilice este método para determinar si el archivo es Unicode.
Si no, entonces Según Para la codificación GB2312-80, el rango de codificación es el bit alto 0xa1-0xfe, el bit bajo es 0xa1-0xfe y el rango de caracteres chinos es 0xb0a1 y 0xf7fe.
El juicio es gb2312 o GBK. es un superconjunto de gb2312. Contienen relaciones.
Dicho en línea:
txt no tiene encabezado de archivo 1. Mire el nombre del sufijo 2. txt es contenido de texto (pero preste atención a varias codificaciones, que son las anteriores).
p>Varios encabezados de archivos comunes: formato hexadecimal
JPEG (jpg), encabezado de archivo: FFD8FF
PNG (png), encabezado de archivo: 89504E47 p> p>
GIF (gif), encabezado de archivo: 47494638
TIFF (tif), encabezado de archivo: 49492A00
Windows Bitmap (bmp), encabezado de archivo: 424D
CAD (dwg), encabezado de archivo: 41433130
Adobe Photoshop (psd), encabezado de archivo: 38425053
Formato de texto enriquecido (rtf), encabezado de archivo: 7B5C727466 p>
XML (xml), encabezado de archivo: 3C3F786D6C
HTML (html), encabezado de archivo: 68746D6C3E
Correo electrónico [solo completo]
( eml), encabezado de archivo: 44656C69766572792D646174653A
Outlook Express (dbx), encabezado de archivo: CFAD12FEC5FD746F
Outlook (pst), encabezado de archivo: 2142444E
MS Word/ Excel (xls.or.doc), encabezado de archivo: D0CF11E0
MS Access (mdb), encabezado de archivo: 5374616E64617264204A
WordPerfect (wpd), encabezado de archivo: FF575043 p>
Postscript. (eps.or.ps), encabezado de archivo: 252150532D41646F6265
Adobe Acrobat (pdf), encabezado de archivo: 255044462D312E
Quicken (qdf), encabezado de archivo : AC9EBD8F
Contraseña de Windows (pwl), encabezado de archivo: E3828596
Archivo ZIP (zip), encabezado de archivo: 504B0304
Archivo RAR (rar), archivo encabezado: 52617221
Wave (wav), encabezado de archivo: 57415645
AVI (avi), encabezado de archivo: 41564920
Real Audio (ram), encabezado de archivo : 2E7261FD
Real Media (rm), encabezado de archivo: 2E524D46
MPEG (mpg), encabezado de archivo: 000001BA
MPEG
(mpg), encabezado de archivo: 000001B3
Quicktime (mov), encabezado de archivo: 6D6F6F76
Windows Media (asf), encabezado de archivo: 3026B2758E66CF11
MIDI ( mid), encabezado del archivo: 4D546864
Utilice PilotEdit Lite,
PilotEdit Lite puede detectar automáticamente la codificación.
Por ejemplo, si ingresa "无" en un archivo de texto y luego lo vuelve a abrir, PilotEdit es el único editor de texto que puede reconocer correctamente este carácter chino.