Red de conocimiento informático - Material del sitio web - Cómo determinar si un archivo sin sufijo está codificado en GBK T

Cómo determinar si un archivo sin sufijo está codificado en GBK T

El rango de codificación GB2312-80 es el bit alto 0xa1-0xfe, y el bit bajo es 0xa1-0xfe. El rango de caracteres chinos es 0xb0a1 y 0xf7fe. , solo necesita verificar si el byte alto es mayor o igual a 0xa1 es suficiente, y el byte alto de los caracteres de ancho completo son todos iguales a 0xa3, por lo que es fácil distinguir los caracteres de ancho completo.

Unicode: FF, FE

Big endian Unicode: FE, FF

UTF-8: EF, BB, BF

Estos Puedes usar UltraEdit para verlo

Codificación GBK:

Primer byte: 0x81-0xFE (129-254)

Segundo byte: 0x40-0xFE (64 -254)

UTF-8: EF, BB, BF

Utilice este método para determinar si el archivo es Unicode.

Si no, entonces Según Para la codificación GB2312-80, el rango de codificación es el bit alto 0xa1-0xfe, el bit bajo es 0xa1-0xfe y el rango de caracteres chinos es 0xb0a1 y 0xf7fe.

El juicio es gb2312 o GBK. es un superconjunto de gb2312. Contienen relaciones.

Dicho en línea:

txt no tiene encabezado de archivo 1. Mire el nombre del sufijo 2. txt es contenido de texto (pero preste atención a varias codificaciones, que son las anteriores).

p>

Varios encabezados de archivos comunes: formato hexadecimal

JPEG (jpg), encabezado de archivo: FFD8FF

PNG (png), encabezado de archivo: 89504E47 p>

GIF (gif), encabezado de archivo: 47494638

TIFF (tif), encabezado de archivo: 49492A00

Windows Bitmap (bmp), encabezado de archivo: 424D

CAD (dwg), encabezado de archivo: 41433130

Adobe Photoshop (psd), encabezado de archivo: 38425053

Formato de texto enriquecido (rtf), encabezado de archivo: 7B5C727466

XML (xml), encabezado de archivo: 3C3F786D6C

HTML (html), encabezado de archivo: 68746D6C3E

Correo electrónico [solo completo]

( eml), encabezado de archivo: 44656C69766572792D646174653A

Outlook Express (dbx), encabezado de archivo: CFAD12FEC5FD746F

Outlook (pst), encabezado de archivo: 2142444E

MS Word/ Excel (xls.or.doc), encabezado de archivo: D0CF11E0

MS Access (mdb), encabezado de archivo: 5374616E64617264204A

WordPerfect (wpd), encabezado de archivo: FF575043

Postscript. (eps.or.ps), encabezado de archivo: 252150532D41646F6265

Adobe Acrobat (pdf), encabezado de archivo: 255044462D312E

Quicken (qdf), encabezado de archivo : AC9EBD8F

Contraseña de Windows (pwl), encabezado de archivo: E3828596

Archivo ZIP (zip), encabezado de archivo: 504B0304

Archivo RAR (rar), archivo encabezado: 52617221

Wave (wav), encabezado de archivo: 57415645

AVI (avi), encabezado de archivo: 41564920

Real Audio (ram), encabezado de archivo : 2E7261FD

Real Media (rm), encabezado de archivo: 2E524D46

MPEG (mpg), encabezado de archivo: 000001BA

MPEG

(mpg), encabezado de archivo: 000001B3

Quicktime (mov), encabezado de archivo: 6D6F6F76

Windows Media (asf), encabezado de archivo: 3026B2758E66CF11

MIDI ( mid), encabezado del archivo: 4D546864

Utilice PilotEdit Lite,

PilotEdit Lite puede detectar automáticamente la codificación.

Por ejemplo, si ingresa "无" en un archivo de texto y luego lo vuelve a abrir, PilotEdit es el único editor de texto que puede reconocer correctamente este carácter chino.