Ver codificación de archivo, conversión de formato de codificación de archivo y conversión de codificación de nombre de archivo en Linux

  

Si necesita manipular archivos en Windows en Linux, a menudo puede encontrar problemas con la conversión de codificación de archivo. El formato de archivo predeterminado en Windows es GBK (gb2312), mientras que Linux es generalmente UTF-8. Aquí se explica cómo ver la codificación de un archivo y cómo codificar y convertir un archivo en Linux. Visualización de codificaciones de archivos Hay varias formas de ver las codificaciones de archivos en Linux: 1. Puede ver la codificación de archivos directamente en Vim: configure la codificación de archivos para mostrar el formato de codificación de archivos. Si lo que desea es ver los archivos en otros formatos o desea resolver codificación de archivo ilegible ver con el problema de Vim, a continuación, puede añadir lo siguiente a ~ /.vim archivo rc: set encoding = UTF-8 fileencodings = UCS-bom, UTF 8, cp936 esta manera, puede dejar que vim reconoce automáticamente la codificación del archivo (reconoce automáticamente UTF-8 o GBK archivos codificados), de hecho, de acuerdo con la lista de codificación intentos fileencodings siempre, si no es adecuada codificación encontrado, con Latin-1 ( La codificación ASCII) está activada. 1. codificación del archivo de conversión en la conversión directa Vim codificación de archivos, como la conversión de un archivo en un formato UTF-8: set fileEncoding = conversión UTF-8 2. iconv, iconv formato de comando es el siguiente: iconv -f codificación -t codificación InputFile Por ejemplo, para convertir a archivos UTF-8 codificado en GBK codificación iconv -f -t GBK UTF-8 archivo1 archivo2 -o fichero de conversión de codificación de nombres: copiar archivos en windows o Linux para copiar archivos desde las ventanas, archivos veces chinos de Linux la razón del nombre situación ilegible, este problema porque, ventanas nombre de archivo predeterminado es codificada chino GBK, y el nombre de archivo por defecto de Linux se codifica como UTF-8, debido a las inconsistencias en la codificación, lo que resulta en un problema ilegible nombre de archivo, para resolver este problema El nombre del archivo debe ser transcodificado. En Linux, se proporciona una herramienta convmv especialmente para convertir la codificación del nombre del archivo. El nombre del archivo se puede convertir de GBK a codificación UTF-8, o de UTF-8 a GBK. Primero observe si convmv está instalado en su sistema. Si no está instalado, use: yum -y instale convmv para instalar. He aquí un vistazo a convmv uso específico: convmv -f -t nueva fuente de codificación de codificación [opciones] archivo parámetros comunes: -r subcarpetas procesamiento recursivo --notest reales de operación, tenga en cuenta que el archivo no es cierto por defecto Operativo, pero solo de prueba. display --list todos codificación soportado --unescap qué se puede hacer para escapar, tal como el 20% que se han convertido en un espacio tal como un nombre de archivo UTF8 codificada, convertido a la codificación GBK, comando es la siguiente: convmv -f UTF-8 -t GBK nombre --notest utf8 archivo codificado después de dicha conversión " name &archivo UTF8 codificada quot; se convertirá en GBK codificación (sólo el nombre de archivo de conversión de codificación, el contenido del archivo no cambiará) la configuración y toda la codificación vim Al igual que los editores de texto populares, Vim puede editar fácilmente una variedad de archivos codificados con caracteres, que por supuesto incluyen codificaciones populares de Unicode como UCS-2 y UTF-8. Sin embargo, desafortunadamente, como muchos software del mundo Linux, esto requiere que lo configure usted mismo. Vim tiene cuatro opciones con la codificación de caracteres relacionados, codificación, fileEncoding, fileencodings, termencoding (estas opciones posibles valores se refieren a la ayuda en línea de Vim: ayuda de codificación de nombres), sus significados son los siguientes: * codificación: uso interno vim Codificación de caracteres, incluido el búfer de Vim, el texto del menú, el texto del mensaje y más. El valor predeterminado se basa en la selección de la configuración regional. Se recomienda en el manual del usuario cambiar su valor solo en .vimrc. De hecho, parece que solo tiene sentido cambiar su valor en .vimrc. Se puede utilizar otro sistema de codificación editar y guardar archivos, como la codificación de la utilización de su cp936 vim codificación UTF-8, el archivo editado, vim lee automáticamente un archivo en UTF-8 puede ser leído (a vim entender la forma), y cuando se escribe en un archivo, se cambiará automáticamente a cp936 (guardar archivos codificados) * fileEncoding :. Vim codificación de caracteres en la corriente de los archivos editados, Vim guardar el archivo al guardar archivos Para este tipo de codificación de caracteres (independientemente de si es un archivo nuevo o no). * Fileencodings: Vim detecta automáticamente fileEncoding el orden de la lista, se seguirá la codificación de caracteres que aparece uno por uno para detectar la codificación de caracteres está a punto de abrir archivos en el arranque, y fileEncoding establece como la última codificación de caracteres detectado. Así que es mejor poner la codificación Unicode en la parte superior de la lista y poner el método de codificación latino latin1 al final. * termencoding: la codificación de caracteres del terminal en el que trabaja Vim (o la ventana de la consola de Windows). Si el término en el que se encuentra vim es el mismo que el de la codificación vim, no se requiere configuración. De lo contrario, puede usar la opción termencoding de vim para convertir automáticamente al término codificación. Esta opción no es válida para gVim en nuestro modo GUI habitual en Windows, y es la página de códigos de la consola de Windows para Vim en modo Consola, y Normalmente no necesitamos cambiarlo. Bien, vamos a explicar el conjunto de parámetros que hacen que los novatos se confundan fácilmente. Veamos cómo funciona el soporte de codificación de caracteres múltiples de Vim. 1. Vim se inicia y establece la codificación de caracteres del búfer, el texto del menú y el texto del mensaje según el valor de codificación establecido en .vimrc. 2. Lea los archivos que deben editarse y detecte el método de codificación de archivos uno por uno de acuerdo con el método de codificación de caracteres que se indica en las codificaciones de archivos. Y configurar la codificación de archivos para que se detecte, parece ser una codificación de caracteres correcta (Nota 1). 3. Compare los valores de codificación de archivo y codificación. Si son diferentes, llame a iconv para convertir el contenido del archivo a la codificación de caracteres descrita por codificación, y coloque el contenido convertido en el búfer abierto para este archivo. Ahora podemos comenzar a editar. Este archivo se ha ido. Tenga en cuenta que para completar este paso debe llamar a iconv.dll externo (Nota 2). Debe asegurarse de que el archivo existe en $ VIMRUNTIME u otros directorios enumerados en la variable de entorno PATH. 4. Cuando guarde el archivo después de completar la edición, compare los valores de codificación de archivo y codificación nuevamente. Si es diferente, llame nuevamente a iconv para convertir el texto en el búfer para guardarlo en la codificación de caracteres descrita por codificación de archivo y guárdelo en el archivo especificado. Una vez más, esto se debe a la necesidad de llamar iconv.dll puede contener caracteres Unicode en casi todos los idiomas, y el Unicode UTF-8 codificación de codificación es muy rentable (UCS-2 consumo de espacio que los pequeños), se recomienda valores de codificación Establecer en utf-8. Otra razón para hacer esto es que cuando la codificación se establece en utf-8, Vim detecta automáticamente cómo se codifica el archivo con mayor precisión (tal vez esta sea la razón principal). Los archivos que editamos en Windows chino, para equilibrar la compatibilidad con otro software, la codificación del archivo aún está configurada en GB2312 /GBK es más apropiada, por lo que la recomendación de codificación de archivo está configurada en chino (chino es el nombre individual, en Unix, gb2312, en Windows) Cp936, que es la página de códigos de GBK).

Copyright © Conocimiento de Windows All Rights Reserved