Windows system >> Conocimiento de Windows > >> Tutorial del sistema Linux >> Sobre linux

Linux cómo usar la herramienta de procesamiento de texto awk

awk es una herramienta de procesamiento de texto en Linux, similar al lenguaje de programación de shell, tiene su propio lenguaje, las siguientes series pequeñas le mostrarán el uso de las herramientas de procesamiento de texto awk en Linux, interesados Los amigos pueden venir y averiguarlo.

Llamado

1.
comando

awk [-F campo separador] y lsquo; comandos ’ archivo de entrada (s)

los comandos son verdaderos comandos awk, [-F separadores de campo] son opcionales. El archivo (s) de entrada es el archivo a procesar. En awk, en cada línea de un archivo, cada elemento separado por un separador de dominio se denomina campo. Normalmente, en el caso del separador de dominio sin nombre -F, el separador de dominio predeterminado es un espacio (o pestaña).

2.shell modo de secuencia de comandos

Inserte todos los comandos awk en un archivo y haga que el programa awk sea ejecutable, luego el comando awk como la primera línea de la secuencia de comandos, escribiendo el nombre de la secuencia de comandos Llamado Equivalente a la primera línea del script de shell: #! /bin /sh se puede reemplazar con: #! /bin /awk -f

3. Inserte todos los comandos awk en un solo archivo, luego llame: awk -f awk-script-file input-file (s) donde la opción -f carga awk-script El script awk en -file, input-file (s) es el mismo que el anterior.

Variables incorporadas

ARGC: Número de argumentos de la línea de comando

ARGV: Argumentos de la línea de comando

AMBIENTE: Variables de entorno UNIX

ERRNO: Mensaje de error del sistema UNIX

NOMBRE DE ARCHIVO: nombre de archivo para la búsqueda de awk

OFMT: Número de formato de salida% .6g

FNR: Número de registros de archivos de navegación

FS: Establezca el separador de campo de entrada, equivalente a la línea de comando -F opción

NF: El número de campos para ver el registro

NR: El número de registros leídos, es decir, la línea Número, comenzando desde 1

FNR: Número actual de registros

OFS: Separador de campo de salida

ORS: Separador de registro de salida

RS: Control de registro Separador

$ 0: registro actual (como una sola variable)

$ 1 ~ $ n: el enésimo campo del registro actual, separado por FS

Función de salida < Br>

imprimir: los parámetros pueden ser variables, valores o cadenas. Las cadenas deben estar entre comillas dobles, separadas por comas. Sin una coma, los parámetros se concatenan y no se pueden distinguir. Aquí, el rol de la coma es el mismo que el separador del archivo de salida, pero este último es un espacio.

printf: su uso es básicamente similar a printf en lenguaje c, puede formatear la cadena, la salida es compleja , printf es más fácil de usar, el código es más fácil de entender. El formato específico es el siguiente:

% d entero con signo decimal

% u decimal sin signo entero

% f número de punto flotante

% s cadena

% c carácter único

% p puntero valor

% e número de punto flotante exponencial

% x% X sin signo en hexadecimal Entero

% o Entero sin signo en octal

% g Seleccionar automáticamente la representación apropiada

Obtener variable externa

1. Obtener normal Variables externas