La manipulación de texto es una habilidad esencial en GNU/Linux, ya que permite procesar, transformar y analizar datos de forma rápida y eficiente. En la CLI, contamos con una amplia variedad de herramientas que nos facilitan el trabajo con archivos de texto, desde operaciones simples de visualización hasta tareas complejas de filtrado y edición.
cat
Muestra el contenido completo de un archivo en la terminal.
Ejemplo:
cat archivo.txt
less y more
Permiten visualizar archivos largos de manera paginada, facilitando la navegación.
Ejemplo:
less archivo.txt
grep Busca patrones o cadenas de texto dentro de archivos utilizando expresiones regulares.
Ejemplo:Consejo: Usa opciones como i
para búsqueda insensible a mayúsculas/minúsculas y r
para búsqueda recursiva.
grep "ERROR" /var/log/sistema.log
sed
Editor de flujo que permite realizar sustituciones, borrados o inserciones en el texto sin abrir un editor interactivo.
Ejemplo:
sed 's/viejo/nuevo/g' archivo.txt
Nota: La opción -i
modifica el archivo original de forma in-situ.
awk
Un lenguaje y herramienta poderosa para el procesamiento de texto basada en patrones y campos.
Ejemplo:
awk '{print $1}' archivo.txt
Este comando imprime la primera columna de cada línea, asumiendo que los campos están separados por espacios.
cut
Extrae secciones específicas de cada línea de un archivo, ideal para trabajar con datos delimitados (como CSV).Ejemplo:
Aquí, d','
especifica que la coma es el delimitador, y f2
indica que se extrae el segundo campo.
cut -d',' -f2 datos.csv
sort
Ordena las líneas de un archivo o entrada estándar.
Ejemplo:
sort archivo.txt
uniq
Elimina líneas duplicadas consecutivas. Para que funcione de manera óptima, generalmente se utiliza junto con sort
.
Ejemplo:
sort archivo.txt | uniq
tr
Traduce o elimina caracteres. Es útil para cambiar el formato de cadenas.
Ejemplo:
echo "hola mundo" | tr 'a-z' 'A-Z'
Este comando convierte la cadena a mayúsculas.
wc
Cuenta líneas, palabras y caracteres.
Ejemplo:
wc archivo.txt
Puedes usar opciones como -l
para contar solo líneas, -w
para palabras y -c
para caracteres.