Técnica de análisis de URLs para una auditoría SEO

¿Eres un “experto” que no sabe hacer una auditoría SEO técnica?…

No, no voy a hacer “sangre” de los supuestos “Expertos” SEO, pero os recuerdo la frase de mi amigo y excelente profesional, Fernando Muñoz:

En España hay mucho SEO porque hay mucho WP
Señor Muñoz

Y es que hacer SEO no es sólo escribir contenidos que contengan la palabra clave, ni recomendar WP porque es un CMS SEO friendly o porque podemos añadirle de manera sencilla algunos plugins que lo optimizarán más: un SEO debe saber hacer una auditoría SEO técnica, y -entre otros factores importantes que debemos analizar se encuentra la estructura de las URLs del sitio web.
Un SEO debe detectar qué URLs están provocando problemas como:

  • Contenido duplicado
  • Contenido que no necesitamos indexar
  • Errores 404 u otros…

Y debe saber proponer las acciones de optimización y mejora necesarias para conseguir un buen posicionamiento en buscadores, porque un SEO es fundamentalmente un técnico analista y no un COMMUNITY MANAGER (que no digo que este perfil no sea útil para un negocio…pero no es SEO ni vale para todo)
NOTA: hay muchos profesionales que saben hacer un poco de todo…pero eso no los hace expertos y -si lo sacas de un CMS más o menos amigable o lo pones frente a un sitio hecho ‘a medida’ ¡se acabó el experto!

En este post voy a explicar paso a paso una técnica para analizar la estructura de URLs de un sitio web, para que tu auditoría SEO no se quede corta.

Cómo hacer un análisis de URLs para una auditoría SEO técnica

1) Extraer el listado de URLs a analizar

Para esta tarea usaremos un crawler como Xenu’s Link Seleuth (gratuito) o el -en mi opinión- mucho más recomendable (aunque de pago) Secreaming Frog SEO Spider.

Auditoría SEO con Screaming Frog

NOTA: es importante que una vez extraídas las URLs, sólo nos quedemos con las que tienen estado 200 y no se indique a los buscadores otra URL canónica que la sustituya (en definitiva, queremos rastrear sólo las URLs que los buscadores indexan).

2) Separando las carpetas y variables en columnas

Una vez tengas en una hoja de cálculo la lista de URLs indexables por los buscadores en la columna A, vete a la columna B y añade la siguiente fórmula junto a cada URL de la lista:

  • En EXCEL: =SUSTITUIR(SUSTITUIR(MINUSC(A2);"&";"/");"?";"/")
  • En SPREADSHEET: =SUBSTITUTE(SUBSTITUTE(LOWER(A2);"&";"/");"?";"/")

Con esto, lo que conseguimos es poder utilizar el slash o barra diagonal, como elemento que nos permita separar todas las carpetas y variables. Tenemos varios métodos, dependiendo de la hoja de cálculos que utilicemos:
analizando URLs para una auditoría SEO

  • En EXCEL: copiaremos toda la columna B y la pegaremos como valores para después, pulsando sobre la misma columna B, utilizaremos la funcionalidad “Texto en columna” del menú Datos y utilizaremos el slash como delimitador
  • En SPREADSHEET: en toda la columna C y junto a cada URL manipulada en la columna B, utilizaremos la siguientefórmula =SPLIT(B2;"/")

Con esto debemos el mismo listado de URLs pero separadas las carpetas, URLs y variables en columnas.

3) Organizando carpetas y variables en patrones

Ahora iremos modificando “a mano” los diferentes elementos que nos encontremos separados en cada columna en función a estos patrones:

  • Subcarpetas: si nos encontramos subcarpetas directamente dependientes y relacionadas con la carpeta anterior del tipo: /categoria/subcategoria/ nos quedaremos con el nombre de la carpeta madre (categoria), por ejemplo:
    • /marcas-de-coches/ford nos quedaremos con [marcas-de-coches]
    • /tipos-de-coche/berlina/ nos quedaremos con [tipos-de-coche]
  • variables: si nos encontramos una variable nos quedaremos con el nombre de la variable y no con su valor, por ejemplo
    • id=8 nos quedaremos con [ID]
    • view=item nos quedaremos con [VIEW]

agrupando carpetas en una auditoria seo
Y esto lo haremos con todas las columnas y fila de URLs que tenemos que analizar.

Agrupando patrones

Ahora tenemos un listado de URLs con sus patrones perfectamente segmentados, por lo que sólo nos toca agrupar esos patrones y ordenar el listado por dichos patrones agrupados para poder hacer el análisis SEO.

Ve a la última columna con datos y en la siguiente, deberás utilizar utilizar una fórmula similar a esta en cada línea con datos a agrupar:

  • En EXCEL: =CONCATENAR(B2;C2;D2;E2) (deberás añadir todas las celdas a agrupar, por lo que -en tu caso- puede haber un F2, G2, etc.)
  • En SPREADSHEET: =CONCATENATE(B2;C2;D2;E2)

URLs agrupadas para el análisis SEO

¿Y cómo vemos las URLs ya organizadas para analizar y poder proponer las recomendaciones en la auditoría SEO?

Vamos a utilizar una vista de tabla dinámica, siendo el área todos los datos que hemos creado (desde la columna A hasta la última con las agrupaciones…que yo he llamado ‘PATRÓN’), siendo los rótulos de fila en este orden:

  • PATRÓN
  • URLs

analizando URL
Ahora toca revisar esas URLs para detectar esos problemas que el SEO de verdad (no el que sólo sabe generar contenido con palabras clave utilizando WP + YOAST):

  • Contenido duplicado
  • Contenido que no hace falta indexar y que estropea el la indexación semántica latente
  • Errores…

¿Y qué pasa con las URLs que no tienen carpetas con slash?

Para el análisis de la estructura de URLs que no están organizadas con /categoria/subcategoria/ suelo sacar la ruta del elemento breadcrumb si lo hay, y ojo, que no siempre tiene el formato home>categoria>subcategoria>articulo
estructura de una URL: el breadcrumb
Un truco que te permitirá automatizar la extracción del contenido de URLs es usar la función IMPORTXML de GOOGLE SPREADSHEET, pero deberás saber manejarte con el lenguaje XPATH, y eso…tampoco lo suele manejar un ‘experto’ SEO que sólo sabe de contenidos optimizados con WP…
No obstante, puedes intentar usar esta fórmula que suele ser válida en gran parte de los casos que he analizado: =IMPORTXML(A2;"//div[contains(concat(' ', @class, ' '), ' breadcrumb ')]")
NOTA: A2 debe ser la URL a analizar