Auditoría SEO: ¿Cómo se analiza la estructura de URLs?

Técnica de análisis de URLs para una auditoría SEO

Analítica web, Posicionamiento en buscadores 10 2978
Auditoría SEO con Screaming Frog

¿Eres un “experto” que no sabe hacer una auditoría SEO técnica?…

No, no voy a hacer “sangre” de los supuestos “Expertos” SEO, pero os recuerdo la frase de mi amigo y excelente profesional, Fernando Muñoz:

En España hay mucho SEO porque hay mucho WP
Señor Muñoz

Y es que hacer SEO no es sólo escribir contenidos que contengan la palabra clave, ni recomendar WP porque es un CMS SEO friendly o porque podemos añadirle de manera sencilla algunos plugins que lo optimizarán más: un SEO debe saber hacer una auditoría SEO técnica, y -entre otros factores importantes que debemos analizar se encuentra la estructura de las URLs del sitio web.
Un SEO debe detectar qué URLs están provocando problemas como:

  • Contenido duplicado
  • Contenido que no necesitamos indexar
  • Errores 404 u otros…

Y debe saber proponer las acciones de optimización y mejora necesarias para conseguir un buen posicionamiento en buscadores, porque un SEO es fundamentalmente un técnico analista y no un COMMUNITY MANAGER (que no digo que este perfil no sea útil para un negocio…pero no es SEO ni vale para todo)
NOTA: hay muchos profesionales que saben hacer un poco de todo…pero eso no los hace expertos y -si lo sacas de un CMS más o menos amigable o lo pones frente a un sitio hecho ‘a medida’ ¡se acabó el experto!

En este post voy a explicar paso a paso una técnica para analizar la estructura de URLs de un sitio web, para que tu auditoría SEO no se quede corta.

Cómo hacer un análisis de URLs para una auditoría SEO técnica

1) Extraer el listado de URLs a analizar

Para esta tarea usaremos un crawler como Xenu’s Link Seleuth (gratuito) o el -en mi opinión- mucho más recomendable (aunque de pago) Secreaming Frog SEO Spider.

Auditoría SEO con Screaming Frog

NOTA: es importante que una vez extraídas las URLs, sólo nos quedemos con las que tienen estado 200 y no se indique a los buscadores otra URL canónica que la sustituya (en definitiva, queremos rastrear sólo las URLs que los buscadores indexan).

2) Separando las carpetas y variables en columnas

Una vez tengas en una hoja de cálculo la lista de URLs indexables por los buscadores en la columna A, vete a la columna B y añade la siguiente fórmula junto a cada URL de la lista:

  • En EXCEL: =SUSTITUIR(SUSTITUIR(MINUSC(A2);"&";"/");"?";"/")
  • En SPREADSHEET: =SUBSTITUTE(SUBSTITUTE(LOWER(A2);"&";"/");"?";"/")

Con esto, lo que conseguimos es poder utilizar el slash o barra diagonal, como elemento que nos permita separar todas las carpetas y variables. Tenemos varios métodos, dependiendo de la hoja de cálculos que utilicemos:
analizando URLs para una auditoría SEO

  • En EXCEL: copiaremos toda la columna B y la pegaremos como valores para después, pulsando sobre la misma columna B, utilizaremos la funcionalidad “Texto en columna” del menú Datos y utilizaremos el slash como delimitador
  • En SPREADSHEET: en toda la columna C y junto a cada URL manipulada en la columna B, utilizaremos la siguientefórmula =SPLIT(B2;"/")

Con esto debemos el mismo listado de URLs pero separadas las carpetas, URLs y variables en columnas.

3) Organizando carpetas y variables en patrones

Ahora iremos modificando “a mano” los diferentes elementos que nos encontremos separados en cada columna en función a estos patrones:

  • Subcarpetas: si nos encontramos subcarpetas directamente dependientes y relacionadas con la carpeta anterior del tipo: /categoria/subcategoria/ nos quedaremos con el nombre de la carpeta madre (categoria), por ejemplo:
    • /marcas-de-coches/ford nos quedaremos con [marcas-de-coches]
    • /tipos-de-coche/berlina/ nos quedaremos con [tipos-de-coche]
  • variables: si nos encontramos una variable nos quedaremos con el nombre de la variable y no con su valor, por ejemplo
    • id=8 nos quedaremos con [ID]
    • view=item nos quedaremos con [VIEW]

agrupando carpetas en una auditoria seo
Y esto lo haremos con todas las columnas y fila de URLs que tenemos que analizar.

Agrupando patrones

Ahora tenemos un listado de URLs con sus patrones perfectamente segmentados, por lo que sólo nos toca agrupar esos patrones y ordenar el listado por dichos patrones agrupados para poder hacer el análisis SEO.

Ve a la última columna con datos y en la siguiente, deberás utilizar utilizar una fórmula similar a esta en cada línea con datos a agrupar:

  • En EXCEL: =CONCATENAR(B2;C2;D2;E2) (deberás añadir todas las celdas a agrupar, por lo que -en tu caso- puede haber un F2, G2, etc.)
  • En SPREADSHEET: =CONCATENATE(B2;C2;D2;E2)

URLs agrupadas para el análisis SEO

¿Y cómo vemos las URLs ya organizadas para analizar y poder proponer las recomendaciones en la auditoría SEO?

Vamos a utilizar una vista de tabla dinámica, siendo el área todos los datos que hemos creado (desde la columna A hasta la última con las agrupaciones…que yo he llamado ‘PATRÓN’), siendo los rótulos de fila en este orden:

  • PATRÓN
  • URLs

analizando URL
Ahora toca revisar esas URLs para detectar esos problemas que el SEO de verdad (no el que sólo sabe generar contenido con palabras clave utilizando WP + YOAST):

  • Contenido duplicado
  • Contenido que no hace falta indexar y que estropea el la indexación semántica latente
  • Errores…

¿Y qué pasa con las URLs que no tienen carpetas con slash?

Para el análisis de la estructura de URLs que no están organizadas con /categoria/subcategoria/ suelo sacar la ruta del elemento breadcrumb si lo hay, y ojo, que no siempre tiene el formato home>categoria>subcategoria>articulo
estructura de una URL: el breadcrumb
Un truco que te permitirá automatizar la extracción del contenido de URLs es usar la función IMPORTXML de GOOGLE SPREADSHEET, pero deberás saber manejarte con el lenguaje XPATH, y eso…tampoco lo suele manejar un ‘experto’ SEO que sólo sabe de contenidos optimizados con WP…
No obstante, puedes intentar usar esta fórmula que suele ser válida en gran parte de los casos que he analizado: =IMPORTXML(A2;"//div[contains(concat(' ', @class, ' '), ' breadcrumb ')]")
NOTA: A2 debe ser la URL a analizar

About the author / 

jbmoreno

Soy consultor seo sem, el que maneja este cotarro de JBMoreno.es y puedes saber más de mi en Acerca de José B. Moreno Suárez

10 Comments

  1. al3jandromat3o 24 agosto, 2014 at 20:20 -  Responder

    Que gran post, que el contenido es el correcto pero lo que más me gustó fue el razonamiento de todos los SEO que hay en España.

    Es como al principio de las redes sociales que las llevaba “el sobrino” o “amigo” del jefe porque entiende de eso del facebook.

    • jbmoreno 24 agosto, 2014 at 22:20 -  Responder

      La frase no es mia 😉

  2. Jose 27 agosto, 2014 at 17:36 -  Responder

    Joderrrr!!!! Muchas gracias tocayo por compartir parte de tus conocimientos, felicidades por el post

    • jbmoreno 27 agosto, 2014 at 17:39 -  Responder

      De nada Jose, a ti por pasarte a leer

  3. Hector Abascal 1 septiembre, 2014 at 11:36 -  Responder

    Me ha gustado mucho el artículo, y me parece que me queda mucho por aprender dentro de la parte técnica aunque es un campo dónde yo lo delego en los programadores con los que trabajamos que son los que se “bajan a barro” y se pelean con el código, aunque a mí me viene de perlas conocer los entresijos y el trabajo que supone corregir esos errores que casi todas las webs tienen. Más que nada, me parece muy interesante para mí porque así lo puedo entender y planificar en las propuestas. Bastante tengo yo con explicárselo a los clientes (traducírselo a lenguaje llano) y hacerles entender el trabajo que supone arreglar esos enlaces rotos, verificar con WMT los errores, etc y poner en valor todo ese trabajo que no se vé.

    En definitiva que me parece un buen aporte, así que muchas gracias por compartirlo. 😉
    Te seguiré leyendo!

    • jbmoreno 1 septiembre, 2014 at 13:05 -  Responder

      Me alegro de que te resulte útil. Tenemos que hacer entender al cliente que el SEO es técnica no un “arte de magia”, por lo que -si te sirve para esto…ya me doy por satisfecho.

      Saludos y gracias por el feedback

  4. SEODiaz 1 diciembre, 2014 at 00:43 -  Responder

    “pero deberás saber manejarte con el lenguaje XPATH, y eso…tampoco lo suele manejar un ‘experto’ SEO que sólo sabe de contenidos optimizados con WP”

    Auch, jaja. Tanto usar Scrapebox y la extensión Scraper de Chrome, con jquery y no xpath, han hecho que lo olvide… al menos aún recuerdo las formulas en Excel jejeje

    Que buen artículo José, he visto que usas mucho las Spreadsheets de Google para hacer cosas que con Excel se complican o requieren add ons como el de Niles Bosma… lo anoto en la lista, por alguna razón nunca me he metido a fondo a usarlas. A pelearse con ellas 😀

    Gracias por compartirnos esto!

    • jbmoreno 1 diciembre, 2014 at 09:44 -  Responder

      Gracias a ti por pasarte a comentar

  5. Rafael 5 marzo, 2015 at 00:14 -  Responder

    Hola José, actualmente estoy practicando y soy novato en el mundillo del SEO. He intentado seguir tus pasos pero por más vueltas que le doy una vez que tengo todo dividido en columnas, concrétamente al final del paso 2, me he perdido completamente.
    No consigo realizar el paso 3 y entiendo que tampoco el 4. No entiendo muy bien como hacer esas modificaciones “a mano”, tampoco las agrupaciones de patrones, por qué aparece una imagen con los filtros pulsados -aunque no veo muy bien la imagen), etc…. (probablemente se deba a que no soy experto y estoy empezando. .
    Te agradecería si existiera la manera de hacerlo un poquito más paso a paso o incluso en un vídeo como tienes en otros post, sin embargo entiendo que puede resultar algo pesado.
    De igual modo, te agradezco toda la información que publicas y decirte que es de gran ayuda.

    Un saludo y muchísimas gracias, tu blog es excepcional!

    Rafael

    • jbmoreno 15 marzo, 2015 at 12:38 -  Responder

      ¿Estás usando EXCEL u otro?, ¿con comandos en castellano o inglés?

Leave a reply

Your email address will not be published. Required fields are marked *

  • Madrid: Calle Ayala 83,28006 Madrid(Madrid), España
  • Sevilla: Calle Asturias 11,41010 Sevilla(Sevilla), España
Optimization WordPress Plugins & Solutions by W3 EDGE