Ya lo he dicho en alguna ocasión:
«Un SEO es un técnico analista de datos y una de sus principales tareas es la recopilación y limpieza de los mismos» http://t.co/EfdsQzMmzC
— José B. Moreno (@jbmoreno) septiembre 20, 2015
De eso va este post, de cómo puedes aprovechar la potencia de los filtros de extracción de datos de SCREAMING FROG para obtener los datos que necesitas para hacer una auditoría SEO más eficaz.
Si usas esta aplicación, sabrás que -por defecto- sólo extrae datos como title, description, h1, h2…pero no saca contenido del cuerpo de texto general. Vamos resolver este inconveniente.
En otro orden de cosas y -si eres usuario habitual- probablemente ya conozcas algunos trucos para sacar más jugo a esta aplicación -que puede estar en la caja de herramientas de cualquier SEO profesional- como por ejemplo el uso de los filtros de búsqueda avanzada para saber si el código de GA está en todas las páginas del sitio. Si no lo conocías, te recomiendo que revises el artículo de MJ Cachón sobre utilidades SEO usando “la rana”.
En este caso, voy a mostrarte otra potente funcionalidad de esta herramienta: los filtros de extracción (Configuration>Custom>Extraction), que te servirán para hacer un scrapping rápido del área concreta de contenido que te interesa mediante las rutas del DOM del HTML o a través del marcado de estilo en la CSS; por ejemplo:
Lo que ocurre es que estarás de acuerdo conmigo en que no todo el mundo sabe XPath o CSSPath y eso dificulta bastante el poder sacar el máximo rendimiento de esta funcionalidad por eso vamos a complementar el truco con otra pequeña utilidad en forma de Extensión de GOOGLE CHROME: XPathOnClick, que te permitirá extraer la ruta del marcado CSS o de la etiqueta HTML en el DOM y te la devuelve en formato CSSPath o XPath -lenguajes para recorrer las hojas de estilo o el XML del documento respectivamente- sin necesidad de conocerlos.
Para este ejemplo voy a usar la tienda ECommerce de Decoración Online, TRAMAS+, y voy a extraer: breadcrumb, descripción corta, larga y precio.
En principio vamos a indicar la URL que queremos analizar usando el modo ‘spider’ en la caja central, pero en mi caso- como sólo voy a analizar el contenido voy a configurarlo para que no rastree imágenes, css, javascript, SWF, etc. Hasta aquí…lo normal.
Ahora nos vamos a dirigir al filtro de extracción, al que podrás llegar siguiendo la ruta Configuration>Custom>Extraction y se te abrirá un formulario donde puedes configurar:
¿Recuerdas que más arriba te había recomendado el uso de una extensión de CHROME?, pues -si la has instalado correctamente- sólo irte al elemento de contenido que deseas extraer y seleccionar con el botón derecho del ratón la orden “Inspeccionar elemento” y se te abrirá una ventana con el área HTML seleccionada con el código fuente resaltado.
Ahora, vuelve a hacer clic con el botón derecho en el elemento resaltado y podrás usar las funciones: “copy CSSPath” o “copy XPath” y sólo tendrás que pegar el resultado en el formulario que indico arriba:<
Bueno, ahora sólo espero que si algo de este artículo sobre auditoría seo eficaz con SCREAMINF FROG contiene algún error, me lo digas y -si te ha parecido útil- ¡DÍSELO A TODO EL MUNDO!