IA data-driven: la solución para generar contenido SEO orientado a personas
Tabla de Contenidos
¿Qué es la IA Data Driven? IA data-driven es un tipo de IA generativa que genera contenidos basados en datos de búsqueda de usuarios. Es un concepto que creé en Keytrends en 2022 para buscar resultados de calidad y evitar las alucinaciones generadas por las IA generativas generales.
Sí: Keytrends es la primera herramienta SaaS que utiliza esta visión user & data centered para generar contenidos. Aquí, entre cosas, vamos a explicaros en esta guía nuestra visión y por qué hemos orientamos el contenido así.
El problema de base que hay que tener claro es que el crear contenido no lo podemos dejar en manos de un modelo que lo hace por probabilidad, porque aunque adopte un tono y lenguaje cada vez más humano, no va a ir a solucionar o cubrir el problema adecuadamente.
Y es que el foco principal de cualquier contenido debe ser resolver una necesidad de información o una intención de búsqueda si viene desde Search. Por ello si no analizamos primero esa búsqueda, esa necesidad y la aterrizamos conviertiéndola en datos no vamos a poder automatizar la respuesta como la haría una persona que sigue el proceso lógico de investigación, documentación y redacción del contenido.
De ahí nuestra obsesión en entender la necesidad e intención de búsqueda primero y automatizar el proceso de investigación para dar inputs adecuados a la IA antes de empezar a generar contenido.
Este es el approach que adoptamos en Keytrends desde un principio y hacia el que están evolucionando, muy poco a poco, los generadores de texto con IA. Pero a día de hoy la mayoría son todavía herramientas genéricas no basadas en datos, así que aquí empecemos esta guía viendo por qué no funcionan, qué estudios lo demuestran y qué plataformas de contenido AI data-driven existen.
Human vs AI content: por qué la IA generativa o ChatGPT genera peor contenido
Ya lo hemos dicho: la IA tal y como la conocemos hoy no funciona para generar el contenido de nuestras estrategias de content marketing y SEO.
Y no lo hace por dos motivos:
- La redacción de la IA generativa dista mucho (todavía) de parecerse a la humana: sigue siendo demasiado genérica y arroja alucinaciones de contínuo.
- Los textos generados con IA alcanzan una menor visibilidad en SERPs con respecto al contenido escrito por humanos si no cumplen con las exigencias de buscadores como Google en cuanto a la calidad y la utilidad del contenido.
Desgranemos estos dos puntos más a fondo:
1. La IA genera contenido por probabilidad y es prompt-dependiente
A grosso modo, la IA generativa es un tipo de inteligencia artificial que crea contenido nuevo basándose en patrones aprendidos a partir de datos ya existentes. Gracias a esto el modelo generativo de inteligencia artificial es capaz de identificar qué tipo de respuesta debe dar en función de la orden que recibe (lo que conocemos como prompt) y de la probabilidad. Y lo hará creando información nueva, como en el caso de la IA generativa de texto.
Este funcionamiento presenta dos problemas:
- Que siempre replica los mismos patrones y, por eso, las respuestas son genéricas. La solución pasa por emitir una orden o prompt lo más detallado posible para que la IA generativa de texto devuelva respuestas más concretas y acertadas.
- Que no va a generar un punto de vista o enfoque distinto sobre un tema para crear una respuesta única y original que todavía no esté escrita, porque se basa en datos que ya existen: “AI tools are still in the development phase, and they can only generate content based on existing data. It might not be possible for an AI tool to generate something new and unique for your site. An AI tool cannot think creatively for itself; it needs some human input to do this” (Becoming Human).
El propio Microsoft avisa de esto en sus FAQ sobre el Copilot:
Aún habría un tercer problema: las alucinaciones y los datos que, no pocas veces, inventa la IA generativa. Pero esto merece un apartado aparte.
2. La IA tiene alucinaciones y no siempre arroja datos verídicos
Las alucinaciones de la IA son un fenómeno de los grandes modelos de lenguaje (LLM) que se produce cuando las respuestas que arrojan contienen información que parece cierta, pero que no lo es.
Una alucinación es la generación de un contenido que no tiene sentido o es infiel a la fuente proporcionada
¿Por qué se producen y alucinan los modelos LLMS? Los LLMS han sido capacitados para predecir tokens. Basan el contenido generado en probabilidades y no saben si el contenido generado es correcto o incorrecto, verdadero o falso. Otras veces la base de datos de entrenamiento la que es insuficiente o inapropiada.
Como comenta Xabier Amatrian en su estudio sobre alucinaciones Estas alucinaciones se mejoran con la siguiente capacitación que se le da a los LLMS que es el RLHF (Reinforcement Learning from Human Feedback) o Aprendizaje por Refuerzo con Retroalimentación Humana y con eso mejoran su calidad y factualidad.
Por ejemplo: una IA que ha sido entrenada para especializarse en la generación de contratos para el sector financiero, puede intuir y por probabilidad crear contratos para otros sectores, pero es muy probable que alucine e invente datos. En definitiva, lo que hará será generalizar y aplicar los patrones aprendidos a unas órdenes que no le son familiares, como señalan desde Telus: “The goal of ML model training is to generalize from training instances so that the model can correctly operate on instances it hasn’t seen before”.
Las alucinaciones son un gran hándicap que pueden poner en juego áreas sensibles de la vida de las personas, incluyendo su salud. Para muestra este estudio de la revista revista científica Cureus, en el que ChatGPT dio información que todavía no se había probado ni documentado: “ChatGPT, with apparent confidence, provided an essay on liver involvement which, in reality, has not been reported yet” (captura de abajo). Además, inventó referencias bibliográficas cuando se le pidieron.
¿Cómo reducir la alucinaciones para genera un contenido más útil y factual?
Algunas técnicas para reducir estas alucinaciones en un producto de IA generativa como Keytrends son:
- Citar fuentes yreferencias a documentos o papers que además ayudarán en la experiencia de usuario y en EEAT
- Indicar al usuario que el contenido generado es una muestra de contenido y que la responsabilidad de la publicación recae en el usuario final
- Poder modificar el contenido en todo momento
- Poder refinar el resultado añadiendo más sistemas de prompts. En nuestro caso usamos Keychat para poder iterar sobre el contenido y una serie de prompts predefinidos con un alcance más conciso como por ejemplo responder a una pregunta concreta
- Limitar las respuestas o contenidos generados a unos pocos párrafos ya que cuanto mayor sea la longitud del contenido generado mayores alucinaciones tendrán
- Estructurar el contenido como por ejemplo hacemos en los briefs de contenido y alimentarlo con datos de una investigación de usuario
- Usar documentación o Knowledge base para poder investigar sobre un tema y hacer prompts y preguntas sobre una documentación cerrada y verificada
Estas y otras técnicas son las que aplicamos en Keytrends para que puedas tener unos resultados de mayor calidad para el usuario.
Otras técnicas de reducción de alucinaciones son:
– Ajustar metaindicaciones. Por ejemplo dotar de mayor contexto en los primeros prompts antes de pedir un resultado final
- Repetir elementos claves en tono asertivo (ej Mayúsculas) para incidir en su importancia
- Pasar en el contexto hechos factuales o afirmaciones sobre el tema para dotar de datos o información al prompt que genere el contenido
- Ejecutar una cadena de pensamiento mediante manual COT
REACT prompting (reaccionar) Usar el modelo REACT para generar razonamientos previos
Cadena de verificación (COVE)
3. La IA es una caja negra para nosotros: ¿dónde están las referencias?
El desconocer de dónde proviene la información de las respuestas de la IA es un problema que se agrava teniendo en cuenta el fenómeno de las alucinaciones. Si trabajamos en un sector muy especializado, ¿no sería lo ideal que la herramienta con inteligencia artificial generativa que utilicemos haya sido entrenada con fuentes de autoridad en la materia?
Casi a finales de 2023 cada vez más buscadores con IA, chats y copilots incluyen la fuente de dónde ha sido extraída la información (Bing Chat, Perplexity.ai, YouChat, Bard), pero sigue siendo responsabilidad humana verificar que la información es cierta y que la fuente es fiable (uno de los requisitos para el E-E-A-T de Google)
➡️ El estudio editorial de Hotjar que enfrenta a ChatGPT con una redactora
Existen varios estudios que ilustran todos los puntos anteriores. Lesley Marchant, editora de Hotjar, puso a prueba ChatGPT para redactar un artículo de 2000 palabras sobre los efectos de la IA en varias industrias. A la vez, le encargó a su redactora de confianza la misma pieza. El estudio se basa en comparar los resultados de la IA y de la autora humana en varias tareas y/o aspectos de la redacción.
La experiencia de la editora de Hotjar generando un artículo con la ayuda de ChatGPT y con la de una redactora humana puede resumirse en esta tabla:
Tarea | ChatGPT | Redactora humana |
Esquema de redacción | ❌ Ignora el prompt inicial❌ Recorta la longitud ❌ Aporta datos falsos ❌ Necesario ajuste de prompt | ✅ No necesita información adicional✅ Esquema completo disponible al día siguiente |
Tiempo de ejecución | ✅ 80m | ❌ 19h de research y redacción |
Coste | ✅ Gratuito | ❌ Bajo pago |
Edición de borrador | ❌ 3.5h de correcciones | ✅ Listo en 40m |
Voz y tono | ❌ Genéricos ❌ Sin storytelling ❌ Poco innovadores | ✅ Utiliza voz y tono de marca ✅ Técnicas de copywriting |
Contexto | ✅ Ejemplos verificables ❌ Información desactualizada | ✅ Aprueba fact-checking ✅ Datos actuales |
ChatGPT gana en tiempo de ejecución y coste, pero a la pregunta “Does it have the style and substance of something written and edited by professional content marketers?” (“¿Tiene el estilo y la sustancia de un texto escrito y editado por un content marketer profesional?”), la respuesta es NO.
La falta de estilo de ChatGPT se traduce en un texto aburrido que provocaría una experiencia de usuario pésima: “Almost half of the sentences in ChatGPT’s piece follow the same structure. As you can imagine, this repetitive structure could put any reader to sleep”.
A una experiencia de usuario negativa se le suma el dar datos desfasados y la necesidad de ajustar las instrucciones que se le da debido a la prompt-dependencia.
¿Daría Google visibilidad a un contenido así? Veamos qué exige Google a los contenidos redactados con IA y los resultados de un estudio de una agencia de marketing online que se propuso averiguarlo.
Qué exige Google al contenido redactado con IA para posicionar
Lo primero: Google no penaliza este tipo de contenido ni condena la IA siempre que se use de forma correcta: “El uso adecuado de la IA o la automatizacion no infringe nuestras directrices”. Es decir, nos referimos al contenido que no se utiliza principalmente para manipular el posicionamiento en los resultados de búsqueda, lo cual infringe nuestras políticas de Spam”.
Es decir: siempre que el contenido esté creado para serle útil al usuario, no importa que sea creado con la ayuda de la inteligencia artificial. La confirmación de esto la encontramos en las directrices del Helpful Content Update que Google ya ha modificado en su versión inglesa: donde antes se leía “escrito por personas y optimizado para los usuarios”, ahora solo se lee “created for people”, sin hacer mención al tipo de creador.
Cabe destacar que Google recomienda añadir una nota en el contenido que responda al cómo se ha creado ese artículo (si, por ejemplo, nos hemos ayudado de la IA para la investigación o estructuración del artículo). ¿Tú qué harías?
Yendo a sus directrices oficiales, lo que exigirá Google a todo el contenido tanto el humano como el de la IA será:
1. Que el contenido generado con IA no tenga el único objetivo de posicionar
Lo veíamos en la captura de arriba y lo reiteró Danny Sullivan en un tweet:
We haven't said AI content is bad. We've said, pretty clearly, content written primarily for search engines rather than humans is the issue. That's what we're focused on. If someone fires up 100 humans to write content just to rank, or fires up a spinner, or a AI, same issue…
— Danny Sullivan (@dannysullivan) November 7, 2022
Esto no es ninguna novedad y en su Guía para crear contenido útil, fiable y centrado en las personas Google explica la diferencia. En esta tabla resumimos los puntos más importantes que diferencian a cada uno:
Contenido creado para personas 🧑🦰 | Contenido creado para buscadores 🕷️ |
✔️ Contenido de interés incluso para una audiencia ya captada, aquella que ya conoce nuestro site. | 〰️ Aquellos que solo resumen el contenido de otros y que no aportan valor, lo que denota que tratan una temática sin conocerla y sin ser expertos. Por ello, las personas sienten que necesitan buscar más después de leer el sitio. |
✔️ Aquél con el que las personas sienten que han aprendido y con él pueden cumplir su objetivo sin necesidad de buscar más. | 〰️ A menudo, estos sitios son multitemáticos porque su objetivo es conseguir visitas. Recurren a la automatización para poder publicar más. |
✔️ Contenido escrito desde la experiencia y basado en un conocimiento profundo de la materia, a menudo en sitios web que tratan una temática concreta y no varias. | 〰️ Los contenidos que tratan temas de moda y no aquellos que son útiles para el usuario. |
✔️ En global, tanto el contenido como el sito web ofrecen una experiencia satisfactoria a los usuarios. | 〰️ El contenido que “promete responder a una pregunta que no tiene respuesta”. |
Por cierto, Bing tiene una posición similar con respecto al AI content y en sus directrices para webmasters no solo señala esta misma idea, sino que califica la generación automática de contenido como una práctica maliciosa que puede acarrerar penalizaciones:
Bing tiene una política de IA responsable disponible para su consulta.
2. Contenido que hace un uso prohibido de la IA generativa y/o es spam
Además de haberse creado para fines de posicionamiento y no para aportar valor al usuario, Google tiene un listado de usos prohibidos de la IA generativa que es importantísimo conocer. En general, hay 3 grandes usos prohibidos de la IA para generar contenido:
- Realizar o facilitar actividades peligrosas, ilegales o malintencionadas: explotación o abuso infantil, venta de bienes u sustancia ilegales, topo tipo de delitos incluidas las estafas online, violencia o contenido terrorista… Aquí también se incluye fomentar el odio entre personas y grupos.
- Generar y distribuir contenidos con la intención de desinformar, tergiversar o engañar, incluyendo hacer pasar un contenido hecho por IA por el de un humano, suplantar la identidad de otra persona y fingir conocimiento y experiencia en materiales sensibles como salud o finanzas.
- Generar contenidos sexualmente explícitos, incluidos los creados con fines documentales o artísticos.
Además, en las directrices anti-spam básicas de Google hay un apartado para la automatización con las prácticas consideradas spam, como por ejemplo las traducciones automáticas sin revisión ni edición humanas, los textos parafraseados y todo texto creado mediante técnicas de ofuscación y el raspado de feeds o de resultados de búsqueda.
3. Contenido que no demuestra un alto E-E-A-T
Escribir un contenido con IA pero teniendo a los usuarios en mente es garantía de que no sea catalogado como spam. Pero lo que diferencia a un contenido humano de uno automático, además de cubrir la intención de búsqueda, es el nivel de E-E-A-T que demuestra: experiencia, conocimiento, autoridad y fiabilidad.
Para determinar si un contenido está trabajando estas 4 cualidades Google recomienda tener siempre presente el quién, el cómo y el por qué y aplicar algunas buenas prácticas para cada uno para ayudar tanto al buscador como a los usuarios a determinar la fiabilidad de la información:
- ¿Quién? Indicar de forma clara el autor y aportar información sobre él, tanto acerca de su trayectoria, como su relación con el proyecto y la temática
- ¿Cómo? Compartir el detalle de cómo se ha creado el contenido. Por ejemplo, detallar en una reseña de productos con qué criterios se han analizado los modelos y acompañarlo de contenido multimedia propio. Consulta la información oficial de Google sobre cómo crear una buena reseña de producto.
- ¿Por qué? Es decisivo que el contenido esté creado para ayudar a las personas. Posicionar es la consecuencia o la compensación de una publicación útil, relevante, de calidad y fiable (sin esto, no es posible conseguirlo).
Existe una guía completa llamada Search Quality Raters guidelines (casi 200 páginas), y una versión reducida (menos de 40 hojas), ambas con conceptos muy importantes en cuanto al E-E-A-T. Para leer un resumen de todo esto y tener una guía de cómo trabajo, puedes consultar el contenido que creamos nosotros al respecto:
➡️ El experimento SEO de Reboot: la visibilidad de los textos redactados con IA
El equipo de la agencia de marketing online Reboot se propuso averiguar qué contenidos rankeaban mejor, si los que iban a crear con ChatGPT o los que iban a generar sus redactores. Para ello monitorizaron durante 3 meses el contenido creado para 10 dominios nuevos distintos, bajo estas premisas (y entre otras cuestiones técnicas que pueden leerse con detalle en su experimento):
- Cada uno tenía de forma exclusiva contenido creado por IA o por redactores profesionales, y sus respectivos código HTML y CSS eran (casi) idénticos.
- Todos fueron optimizados para SEO de la misma forma, tanto on-site como off-site.
- Para evitar la influencia del sistema de rankeo de Google, la keyword atacada (“Flemparooni”) no existía y no arrojaba ningún resultado en SERPs.
- Los contenidos generados por ChatGPT no fueron editados, solo optimizados con la keyword y de forma idéntica a los artículos creados por los copywriters.
¿Cuál fue el resultado del experimento? “The rank tracking data shows clearly that the human written content ranked better than the AI generated content” (“Los datos de rankeo muestran de forma clara que el contenido redactado por humanos ha rankeado mejor que aquél generado con IA”).
Mientras que el primero consiguió una posición media de 4.4, el segundo se quedó en una posición media de 6.6. Esta fue la evolución de la visibilidad media entre los dos tipos de contenido a lo largo de los 3 meses que duró el experimento:
De este estudio confirmamos lo que ya veíamos con el de Hotjar: que la figura del redactor todavía es necesaria y que la redacción humana juega con ventaja en muchos aspectos con respecto a la IA:
“Part of providing the people-centric content our readers deserve is giving them up-to-date, actionable information that helps them do their jobs. With AI alone, there’s simply no way to do that yet—which means an experienced editor or writer (or both) would still have to get heavily involved. ChatGPT might be a helping hand, but it also needs one.”
Ahora bien, no hay que olvidar que un contenido con IA podría tener mejor performance si entraran en juego otros factores de SERPs, como reconocen desde Reboot: “It is possible that some AI content domains will rank well as a result of other on-site and off-site factors, or the way in which AI is used […].”
Esto se convierte en una posibilidad real si se le dan los datos adecuados a la IA para responder a las consultas de usuario, y que hoy por hoy solo puede hacerse con plataformas de contenidos AI data-driven como Keytrends y no con herramientas genéricas.
Sigue leyendo esta guía para entender cómo y crea tu cuenta freemium para ponerlo en práctica desde ya. Aunque lo mejor es agendar una demostración con nosotros para que te enseñemos cómo podrías utilizarla en tu día a día y nos hagas todas las preguntas que necesites ⬇️
De chatbots a copilots AI data-driven: Google apuesta por los datos para generar contenido con Genesis
La prueba de la necesidad de dar un giro hacia los datos en el contenido con IA es la herramienta de generación de texto para periodistas que estaría preparando Google: Genesis.
Aunque no ha sido confirmada ni tampoco desmentida por Google, se trataría de un asistente y generador de noticias que sería entrenado para cumplir con los estándares de calidad necesarios para los medios de comunicación.
Y es que según la información del New York Times, Genesis se desmarcaría totalmente de los actuales problemas que presenta la IA generativa:
➡️ Podría obtener en tiempo real la información y datos de eventos para agilizar la redacción de noticias
➡️ Podría personalizar el contenido generado dando a elegir entre distintos estilos de escritura
➡️ Podría automatizar tareas de redacción, dar ideas y ayudar a elegir el título y la estructura de encabezados
Si esto es así, y teniendo en cuentas las características de las próximas herramientas de IA de Google, Genesis podría acabar con el AI content tal como lo conocemos ahora, sujeto a las alucinaciones y el estilo impersonal del modelo GPT de OpenAI.
Aún así, no estaría pensada para sustituir a los redactores de noticias, como ya expresó Google en una nota de prensa cuando Genesis era tan solo una idea:
“La empresa afirma que soluciones como ‘Genesis’ están lejos de sustituir a los periodistas y editores. Aunque este tipo de aplicaciones pueden ser útiles para generar titulares más atractivos o afinar un texto con pruebas sobre diferentes estilos de escritura, “sencillamente, no están destinadas a reemplazar, y no pueden reemplazar, el papel esencial que tienen los periodistas al informar, crear y verificar sus artículos”, explica Google en su nota de prensa.”
Cómo se ha llegado hasta aquí: la evolución desde los primeros chats
Este es un paso natural y necesario para lA generativa de texto, fruto de la evolución que habido desde la aparición de ChatGPT. De él se pasó a herramientas más innovadoras que podían conectarse a internet, dar fuentes y redactar (YouChat), para poco a poco dar paso a asistentes o copilots que dan recomendaciones personalizadas (Perplexity.ai) e interactúan con las páginas que se estaban visitando (Bing).
Genesis es solo una muestra de lo que la nueva generación de copilots AI data-driven podrá hacer. Dos vienen de la mano del propio Google, Bard y Duet AI, y el otro será Microsoft 365 Copilot. Bard estará incorporado en el motor de búsqueda (la nueva Search Generative Experience) y se conectará con aplicaciones de Google como Sheets o Docs para generar contenido con la ayuda de Bard y la información online. Por el momento, esto ya es posible en el mercado inglés gracias a las extensiones que han presentado.
Microsoft 365 Copilot y Duet AI serán los primeros en no solamente nutrirse de los datos que encuentren en internet y de las bases de datos con las que han sido entrenados, sino que procesarán los propios datos de usuario o de empresa para generar nueva información. Microsoft 365 Copilot se conectará con Word, Excel, PowerPoint, Outlook, Teams y más. Y Duet AI con todas las apps de Workspace y con las de compañías externas como Asana, Hubspot o Tableau:
Generadores de texto genéricos vs plataformas de contenidos AI-Data Driven
De la misma forma que los chatbots han dado paso a los copilots capaces de interactuar con nuestros datos, los generadores de texto con IA (también conocidos como AI writers o AI copywriters) también han evolucionado en herramientas o plataformas más sofisticadas basadas en datos y no solo en ChatGPT.
Diferencia entre los dos tipos de herramientas para crear contenido con IA
Para entender la diferencia primero hemos de irnos a los generadores sencillos. Éstos son herramientas específicas para la redacción de contenidos que facilitan que el usuario pueda escribir cualquier tipo de texto en base a modelos o plantillas que detrás tienen un prompt ya programado:
Lo único que hay que hacer es indicarle a la herramienta una información mínima como el tipo de audiencia, el soporte, el idioma y el tono deseado (por ejemplo, apelar a los lectores de un blog en español con un tono amigable o informal).
El funcionamiento es el mismo en los cientos de AI copywriters que han ido apareciendo: Ryrt, Quopywriter, Jasper.ai… Algunos han perfeccionado mucho sus resultados gracias a la especialización, como Copysmith en la generación masiva de texto para ecommerce, o Writer en la creación de contenido en entornos corporativos.
Otros han incorporado la conexión a internet, como Closers Copy, Escríbelo o Copy.ai, para ofrecer en tiempo real lo que posiciona en SERPs.
Aún así todavía tienen un gran problema, y es que no extraen las búsquedas de usuario para poder estudiar la search intent.
Los 3 problemas principales de las herramientas de texto con IA genéricas
Pero no es lo único en lo que fallan. La mayoría de las herramientas genéricas para crear contenido con IA presentan estos 3 principales problemas:
- Tecnología limitada: la mayoría están basadas en ChatGPT y replican sus problemas
Las alucinaciones, la falta de fuentes de referencia, los datos falsos o sesgados, en estilo de escritura genérico y la prompt-dependencia son algunas de las características que caracterizan a la IA de ChatGPT y que ya hemos visto en dos experimentos que no funciona para crear contenido de calidad y optimizado.
Pues bien: muchos AI writers o copywriters están construidos con la tecnología de ChatGPT, haciendo uso de su API. Esto significa que presentarán los mismos problemas que este chatbot, salvo excepciones en las que:
- Se entrene un modelo de lenguaje propio desde 0: esto significa poder elegir las bases de datos de las que aprenderá y ajustar las características de las respuestas.
- Se aplique un proceso de fine-tuning al modelo GPT: lo mismo que lo anterior, pero aplicado sobre el modelo GPT de OpenAI.
Al estar especializadas en marketing de contenidos y SEO, estas son las dos soluciones que eligen e incluso combinan las plataformas de contenido AI data-driven. Por contra, y al estar pensadas para copies y textos que en su mayoría no es necesario que estén optimizados, las herramientas genéricas se limitan a funcionar con ChatGPT. En este último caso la figura humana es imprescindible, mientras que en el primero el nivel de implicación es mucho menor.
- No todas se conectan a internet: información desactualizada y no orientada a SERPs
Al igual que el chatbot de OpenAI, los generadores de texto con IA genéricos que funcionan con ChatGPT no se conectan a internet (excepto los que costean la versión Plus, disponible en EEUU), por lo que no pueden extraer información reciente de las SERPs. A esto se le suma que la información más reciente con la que ha sido entrenado ChatGPT es de 2021, lo que imposibilita poder preguntarle o generar contenido acerca de un tema reciente o surgido después de ese año (las versiones de pago no tienen esta limitación).
¿Cómo se puede generar un artículo SEO que posicione sin poder acceder a la información de las SERPs que está respondiendo a las distintas intenciones de búsqueda de los usuarios en un momento determinado?
Sin conectarse a internet y a las SERPs en tiempo real no se puede, porque el contenido incluirá encabezados, keywords e información que estaban vigentes hasta 2021, pero no en tiempo real. De nuevo, esto es algo que sí hacen las plataformas AI data-driven como keytrends especializadas en marketing de contenidos y SEO, que van mucho más allá y permiten investigar la search intent completa (lo veremos).
- No crean contenido optimizado para SEO que cubra la intención de búsqueda
Conectarse a las SERPs para investigar los encabezados de los competidores y arrastrarlos al texto es solo una parte de investigar la intención de búsqueda del usuario, y es lo máximo que algunos AI writers genéricos permiten hacer.
¿Dónde quedan las preguntas que tienen las personas alrededor de un tema, los términos asociados que utilizan y las entidades SEO relacionadas? Son algunos de los datos necesarios para poder crear un artículo SEO optimizado al 100% que haga match con el usuario y con los buscadores.
Es decir, un contenido que cubra la intención de búsqueda y que a la vez esté trabajando la semántica para poder ser encontrado y posicionado por Google. Pero esto no es todo lo importante para trabajar en un contenido. La estrategia que lo rodea es el trampolín a las SERPs no solo de una página, sino de todo un sitio web.
Y aquí es dónde las plataformas de contenido con IA y datos como Keytrends nos dan mucho más. Sigue leyendo esta guía para entender cómo y crea tu cuenta freemium para ponerlo en práctica desde ya. Aunque lo mejor es agendar una demostración con nosotros para que te enseñemos cómo podrías utilizarla en tu día a día y nos hagas todas las preguntas que necesites ⬇️
Plataformas de contenidos AI Data Driven: contenido user-centered con estrategia
Con las plataformas viene pasando lo mismo que los generadores de texto con IA genéricos: no todos son iguales ni tienen el mismo enfoque, y la mayoría han ido evolucionado a la vez que la IA generativa y el mercado. ¡Nosotros mismos empezamos con apenas 3 funcionalidades y ya tenemos más de 10 (ahora estamos optimizándolas)!
Aún así, de forma general podemos decir que las plataformas de contenido AI Data Driven tienen unas características y ventajas más o menos comunes y que cada una explota de forma diferente:
✔️ Tecnología avanzada: GPT + LLMs propios + fine tuning
✔️ Variedad de datos de investigación de SERPs y de usuario
✔️ Generación de briefings y artículos SEO user-centered
✔️ Optimización semántica del contenido a partir de entidades
✔️ Detección de nuevos temas y oportunidades de contenido
✔️ Monitorización y mejora del contenido existente
✔️ Gestión y planificación de la estrategia
Cada plataforma pone el foco en algunas de estas características y otras, como Keytrends, ofrece todas las funcionalidades necesarias para cubrir todo el flujo de trabajo de una estrategia de contenido, incluida la investigación y la creación con IA. Veámos algunas con más detalle.
Ejemplos de plataformas de content marketing basadas en IA + datos
- Wordlift:
Wordlift es una plataforma y plugin para WordPress que ayuda al redactor y/o editor a trabajar una redacción SEO semántica basada en el lenguaje natural o NLG (Natural Language Generation).
Lo hace gracias a una IA propia que crea un grafo de conocimiento o Knowledge Graph para cada proyecto con el objetivo de crear una estrategia de contenidos en la que los artículos optimizados estén interrelacionados gracias al contexto semántico. Este contexto se consigue gracias al uso de entidades SEO y datos estructurados que la propia herramienta identifica y sugiere.
Su content generator es muy diferente a los demás porque crea prompts personalizados a partir de ese grafo y un modelo de lenguaje creado con fine-tuning: “The tool uses a dynamic prompt generated using the data from your knowledge graph and a fine-tuned model customized to align with your brand’s specific examples. This customization ensures the generated content maintains a consistent tone and style per your brand’s identity.”
Esto asegura que los textos creados sigan siempre la misma identidad verbal del proyecto. En definitiva, Wordlift aporta lo que ningún generador de contenido genérico hace: optimización SEO semántica + experiencia de usuario positiva con el texto. ¡Luego te contamos cómo incorporamos nosotros las entidades!
- Frase.io
Frase centra su plataforma en el research y la generación de contenidos y de briefings SEO a partir de los datos de SERPs. Esto incluye el contenido de los competidores posicionados (encabezados y textos de cada apartado), pero también datos de las búsquedas de usuario.
De éste último pueden extraerse 3 tipos de consultas: las PAA de Google, las de Reddit y las de Quora, quedando fuera otras búsquedas relacionadas y keywords sugeridas. A la vez que se investiga la información ésta puede arrastrarse en el editor con sistema drag and drop, justo como lo hacemos en Keytrends. Mira cómo se hace el research con Frase.io.
La redacción se hace de forma idéntica al resto de generadores: se pueden escoger plantillas de texto (prompts predefinidos para títulos, párrafos, introducciones, conclusiones, posts de redes sociales, copies para anuncios…), acciones como expandir o resumir texto y de forma opcional, introducir la instrucción o prompt para cada apartado del artículo.
Por último, tiene un apartado de optimización para incluir keywords faltantes (pero no entidades), referenciar fuentes e incluir enlazado interno. En definitiva: lo básico y necesario para crear un contenido optimizado (un poco cojo de entidades) pero sin features para trabajar la estrategia en global, al igual que Wordlift.
- MarketMuse
El punto fuerte de MarketMuse son los datos que extrae de la competencia para encontrar oportunidades de contenido. Detecta las keywords y temas que otras páginas no cubren para que puedas generar tu ese contenido que falta en las SERPs con su generador y editor de briefings (la redacción funciona con ChatGPT puro).
Es una plataforma que empieza a aproximarse a lo que nosotros hacemos, y es trabajar varios de los procesos que implica una estrategia de contenidos. Permite hacer un keyword research, crear topics clusters y planificar los contenidos en un calendario editorial para tener toda la estrategia bajo control.
Keytrends: plataforma AI data-driven para crear contenido optimizado para las personas
Cuando nacimos nuestra obsesión era automatizar todas las tareas de las estrategias de contenidos. Para hacerlo teníamos dos bazas: la inteligencia artificial y los datos. Como queríamos ayudar a las empresas a generar contenido people first o pensado para las personas decidimos fusionar las dos (así, por cierto, nació nuestro lema helpful content for people with AI):
➡️ Nuestros datos: nos servimos de datos de Google Trends, Google Ads, Search Console, Entidades, las SERPs de Google y más para detectar oportunidades y tendencias, temas de contenido, investigar a los competidores y extraer keywords y consultas. Pero también de los datos internos de tus proyectos para detectar canibalizaciones, analizar tu tráfico y decirte qué páginas puedes mejorar para ser más visible online.
➡️ Nuestra IA: partimos de la versión 3.5 Turbo de ChatGPT y hacemos un proceso de refinado de los prompts. Encadenamos secuencias de órdenes para mejorar las respuestas y hacer frente a todas esas limitaciones de la IA generativa de OpenAI. En algunos casos, como las descripciones para ecommerce y otros casos específicos, aplicamos fine-tunning.
1. Genera contenido con una IA vitaminada con 3 veces más datos que el resto
Como hemos visto a lo largo de esta guía, las plantillas de texto que general contenido a partir de un prompt con ChatGPT no funcionan sin una intención de búsqueda clara que cubrir. Con Keytrends puedes investigar a tu usuario y a tus competidores de forma asistida con todos los datos de Google, las SERPs y el usuario que necesitas sin salir de la plataforma:
Search suggestions
Búsquedas sugeridas por letra, proporción y pregunta
Related questions
Preguntas que hacen los usuarios en relación a un tema
Competitors headings
Encabezados de competidores posicionados
Related searches
Búsquedas relacionadas con keyword principal
SEO entities
Extraídas con diferentes algoritmos, también para News & Images
Con todos estos datos puedes crear un briefing SEO completo. Como extra, podrás trabajar tu autoridad añadiendo fuentes de referencia E-E-A-T de papers reales, y enlazar a otros contenidos tuyos gracias a que nos conectamos con tu proyecto para generar un linking interno automático basado en entidades. Luego, tienes tres opciones para redactar tu texto:
- Utilizar los +30 modelos de texto o prompts predefinidos añadiendo algunas instrucciones para la IA
- Utiliza Keychat, nuestra versión adaptada de ChatGPT.
- Dejar que la IA redacte de forma automática el artículo en base a la información que has encontrado (también puedes dejar que ella misma investigue y te proponga un contenido que tú luego puedas editar). En este caso solo tienes que hacer clic en un botón, y se hará la magia.
Las posibilidades de un AI writer con toda esta información son enormes, y el resultado no tiene nada que ver al ofrecido por las herramientas genéricas, porque respondes directamente a lo que los usuarios buscan y optimizas el contenido de acuerdo a lo que ya existe en las SERPs. Míralo en acción en este vídeo:
2. Utiliza los datos para crear tu estrategia y tomar decisiones de contenido
En Keytrends los datos son el motor de todas las decisiones del contenido que tomas en cada etapa del trabajo de tu estrategia:
Simplificando, estas son las 3 preguntas principales que te vas a hacer a lo largo del desarrollo de tu estrategia de contenidos, y cómo las vas a poder resolver con la ayuda de los datos y las funciones de nuestra plataforma:
📃 ¿Qué temas cubro ya? | ✏️ ¿Sobre qué puedo escribir? | 📈 ¿Cuáles son mis resultados y cómo mejorar? |
✓ Consulta tu calendario y el estado de tus contenidos planificados en el Publishers Panel ✓ Función de canibalizaciones para chequear todos tus contenidos que comparten keyword ✓ Todos los datos de tus páginas integrando tu Search Console | ✓ Usa Trend Discovery para atrapar tendencias en crecimiento real-time ✓ Descubre los top temas de contenido atemporales o evergreen de tu sector ✓ Haz una entities & keywords research completa | ✓ Revisa el posicionamiento de cada contenido con datos de Search Console ✓ Guíate por el Score para detectar oportunidades en tu contenido ✓ Re-optimiza con la función Optimizer y el Copilot |
Como ves, puedes hacer un trabajo 360º en tu estrategia: comprobar qué contenidos tienes ya, decidir cuál nuevo crear, gestionarlo con tu equipo, revisar luego los resultados y re-optimizar para mejorar cuando haga falta. Todo esto no sería posible sin un enfoque data-driven y el poder de la IA para investigar 10 veces más rápido y redactar en 1 solo clic.
Con toda esta información, ahora te toca a ti elegir entre:
🅰️ Servirte de varias herramientas de automatización de contenidos y de IA para cubrir todo el flujo de tu trabajo de tu estrategia
🅱️ Unificar todos tus procesos en una sola plataforma específica para content marketing, que funcione con el poder de la IA y que se base en varias fuentes de datos para crear contenido único y de valor para tus usuarios. Recuerda nuestro lema: helpful content for people with AI.
Para salir de dudas puedes leer el recurso que creamos acerca del mejor tipo de herramienta para optimizar el presupuesto en contenidos (porque sí, ¡el dinero también importa!).
Como siempre, cerramos esta guía con una foto en forma de esquema de todo lo que hemos visto:
¿Qué opinas, se cumplirá nuestra predicción y en el futuro solo veremos herramientas de textos con IA data-driven? Si como nosotros ya te has adelantado y estás usando alguna, déjanos tus impresiones en comentarios (quién sabe, lo mismo nos inspiran para una nueva feature). Si no, ¡crea tu cuenta freemium para ponerlo en práctica desde ya!
Aunque lo mejor es agendar una demostración con nosotros para que te enseñemos cómo podrías utilizarla en tu día a día y nos hagas todas las preguntas que necesites ⬇️
Referencias:
- AI vs Humans – The SEO Content Experiment – Reboot online. (2023, 13 septiembre). https://www.rebootonline.com/blog/ai-vs-humans-content-writing-seo-experiment/
- AI Writer vs. Human Writer: A Content Marketing experiment. (2023, 27 julio). https://www.hotjar.com/blog/ai-vs-human/
- Alkaissi, H., & McFarlane, S. I. (2023). Artificial Hallucinations in ChatGPT: Implications in Scientific Writing. Cureus. https://doi.org/10.7759/cureus.35179
- Bing Webmaster Tools. (s. f.). Webmasters. https://www.bing.com/webmasters/help/webmaster-guidelines-30fba23a
- Blackburn, J. (2023, 10 agosto). 10 helpful ways to use Bard. Google. https://blog.google/products/bard/how-to-use-google-bard/
- Crear contenido útil, fiable y centrado en las personas | centro de la búsqueda de Google. (s. f.). Google for Developers. https://developers.google.com/search/docs/fundamentals/creating-helpful-content?hl=es#how-the-content-was-created
- Generative AI Prohibited Use Policy. (s. f.). Privacy & Terms – Google. https://policies.google.com/terms/generative-ai/use-policy
- Google Search’s helpful content System | Google Search Central. (s. f.). Google for Developers. https://developers.google.com/search/updates/helpful-content-update?hl=en
- Guía de la búsqueda de Google sobre el contenido generado por IA | Blog del Centro de la Búsqueda de Google | Google for Developers. (s. f.). Google for Developers. https://developers.google.com/search/blog/2023/02/google-search-and-ai-content?hl=es
- Mullin, B., & Grant, N. (2023, 20 julio). Google tests A.I. tool that is able to write news articles. The New York Times. https://www.nytimes.com/2023/07/19/business/google-artificial-intelligence-news-articles.html
- Pichai, S. (2023, 6 febrero). An important next step on our AI journey. Google. https://blog.google/technology/ai/bard-google-ai-search-updates/
- Políticas de spam de la búsqueda web de Google | Centro de la búsqueda de Google. (s. f.). Google for Developers. https://developers.google.com/search/docs/essentials/spam-policies?hl=es#spammy-automatically-generated-content
- Shoaib, G. M. (2022, 15 agosto). AI-Based content vs. human created content: Which is the best option? Medium. https://becominghuman.ai/ai-based-content-vs-human-created-content-which-is-the-best-option-3e5078de4edf
- TELUS International. (2023, 6 julio). Generative AI hallucinations: Explanation and Prevention. TELUS International. https://www.telusinternational.com/insights/ai-data/article/generative-ai-hallucinations