En octubre, el equipo de Google SEO respondió a una consulta sobre la validez de utilizar contenido traducido automáticamente que ha sido revisado por una persona y modificado solo ligeramente.
Reescritura: Episodio de Google SEO-Office Hours.
En esta edición de la sesión de Office-Hours se ha implementado un enfoque diferente, en el cual las preguntas son escritas y las respuestas se proporcionan más adelante.
Las personas de Google que contestan las preguntas son Lizzi Sassman y John Mueller.
Lizzi Sassman (@okaylizzi) es un escritor técnico que se dedica a la documentación de Google Site Central con gran interés.
A diferencia del formato previo en directo, en el cual la audiencia realizaba preguntas en tiempo real, esta nueva modalidad no permite realizar preguntas adicionales para obtener más información.
Esto conduce a respuestas que reflejan la información de Google, sin opción de solicitar explicaciones adicionales.
La persona que formuló la pregunta mostraba inquietud respecto al contenido, el cual había sido traducido por una máquina desde otro idioma.
Contrataron a editores humanos para revisar el material que se consideró generalmente apropiado, necesitando solo ajustes menores.
Claro, la persona que plantea la pregunta está interesada en saber si los “pequeños cambios” son adecuados para que el contenido sea considerado aceptable por Google.
Lizzi Sassman contestó la pregunta de manera similar a la información proporcionada por Google.
Se podría argumentar que la respuesta podría haber sido más clara si se hubiera hecho una pregunta adicional para averiguar si los ajustes pequeños son adecuados.
En definitiva, se cuestiona si los cambios pequeños son adecuados para Google.
Quizás la solución sugerida es emplear su criterio para evaluar la calidad del contenido que ha sido traducido.
Evalúa por ti mismo.
¿Se considera aceptable la máquina editada con moderación?
Se indagó:
Un sitio web emplea la traducción automática para proporcionar contenidos en diferentes lenguas.
El material es evaluado por traductores profesionales y generalmente están satisfechos con la calidad una vez realizados pequeños cambios.
¿Es aceptable para Google?
Lizzi Sassman de Google dio una respuesta.
Es positivo saber que los traductores humanos están contentos y que Google considera adecuado siempre que haya un humano que revise el proceso. Esa es la parte crucial.
Lo importante es garantizar que la calidad del contenido se mantenga alta y sea útil para las personas que lo están leyendo.
El texto no aclara si las versiones más pequeñas son aceptables, solo indica que si los traductores humanos lo consideran bueno, entonces también lo será para Google.
¿Es posible que Google no verifique si el contenido ha sido traducido por máquina, sino que se base en las señales comunes de calidad del contenido?
La información es desconocida.
El nuevo estilo de Office-Hours no permite que la persona que pregunta haga una pregunta adicional.
Políticas de spam de Google
La información proporcionada por Google para desarrolladores acerca de contenido considerado spam hace referencia a las herramientas automáticas de traducción de texto, indicando que se considera spam a menos que haya intervención humana.
Estas son las palabras que se encuentran en la documentación de Google.
Algunos ejemplos de contenido autogenerado de espátula son:
Texto: “Texto que fue traducido por una herramienta automatizada sin revisión ni corrección humana antes de ser publicado”.
Por lo tanto, según las pautas publicadas por Google, si un ser humano está revisando el contenido traducido por una máquina, Google lo considerará válido.
En un video de Google Office-Hours de abril de 2022, John Mueller explicó que el contenido producido por inteligencia artificial se clasifica como spam, y también mencionó el contenido autotraducido.
Mueller discutió acerca de herramientas de inteligencia artificial para crear contenido y las contrastó con herramientas de traducción automática.
En el minuto 24:55 del video Office-Hours de abril de 2022, se mencionó por Mueller:
“Considero que, posiblemente con el transcurso del tiempo, esto podría desarrollarse y transformarse en algo más que una simple herramienta para las personas.”
¿Cómo emplearía la traducción automática como punto de partida para generar una versión traducida de un sitio web?
Sin embargo, en última instancia, se trata de trabajar en ello de forma manual.
¿Por qué se opta por un contenido autotraducido?
Google se preocupa por ofrecer contenido de alta calidad en las páginas de resultados del motor de búsqueda (SERPs) para garantizar la satisfacción de los usuarios.
No se mencionó que el contenido traducido incluye firmas que pueden ser detectadas por un algoritmo de detección de traducción.
Identificar contenido generado por una máquina se ha estudiado a lo largo de varios años.
Según un estudio reciente del año 2021, se sugiere que puede resultar difícil para las personas identificar contenido traducido de un idioma a otro.
Por ejemplo, al usar 100 textos traducidos, los evaluadores humanos solo lograron reconocer más del 50% de los textos traducidos.
Los expertos indicaron:
El porcentaje promedio de precisión fue del 53,3%, siendo del 55,0% para los hablantes nativos y del 52,0% para los hablantes no nativos, lo cual se aproximaba al azar.
El enfoque conocido como Text Similarity With Round-Trip Translation (TSRT) superó la evaluación de personas y obtuvo una puntuación más alta que los sistemas de traducción más avanzados al momento de la publicación del artículo en 2021.
Es impresionante que esta técnica pueda identificar el idioma original de los textos que han sido traducidos.
Además, puede identificar cuál algoritmo de traducción se utilizó para realizar la traducción.
They provided information:
Los resultados de la evaluación indican que TSRT sobresale sobre otros en términos de precisión, alcanzando un máximo del 90,2%.
Adicionalmente, el TSRT también logró reconocer con un 93,3% de precisión el idioma original del texto traducido, y con un 85,6% de precisión la traducción en sí.
No se sabe con certeza si Google tiene la capacidad de identificar contenido que ha sido traducido, ni si Google está intentando identificarlo o no.
Sabemos que contamos con la tecnología necesaria para identificarla. Esta tecnología es capaz de detectar de manera más precisa que los humanos si un contenido ha sido traducido, y también puede determinar qué algoritmo de traducción se utilizó.
Si el hecho de que viola las Directrices para Webmasters y puede afectar de manera negativa la experiencia del usuario no es motivo suficiente para corregir el contenido traducido automáticamente, quizás la posibilidad de que Google esté evaluando la calidad del contenido traducido de forma automática pueda ser una razón para revisar completamente ese tipo de contenido.
Reformulación: Cita.
Escucha la sesión de Google Office Hours en el Hangout a partir del minuto 17:50.
Fotografía principal proporcionada por Shutterstock/g_tech.