Blog   ·  

Cómo dar un mayor significado a la puntuación de similitud

Gretchen Hanson
Gretchen Hanson

Suscríbete

 

 

 

 

Al completar este formulario, aceptas la Política de Privacidad de Turnitin. Utilizaremos los datos que nos proporcionas para compartir información relevante. Puedes darte de baja de nuestras listas en cualquier momento.

 

Existe mucha confusión en torno a la puntuación de similitud de Turnitin. ¿Cuál es el porcentaje correcto? ¿El porcentaje es demasiado elevado? ¿O es demasiado bajo? La decisión corresponde, en última instancia, al instructor en cuestión. En esta entrada, nos gustaría ofrecer algunos conocimientos para que los instructores puedan tomar decisiones bien fundadas en torno a la puntuación de similitud. Para evitar cualquier duda sobre el porcentaje de puntuación, explicamos cómo se crea el informe de similitud. Ofrecemos además algunos consejos para ir más allá del porcentaje y evaluar la amplia información incluida en dicho informe de similitud.

¿Cómo funciona la puntuación de similitud de Turnitin?

Cuando un estudiante entrega su documento, la cuestión empieza a ponerse interesante (desde el punto de vista de la programación). En cuestión de milésimas de segundo, Turnitin realiza algunas operaciones increíbles con el documento.

Para empezar, todas las palabras se agrupan en frases y se eliminan palabras comunes (como “y”, “o”, “el”, “la” o “los”). Cada frase se almacena con su propia y única “huella” identificativa. A continuación, comparamos las identificaciones de cada frase con nuestras bases de datos de contenidos para determinar si hubiera alguna coincidencia.

En nuestras bases de datos de contenidos se incluyen más de 1,2 mil millones de entregas de estudiantes, 70 mil millones de páginas web actuales y archivadas, y 180 millones de artículos de las fuentes y revistas académicas más prestigiosas. El ritmo de crecimiento de la amplitud y el contenido de Turnitin es de millones al día.

Cada documento entregado puede incluir hasta 80.000 identificaciones de frases. Cada identificación de frase se compara con 7 billones de coincidencias de frases posibles procedentes de los contenidos de las bases de datos. En el caso de que el software de Turnitin localizara posibles coincidencias, el mismo software aplicaría un procesamiento de lenguaje natural y una estricta heurística de coincidencias para reducir el número de falsos positivos y generar un informe lo más exacto posible. También hay otros procesos sofisticados que se hacen conjuntamente, como la búsqueda de texto oculto o caracteres sustituidos, con el fin de mejorar los resultados. Pero no nos compliquemos por el momento.

Todo lo anterior ocurre en cuestión de 10 segundos y tiene como resultado un informe de similitud.

(Nota interesante: Turnitin genera aproximadamente 20 informes por segundo. Y en los días en los que hay más actividad, ¡puede recibir más de 1 millón de entregas!).

Cómo valorar el informe de similitud

En última instancia, el informe de similitud ofrece al instructor información sobre todas las fuentes en las que Turnitin encontró texto o frases coincidentes. Cada coincidencia se subraya y asocia con la fuente más importante o pertinente. Como es de imaginar, si tenemos en cuenta que la base de datos contra la que se compara cualquier coincidencia es enorme, es probable que las fuentes sean múltiples. Por ello, para cada coincidencia determinaremos qué fuente es la más importante o significativa y la citaremos como la fuente principal. Así que, incluso si el instructor decide excluir esa fuente, es probable que haya una fuente adicional con la coincidencia, por lo que la puntuación general de similitud puede no cambiar.

Teniendo esto en cuenta, ¿cómo recomendamos evaluar las coincidencias encontradas en el informe de similitud? En primer lugar, hay que saber que existen opciones para afinar las coincidencias encontradas. Puedes elegir eliminar citas, bibliografías, pequeñas coincidencias de menos de un determinado número de palabras, fuentes e incluso bases de datos completas. Por ejemplo, si no quieres que se compare con las entregas de otros estudiantes, los instructores pueden excluir el archivo de trabajos entregados.

Puedes asimismo excluir una coincidencia de texto concreta e informar a Turnitin del motivo por el que no era una coincidencia relevante. Utilizaremos esta información a fin de seguir formando nuestro algoritmo de coincidencias para que sea más inteligente y produzca unos resultados de similitud aún mejores.

Todas estas exclusiones se podrán aplicar tanto antes de realizar el informe de similitud como mientras se está usando el informe. Si quieres guardar las exclusiones, puedes imprimir el informe o crear un pdf para guardar los cambios dinámicos.

Dichas exclusiones, pueden contribuir a reducir las coincidencias más importantes. Pueden ayudarte a identificar dónde pueden haberse cometido errores en citas, por lo que puedes ofrecer esa orientación y retroalimentación a los estudiantes. Dependiendo de lo que quieras evaluar. El informe de similitud puede contribuir a reducir los puntos en los que te deberías centrar.

La puntuación de similitud es simplemente un reflejo del porcentaje de palabras similares. Sin embargo, el objeto del informe de similitud es ayudar a los profesores a identificar problemas, centrarse en áreas de excelencia o crecimiento y orientar la retroalimentación, con el fin de ayudar a sus estudiantes a mejorar su redacción y que la integridad se encuentre en la esencia de todo lo que hacen.