Оценка совпадений Turnitin вызывает много вопросов. Сколько процентов совпадений должно быть? Указанная в отчете цифра, это слишком много? Или мало? Обычно решение о том, какой процент уникальности позволяет засчитать работу, принимает педагог. В этой статье мы как раз хотим помочь учителям, преподавателям и тренерам разобраться в том, как работает отчет о совпадениях, чтобы принимать осознанные решения касательно необходимого процента. И поможет нам подробная информация о том, как именно создается отчет о совпадениях, и подсказки о том, как выйти за рамки процентного соотношения совпадений и оценить информацию в отчете.
Как Turnitin находит совпадения в тексте?
Когда студент или ученик загружает документ, Turnitin обрабатывает его за несколько миллисекунд. В это время происходит удивительное.
Сперва все предложения делятся на фразы, из которых удаляются стоп-слова (например, “и”, “или”, “не” и другие). Каждую фразу инструмент сохраняет под уникальным “отпечатком” - ID, который сравнивается с другими ID в наших базах данных. Так мы и находим совпадения.
Наши базы контента содержат более, чем 1,2 миллиарда студенческих работ, 70 миллиардов существующих и архивных веб-страниц, 180 миллионов статей из лучших научных журналов и источников, и это количество ежедневно растет.
Каждый загруженный документ может содержать до 80 тысяч ID фраз; каждый такой ID сравнивается с семью триллионами возможных совпадений, которые Turnitin находит в контентных базах данных. Если программное обеспечение Turnitin обнаруживает потенциальные совпадения, оно применяет естественную обработку речи и эвристику строгого совпадения, чтобы ограничить количество ложных совпадений и сформировать как можно более точный отчет. Параллельно с этим происходят и другие удивительные вещи, среди которых - поиск скрытого текста или замененных символов. Все это тоже улучшает результат.
Все описанное происходит в течение 10 секунд. На выходе вы получаете отчет о совпадениях.
(Интересный факт: Turnitin создает около 20 отчетов в секунду. В самые загруженные дни наш сервис принимает более миллиона работ!)
Как оценить отчет о совпадениях
Отчет о совпадениях предоставляет преподавателю информацию обо всех источниках, в которых Turnitin обнаружил совпадающие фразы или фрагменты текста. Каждое совпадение выделено и связано с наиболее релевантным источником. Можете представить: с такой огромной базой контента сравнение часто дает больше одного источника совпадений. В таком случае мы определяем важность каждого из них и принимаем наиболее весомый за первоисточник. Поэтому даже если преподаватели решат исключить его из сравнения, может найтись другой источник с этим же совпадением. Тогда ваша общая оценка уникальности не поменяется.
Вот как мы посоветуем оценивать совпадения в отчете. В первую очередь, нужно понимать, что некоторые из них можно сразу убрать - цитаты, ссылки, мелкие совпадения до определенного количества слов, списки литературы и даже целые базы данных. Например, если вы не хотите сравнивать текст с другими студенческими работами, эту функцию можно отключить.
Преподаватель также может исключить специфическую фразу в совпадениях и уведомить Turnitin о том, почему он это сделал. Такая информация крайне ценна. Мы используем ее, чтобы обучать наш алгоритм совпадений, а когда алгоритм становится умнее, наш отчет становится точнее.
Все эти исключения можно сделать перед анализом текста на уникальность, а можно во время. Если хотите сохранить исключения, отчет можно напечатать или скачать в формате .pdf.
Такие исключения помогут вам уменьшить количество совпадений, оставив лишь весомые. Если проблема только в неправильном цитировании, это будет заметно, и вы сможете сразу сообщить студенту, что и как ему нужно исправить. Отчет о совпадениях поможет вам сфокусироваться на конкретной задаче, не распыляясь на малозначимые аспекты.
Оценка совпадений - это просто отражение количества совпадений в тексте в процентах. Она помогает педагогам определять проблемы, выявлять области, в которых студент преуспевает, и давать обратную связь с подсказкой, как улучшить письмо и добиться академической честности в каждом тексте.