Методы идентификации авторства в определении студенческого плагиата
Date
2023Publisher
Another Title
Authorship identification methods in student plagiarism detection
Bibliographic entry
Парамонов, А. И. Методы идентификации авторства в определении студенческого плагиата = Authorship identification methods in student plagiarism detection / А. И. Парамонов, И. А. Труханович // Системный анализ и прикладная информатика. – 2023. – № 3. – С. 56-59.
Abstract
В современном образовательном контексте проблема плагиата является актуальной и требует разработки эффективных методов обнаружения и предотвращения данного явления. Рассмотрено применение методов идентификации авторства в области обнаружения студенческого плагиата. Исследованы различные подходы, используемые для проверки, обнаружения и анализа плагиата в различных работах. Рассмотрены как классические методы, в числе которых сравнение текстов и поиск сходства, так и современные методы, основанные на алгоритмах машинного обучения, а также их комбинирование и потенциальные модификации. Также обсуждены преимущества и ограничения каждого метода и даны рекомендации по выбору того или иного подхода в соответствии с конкретными требованиями исследования. Особое внимание уделено таким современным методам, как анализ метаданных и применение нейронных сетей. Стилистический анализ позволяет выявить авторские особенности, такие как выбор слов, предпочтительные формулировки и даже пунктуация. Лексические и синтаксические модели используются для выявления повторяющихся фраз и структур, которые могут указывать на плагиат. Статистические методы позволяют выявить аномалии в употреблении слов и фраз, а машинное обучение – создать модели, позволяющие рассчитать вероятность плагиата на основе большого количества данных. В конечном итоге предоставлено сравнение методов идентификации авторства в области определения студенческого плагиата, что имеет целью дать ценную информацию о различных подходах и их применимости, а также поможет исследователям и преподавателям разработать эффективные стратегии выявления и предотвращения плагиата в образовательной среде.
Abstract in another language
In the modern educational context the problem of plagiarism is urgent and requires the development of effective methods of detection and prevention of this phenomenon. The application of authorship identification methods in the field of student plagiarism detection is considered. Different check, detect and analyze plagiarism approaches in various works are investigated. Both classical methods, which include text comparison and similarity search, and modern methods based on machine learning algorithms, as well as their combination and potential modifications, are considered. The advantages and limitations of each method are also discussed, and recommendations are given for choosing one or another approach according to the specific requirements of the research. Special attention is paid to such modern methods as metadata analysis and the application of neural networks. Stylistic analysis reveals authorial peculiarities such as word choice, preferred wording, and even punctuation. Lexical and syntactic models are used to identify repetitive phrases and structures that may indicate plagiarism. Statistical methods can identify anomalies in the use of words and phrases, and machine learning can create models to calculate the probability of plagiarism based on large amounts of data. Ultimately, an comparison of authorship identification techniques in the field of student plagiarism detection is provided, which aims to provide valuable information about different approaches and their applicability, and to help researchers and educators develop effective strategies for detecting and preventing plagiarism in educational environments.
View/ Open
Collections
- № 3[8]