Письма в

 Эмиссия.Оффлайн

2025

 The Emissia.Offline Letters        Электронное научное издание (педагогические и психологические науки)       Издается с 7 ноября 1995 г.

ART  3597

 2025 г., выпуск  № 10 (октябрь)


Ссылаться на эту работу следует следующим образом:
Н.В.Макерова, Я.А.Докторова. Интеллектуальная система проверки корректности употребления английских терминов в IT-документации и учебных текстах // Письма в Эмиссия.Оффлайн (The Emissia.Offline Letters): электронный научный журнал. 2025. №10 (октябрь). ART 3597. URL: http://emissia.org/offline/2025/3597.htm

_________ Шифр научной специальности 5.8.7.
_________ УДК 372.8

Макерова Наталья Владимировна
кандидат педагогических наук, доцент, кафедра гуманитарных наук, филиал Национального Исследовательского Университета «Московский Энергетический Институт», г. Смоленск
makerita@yandex.ru

Докторова Яна Андреевна
магистрант, кафедра вычислительной техники, филиал Национального Исследовательского Университета «Московский Энергетический Институт», г. Смоленск
yanadoctorova@mail.ru

Интеллектуальная система проверки корректности употребления английских терминов в IT-документации и учебных текстах

Аннотация
В статье предложена концепция интеллектуальной системы для автоматической проверки корректности употребления английских терминов в IT-документации и учебных текстах. Новизна разработки заключается в комплексном подходе, сочетающем модульную архитектуру, специализированную терминологическую базу и применение технологий обработки естественного языка. Практическая ценность системы подтверждается её универсальностью и широкой областью применения – от поддержки образовательного процесса в вузах до контроля корпоративной документации.

Ключевые слова: интеллектуальная система, проверка терминологии, IT-документация, учебные тексты, обработка естественного языка.

----------------

Natalya V. Makerova
Candidate of Pedagogical Sciences, Associate Professor, Department of Humanities, Branch of the National Research University “Moscow Power Engineering Institute”, Smolensk
makerita@yandex.ru

Yana A. Doktorova
Master's Student, Department of Computer Engineering, Branch of the National Research University “Moscow Power Engineering Institute”, Smolensk
yanadoctorova@mail.ru

Intelligent System for Verifying the Correct Use of English Terms in IT Documentation and Educational Texts

Abstract
The paper presents the concept of an intelligent system for automatic verification of the correct use of English terms in IT documentation and educational texts. The novelty of the proposed approach lies in its integrated design, which combines modular architecture, a specialized terminology database, and the use of natural language processing technologies. The practical value of the system is confirmed by its versatility and a wide scope of application – from supporting the educational process at universities to monitoring corporate documentation.

Key words: intelligent system, terminology verification, IT documentation, educational texts, natural language processing.

----------------

Распространение англоязычной терминологии в отрасли информационных технологий представляет собой устойчивую тенденцию, обусловленную процессами глобализации и доминирующей ролью английского языка как универсального средства профессиональной коммуникации. Данный феномен оказывает существенное влияние на формирование специализированных дискурсов и требует системного изучения. Большая часть новых понятий, технологий и методологий, изначально сформулированная на английском языке, без предварительной адаптации переходит в обиход международных IT-специалистов. В результате такая терминология активно используется в технических руководствах, пользовательских инструкциях, документации по программному обеспечению, а также в научных публикациях и учебных текстах [1].

Применение иностранных терминов нередко сопровождается нарушением языковых норм: орфографическими и морфологическими ошибками, несогласованностью написания и перевода. Это существенно снижает качество документации, затрудняет её восприятие и в некоторых случаях приводит к искажению смысла. Указанная проблема актуальна не только в профессиональной, но и в образовательной среде, где терминологическая точность и единообразие имеют принципиальное значение. В этой связи возникает необходимость разработки инструментов, способных автоматически проверять корректность употребления английских терминов с учётом специфики технического текста.

Отметим, что автоматизированная проверка текста широко распространена в различных сферах человеческой деятельности. Наиболее активно развиваются технологии обработки естественного языка (Natural Language Processing, NLP), машинного обучения и экспертных систем [2]. Их применение позволяет создавать интеллектуальные системы для анализа текстов на грамматическом, синтаксическом и семантическом уровнях. Однако, несмотря на значительный прогресс в этой области, задачи, связанные с контролем корректности терминологии, особенно в технических текстах, всё ещё остаются слабо проработанными.

Среди наиболее известных систем общего назначения можно выделить следующие онлайн-сервисы: Grammarly, LanguageTool и DeepLWrite. Они хорошо справляются с базовой проверкой грамматики и пунктуации, но при работе с документацией, содержащей специализированную лексику, их эффективность заметно снижается. Большинство подобных систем не распознают термины как отдельную языковую категорию и не имеют доступа к специализированным глоссариям или контекстной информации из профессиональной области.

К числу смежных ресурсов можно отнести системы машинного перевода, такие как GoogleTranslate или DeepL. Их алгоритмы во многих случаях обеспечивают высокое качество обработки текстов и частично решают проблему понятийной точности. Вместе с тем цель подобных решений отличается от задач терминологической проверки: переводческие средства направлены на преобразование текста с одного языка на другой, тогда как интеллектуальная система проверки фокусируется на правильности и единообразии использования профессиональных терминов в рамках одного языка. Более того, сервисы перевода не всегда учитывают специфику профессиональной лексики и могут предлагать варианты, не соответствующие устоявшейся в IT-сфере практике.

Для устранения ограничений существующих инструментов некоторые авторы и организации предлагают использовать специализированные терминологические базы. Например, такие ресурсы, как IATE (InteractiveTerminologyforEurope) – база терминов, используемая в институтах Евросоюза, а также MicrosoftWritingStyleGuide, содержащий рекомендации по употреблению терминов и формулировок в технических текстах. В Российской Федерации для подобных целей применяются терминологические словари и глоссарии, используемые в профессиональной практике. Однако эти источники, несмотря на высокую точность, требуют ручного обращения и не интегрированы в автоматические системы проверки, что существенно ограничивает их практическое применение в контексте оперативного анализа IT-документации.

Выявленные недостатки существующих решений позволяют утверждать, что в основу специализированной интеллектуальной системы целесообразно включить автоматическую проверку, обновляемую терминологическую базу и анализ контекста употребления терминов. Считаем, что перспективным подходом к реализации подобной разработки может стать модульный принцип, обеспечивающий гибкость и возможность поэтапного расширения функционала. Предполагается, что работа такого инструмента может быть организована в несколько последовательных шагов. Сначала выполняется предварительная обработка текста: выделяются языковые единицы, определяется язык и формируется список потенциальных терминов. На следующем этапе целесообразно применять модуль терминологического анализа, сопоставляющий найденные элементы с базой данных и выявляющий возможные несоответствия. Дополнительно может использоваться компонент семантического анализа, который позволит учитывать контекст употребления терминов и корректнее интерпретировать их значение. Для конечного пользователя система должна предусматривать интерфейс, предоставляющий варианты исправлений, пояснения ошибок и возможность обучения на новых примерах.

Важной частью предлагаемой системы является терминологическая база, от качества и актуальности которой напрямую зависит эффективность проверки. Её формирование целесообразно осуществлять на основе достоверных источников, включая научные публикации, международные стандарты, разрабатываемые организациями ISO и IEEE, а также ГОСТ, регламентирующих терминологию в IT-документации, в частности, ГОСТ 33707-2016 (ISO/IEC 2382:2015) [3]. Дополнительно для расширения базы могут использоваться открытые репозитории программного кода и документации, такие как GitHub. Данный ресурс может служить источником для анализа комментариев, README-файлов и документации проектов, что позволяет выявить современную практику употребления терминов в реальных разработках.

Применение технологий обработки естественного языка будет способствовать обеспечению интеллектуального функционала системы. Это позволит осуществлять формальную проверку и оценивать корректность терминов с учётом их смысловых связей и контекста использования. В качестве технологического фундамента можно применять современные языковые модели, например, BERT, а также инструменты лингвистического анализа, такие как spaCy [4]. Качество работы системы напрямую зависит от обучения на наборах данных, содержащих примеры как правильного, так и ошибочного употребления терминов в профессиональных текстах. Это даёт возможность не только фиксировать характерные отклонения от нормы, но и формулировать предложения по их исправлению. Неотъемлемым элементом развития системы выступает цикл экспертной оценки и корректировки, направленный на повышение точности алгоритмов.

Практическая ценность предлагаемого инструмента подтверждается его универсальностью и широкой областью применения. В IT-индустрии она может быть полезна техническим писателям, отвечающим за подготовку руководств и справочных материалов, а также разработчикам, обеспечивая единообразие и корректность применения профессиональной терминологии в документах. Сценарии использования охватывают аудит корпоративной документации, проверку открытых репозиториев с программным кодом, контроль терминологии в технических спецификациях и проектных материалах.

Значимая группа пользователей системы – преподаватели вузов и студенты технических специальностей. В образовательном процессе инструмент помогает обучающимся развивать практические навыки работы с англоязычной IT-терминологией. Студенты получают возможность проверять тексты, анализировать ошибки и корректировать формулировки, что способствует более глубокому усвоению профессиональной лексики. Для преподавателей система выступает удобным помощником при оценке учебных работ и позволяет эффективнее организовывать учебный процесс.

Для широкого распространения систему целесообразно интегрировать в популярные учебные среды и образовательные платформы. Это не только обеспечит доступность инструмента, но и позволит унифицировать требования к терминологии, востребованные как в индустриальной, так и академической среде.

Перманентное развитие сферы информационных технологий детерминирует изменения понятийного аппарата, а также лексического состава профессионального языка. Это создаёт потребность в инструментах, которые обеспечивают корректное и единообразное использование терминологии в данной отрасли. Предложенный подход может стать основой для разработки интеллектуальной системы, способной интегрироваться в практику подготовки технических текстов и образовательных процессов. В дальнейшем такие решения могут способствовать не только повышению качества рабочей документации и учебных текстов, но и формированию новых стандартов работы с профессиональной лексикой в цифровой среде.


Литература

  1. Хасанова Л.В., Каримова Л.К., Мухаметзянова Ф.Г., Низаев Р.Р. Английские заимствования в русской терминологии сферы информационных технологий // Казанский вестник молодых учёных. 2018. №3. C. 169-173.

  2. Adapting natural language processing for technical text. URL: https://onlinelibrary.wiley.com/doi/full/10.1002/ail2.33 [Дата обращения 01.10.2025]

  3. ГОСТ 33707–2016. Информационные технологии. Словарь (ISO/IEC 2382:2015). М.: Стандартинформ, 2016. 332 с. URL: https://docs.cntd.ru/document/1200139532 [Дата обращения 01.10.2025]

  4. Новиков А.С., Шарлаев Е.В. Использование языковой модели BERT для анализа текстов на русском языке // НАУКОСФЕРА. 2021. №6. C. 200-202.

Рекомендовано к публикации:
А.А.Ахаян, доктор педагогических наук, член Редакционной Коллегии

Literature

  1. Khasanova L.V., Karimova L.K., Mukhametzyanova F.G., Nizayev R.R. Angliyskiye zaimstvovaniya v russkoy terminologii sfery informatsionnykh tekhnologiy // Kazanskiy vestnik molodykh uchonykh. 2018. №3. C. 169-173.

  2. Adapting natural language processing for technical text. URL: https://onlinelibrary.wiley.com/doi/full/10.1002/ail2.33 [Data obrashcheniya 01.10.2025]

  3. GOST 33707–2016. Informatsionnyye tekhnologii. Slovar' (ISO/IEC 2382:2015). M.: Standartinform, 2016. 332 s. URL: https://docs.cntd.ru/document/1200139532 [Data obrashcheniya 01.10.2025]

  4. Novikov A.S., Sharlayev Ye.V. Ispol'zovaniye yazykovoy modeli BERT dlya analiza tekstov na russkom yazyke // NAUKOSFERA. 2021. №6. C. 200-202.
     

    ----------------

    Конфликт интересов: авторы заявляют об отсутствии потенциального или явного конфликта интересов.
    Conflict of Interest:
     authors declare that there is no conflict of interest, either existing or potential.

    Соответствие принципам этики: авторы сообщают, что при проведении исследования соблюдены этические принципы, предусмотренные для исследований с участием людей и животных.
    Ethics Approval:
     authors declare that the study complies with all ethical principles applicable to human and animal research.

    Заявление о доступности данных: данные доступны по запросу, адресованному авторам.
    Data Availability Statement:
     data are available upon request submitted to the corresponding author.

    Вклад авторов: авторы заявляют о равном вкладе в подготовку статьи
    Author Contributions:
     authors declare equal contribution to the preparation of the article.


Copyright (C) 2025, Письма в Эмиссия.Оффлайн (The Emissia.Offline Letters): электронный научный журнал
ISSN 1997-8588 (
online). ISSN 2500-2244 (CD-R)
Свидетельство о регистрации СМИ Эл № ФС77-33379 (000863) от 02.10.2008 от Федеральной службы по надзору в сфере связи и массовых коммуникаций
При перепечатке и цитировании просим ссылаться на " Письма в Эмиссия.Оффлайн
".
Эл.почтаemissia@mail.ru  Internet: http://www.emissia.org/  Тел.: +7-812-9817711, +7-904-3301873
Адрес редакции: 191186, Санкт-Петербург, наб. р. Мойки, 48, РГПУ им. А.И.Герцена
Учредитель:
 Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский государственный педагогический университет
им. А.И.Герцена
""
Издатель: Консультационное бюро доктора Ахаяна [ИП Ахаян А.А.], гос. рег. 306784721900012 от 07,08,2006.

Рейтинг@Mail.ru

    Rambler's Top100