Метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов

PDF
Mark as finished
How to read the book after purchase
Book description

В статье представлен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов на основе структурных моделей терминологических словосочетаний. Описаны существующие подходы к извлечению терминов на основе метода извлечения устойчивых словосочетаний, статистических и гибридных методов, а также отмечены лингвистические аспекты терминоведения, не охваченные перечисленными методами. Охарактеризован лексический состав научно-технических текстов, приведена классификация специальной лексики в научно-технических текстах. Изучены структурные особенности терминологической лексики. Представлены наиболее продуктивные модели многокомпонентных терминологических словосочетаний в русском языке. Предложен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов, а также описаны его этапы. Показано, что на первом этапе проводится морфолого-синтаксический анализ текста путем приписывания каждому слову его грамматических характеристик. Затем происходит исключение частей речи, которые не могут входить в состав русскоязычных многокомпонентных терминов, а также стоп-слов, которые вместе с термином образуют свободные словосочетания. Полученные цепочки слов далее соотносятся с шаблонами терминологических словосочетаний, имеющихся в базе структурных моделей терминов, а также с терминологическим словарем на предмет наличия исследуемого термина-кандидата. Обоснована необходимость привлечения терминолога для разрешения неоднозначных случаев. Каждый этап метода извлечения русскоязычных многокомпонентных терминов из научно-технических текстов проиллюстрирован примерами. Перечислены перспективы исследования, а также обоснована необходимость усложнения методов извлечения терминов путем дальнейшей классификации терминологической лексики по формальной и семантической структурам, видам антропоморфных терминов, номенклатурным названиям, нормативности/ненормативности терминологических единиц.

Detailed info
Age restriction:
0+
Date added to LitRes:
01 February 2022
Date written:
2021
Size:
7 pp.
Total size:
0 MB
Total number of pages:
7
Page size:
180 x 255 мм
Copyright:
Синергия
Метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов by Ю. И. Бутенко—download pdf or read online. Leave comments and reviews, vote for your favorite.
Book is part of series
«Прикладная информатика. Научные статьи»
Постановка задачи обеспечения автоматизации полного цикла поддержки принятия решения
Исследование цветовых отличий при воспроизведении памятных цветов на устройствах визуализации
Задача параметрического программирования с моделями прогнозирования урожайности сельскохозяйственных культур
-5%

Отзывы

Сначала популярные

Оставьте отзыв