Лингвистическая база данных системы автоматического порождения англоязычного рекламного текста
Another Title
Linguistic database for automatic generation system of english advertising texts
Bibliographic entry
Метлицкая, Н. А. Лингвистическая база данных системы автоматического порождения англоязычного рекламного текста = Linguistic database for automatic generation system of english advertising texts / Н. А. Метлицкая // Системный анализ и прикладная информатика. - 2017. – №2. - С. 62-67.
Abstract
Целью данной работы является разработка лингвистического обеспечения автоматической системы порождения англоязычного рекламного текста по косметике и парфюмерии, и ее последующая реализация в виде компьютерной программы. Создаваемая система разрабатывается по принципу лингвистически мотивированных технологий, что требует использования широкого спектра лингвистических знаний о структуре и содержании порождаемого текста (базы данных, семантические и формальные языки). Лингвистическая база данных рассматриваемой системы включает следующие компоненты: автоматический словарь лексических единиц с указанием семантических и морфологических сведений, семантико-синтаксические формулы текстов на формальном языке СЕМСИНТ. В работе рассматривается каждая составляющая этой базы данных. Словарь лексических единиц строится на основе анализа тридцати оригинальных англоязычных рекламных текстов по косметике и парфюмерии, относящимся к трем предметным областям (губная помада, тушь для ресниц, шампунь). Словарная статья автоматического словаря включает две зоны: зону грамматических сведений, зону семантических сведений. Зона грамматических сведений содержит информацию о части речи лексической единицы, а также набор ее морфологических признаков. Зона семантических сведений включает семантический признак лексической единицы, т. е. ее отнесенность к определенному семантическому подклассу. Для этого была произведена семантическая классификация всех слов исследуемых текстов с присвоением им соответствующих кодов. В качестве примера в работе приводится результат семантической классификации имен существительных исследуемых рекламных текстов предметной области «губная помада». Вторую часть базы данных составляют семантико-синтаксические формулы текстов на формальном языке СЕМСИНТ. В работе описываются составляющие языка СЕМСИНТ, а также рассматривается его сущность и правила его использования. Представлен пример семантико-синтаксической формулы текста, созданной средствами данного формального языка.
Abstract in another language
The article deals with the linguistic database for the system of automatic generation of English advertising texts on cosmetics and perfumery. The database for such a system includes two main blocks: automatic dictionary (that contains semantic and morphological information for each word), and semantic-syntactical formulas of the texts in a special formal language SEMSINT. The database is built on the result of the analysis of 30 English advertising texts on cosmetics and perfumery. First, each word was given a unique code. For example, N stands for nouns, A – for adjectives, V – for verbs, etc. Then all the lexicon of the analyzed texts was distributed into different semantic categories. According to this semantic classification each word was given a special semantic code. For example, the record N01 that is attributed to the word «lip» in the dictionary means that this word refers to nouns of the semantic category «part of a human’s body». The second block of the database includes the semantic-syntactical formulas of the analyzed advertising texts written in a special formal language SEMSINT. The author gives a brief description of this language, presenting its essence and structure. Also, an example of one formalized advertising text in SEMSINT is provided.
View/ Open
Collections
- №2[8]