Особливості створення корпусу текстів підручників китайської мови початкового рівня

Ситник, Ілона Василівна (2021) Особливості створення корпусу текстів підручників китайської мови початкового рівня «Вчені записки Таврійського національного університету імені В. І. Вернадського. Серія: Філологія. Журналістика» (32). pp. 35-41.

[thumbnail of I_Sytnyk_VZTNUIV_32_KUBG.pdf] Text
I_Sytnyk_VZTNUIV_32_KUBG.pdf

Download (577kB)

Abstract

Стаття присвячена дослідженню основних принципів формування корпусу текстів підручників китайської мови початкового рівня. Описано функції корпусу текстів у лінгвістиці. Авторкою відзначені особливості китайської мови, які необхідно враховувати при створенні корпусу текстів китайської мови. Запропоновано основні етапи створення корпусу текстів підручників китайської мови. Систематизовано та охарактеризовано основні принципи створення корпусу текстів: репрезентативність, автентичність, відібраність, збалансованість, машиночитаність. З’ясовано, що процес укладання корпусу пов’язаний також з проблемою виділення тексту, який слід включити в його склад. Проаналізовано змістові принципи відбору текстів власне навчальних підручників: принцип цілісності, принцип відповідності проблемній області, принцип структурної спрямованості. Зважаючи на той факт, що китайська мова належить до кореневого типу мов, встановлено, що в процесі анотування корпусу текстів китайською мовою за основу береться морфологічний аналіз. У статті зосереджено увагу на процедурі поділу тексту на слова та словосполучення, що називається сегментацією, яка створює основу для розмітки. Розглянуто основний набір тегів частиномовної розмітки в корпусах китайської мови. Описаний кожний етап створення власного корпусу текстів підручників китайської мови початкового рівня. На основі охарактеризованих принципів формування корпусу текстів та змістових принципів відбору текстів, а також принципів розмітки та сегментації тексту китайською мовою здійснено конвертування розмічених текстів у структуру спеціалізованої лінгвістичної інформаційно-пошукової системи «Он-лайн корпус китайської мови – автоматична морфологічна розмітка та сегментація тексту». У статті представлені результати дослідження принципів формування корпусу текстів підручників китайської мови початкового рівня та на їх основі сформовано власний машиночитаний, збалансований, репрезентативний, розмічений (анотований) корпус текстів підручників китайської мови початкового рівня для їх кількісного вивчення і якісного пояснення отриманих даних.

Item Type: Article
Uncontrolled Keywords: корпус текстів; китайська мова; початковий рівень; навчальний текст; принципи; підручник
Subjects: Статті у наукометричних базах > Index Copernicus
Статті у журналах > Фахові (входять до переліку фахових, затверджений МОН)
Divisions: Це архівні підрозділи > Кафедра східних мов і перекладу
Depositing User: Ілона Василівна Ситник
Date Deposited: 20 Dec 2021 07:23
Last Modified: 20 Dec 2021 07:23
URI: https://elibrary.kubg.edu.ua/id/eprint/39828

Actions (login required)

View Item View Item