Данные Dubline Core
Кипяткова Ирина Сергеевна, Родионова Александра Павловна, Кагиров Ильдар Амирович, Крижановский Андрей Анатольевич
81.661.2
карельский язык, Языкознание, ливвиковское наречие, корпусная лингвистика, прикладная лингвистика, автоматическая обработка естественного языка, обучение системы распознавания речи, наборы данных
Описывается процесс сбора и подготовки языковых материалов по ливвиковскому наречию карельского языка, необходимых для обучения системы автоматического преобразования карельской речи в текстовую форму. Актуальность создания подобных технологий для карельского языка обусловлена его статусом малоресурсного языка, что является серьезным препятствием для изучения и сохранения. Основной задачей на текущем этапе исследования является первичный сбор и аннотация речевого и текстового корпусов, а также создание словаря транскрипций.