Данные Dubline Core
Парамонова Софья Сергеевна
нейронные сети, обработка изображений, глубокое обучение, машинное зрение, распознавание рукописного текста, синтетические данные, классификация изображений
В статье представлен алгоритм распознавания рукописного текста с использованием методов машинного зрения и глубокого обучения. Рассмотрены основные проблемы обработки рукописного текста. Для классификации типа текста использовалась нейросеть ResNet18. Предварительная обработка изображений включала выравнивание, бинаризацию, повышение контрастности и удаление шума. Для распознавания текста использовалась модель CRNN, дообученная на синтетическом наборе данных, сгенерированном с помощью SHIFT OCR. Результаты демонстрируют эффективность предложенного подхода для автоматизации обработки исторических документов.