Распознавание разных типов рукописных текстов и их предобработка
В статье представлен алгоритм распознавания рукописного текста с использованием методов машинного зрения и глубокого обучения. Рассмотрены основные проблемы обработки рукописного текста. Для классификации типа текста использовалась нейросеть ResNet18. Предварительная обработка изображений включала выравнивание, бинаризацию, повышение контрастности и удаление шума. Для распознавания текста использовалась модель CRNN, дообученная на синтетическом наборе данных, сгенерированном с помощью SHIFT OCR. Результаты демонстрируют эффективность предложенного подхода для автоматизации обработки исторических документов.
Сборник
Все статьи сборника:
Только зарегистрированные пользователи могут читать полные тексты и оставлять комментарии. Пожалуйста, зарегистрируйтесь.
