Что такое оптическое распознавание символов (OCR)?

Оптическое распознавание символов (OCR) относится к программному обеспечению, которое создает цифровую версию печатного, типизированного или рукописного документа, который компьютеры могут читать без необходимости вводить текст вручную или вводить его. OCR обычно используется на отсканированных документах в формате PDF, но также может создавать машиночитаемую версию текста в файле изображения.

Что такое OCR?

OCR, также называемая распознаванием текста, является программной технологией, которая преобразует символы, такие как цифры, буквы и знаки пунктуации (также называемые глифами) из печатных или письменных документов в электронную форму, более легко узнаваемую и читаемую компьютерами и другими программными программами. Некоторые программы OCR делают это, когда документ сканируется или фотографируется с помощью цифровой камеры, а другие могут применять этот процесс к документам, которые ранее были отсканированы или сфотографированы без OCR. OCR позволяет пользователям выполнять поиск в документах PDF, редактировать текст и переформатировать документы.

Что такое OCR?

Для быстрого ежедневного сканирования требуется OCR. Если вы выполняете большой объем сканирования, возможность поиска в PDF-файлах для поиска точного, который вам нужен, может сэкономить немало времени и сделать функции OCR в вашей программе сканера более важными. Вот некоторые другие способы, с помощью которых OCR помогает:

Автоматическая обработка данных и ввод данных (пример: системы отслеживания вакансий для резюме)
Создание отсканированных книг для поиска
Преобразование рукописных сканирований в машиночитаемый текст
Обеспечение более удобного использования документов читателями, которые помогают пользователям с ослабленным зрением
Сохранение исторических документов и газет, в то же время делая их доступными для поиска
Выделение и передача данных в бухгалтерские программы (пример: квитанции и счета-фактуры)
Индексирование документов для использования поисковыми системами
Признание номерных знаков водителя с помощью камеры скорости и программного обеспечения для камеры красного света
Синтезаторы речи для людей, которые не могут говорить - теоретический физик Стивен Хокинг, возможно, самый известный пользователь программы синтеза речи

Зачем использовать OCR?

Почему бы просто не сделать снимок, верно? Потому что вы не сможете ничего редактировать или искать текст, потому что это будет просто образ. Сканирование документа и запуск программного обеспечения OCR могут превратить этот файл в то, что вы можете редактировать и выполнять поиск.

История OCR

Хотя самое раннее использование распознавания текста датируется 1914 годом, широкое распространение и использование технологий, связанных с OCR, началось всерьез в 1950-х годах, в частности с созданием очень упрощенных шрифтов, которые легче конвертировать в текст, читаемый в цифровом формате. Первый из этих упрощенных шрифтов был создан Дэвидом Шепардом и широко известен как OCR-7B. OCR-7B по-прежнему используется сегодня в финансовой отрасли для стандартного шрифта, используемого на кредитных карточках и дебетовых картах. В 1960-х годах почтовые службы в нескольких странах начали использовать технологию OCR, чтобы значительно ускорить сортировку почты, включая США, Великобританию, Канаду и Германию. OCR по-прежнему является основной технологией, используемой для сортировки почты для почтовых служб по всему миру. В 2000 году основные знания о возможностях и возможностях технологии OCR были использованы для разработки программ CAPTCHA, используемых для остановки ботов и спамеров.

На протяжении десятилетий OCR становилось более точным и более сложным благодаря достижениям в смежных областях технологий, таких как искусственный интеллект, машинное обучение и компьютерное зрение. Сегодня программное обеспечение OCR использует распознавание образов, обнаружение функций и интеллектуальный анализ текста для преобразования документов быстрее и точнее, чем когда-либо прежде.