Превращаем ЛЮБОЙ PDF-файл в текстовый документ — Mistral выпустили новую OCR-модель.
Простой гайд, как использовать: — Заходим на Google Colab ; — Вставляем API в строчке api_key — Закидываем ваш PDF в папку слева экрана; — Указываем его название в строчке pdf_file = Path ; — На выходе получаем правильный текст , картинки и таблицы — их даже можно редактировать.
Пока полностью БЕСПЛАТНО , пользуемся.