Сервис Google Docs научился распознавать отсканированный русский текст

Подписаться
Google Docs позволяет распознать текст на загружаемых пользователем PDF-файлах, отсканированных изображениях и фотографиях. Полученный в результате текст будет импортирован в новый документ.

МОСКВА, 1 мар - Новости-Грузия. Компания Google добавила системе оптического распознавания текста (OCR) своего сервиса Google Docs поддержку дополнительных 29 языков, в том числе русского, сообщил блог компании.

Всего OCR-система сервиса теперь поддерживает 34 языка: большинство европейских, упрощенный китайский и пр. В будущем этот список будет расширен еще больше.

Google Docs позволяет распознать текст на загружаемых пользователем PDF-файлах, отсканированных изображениях и фотографиях. Полученный в результате текст будет импортирован в новый документ. В некоторых случаях OCR-система, встроенная в Google Docs, может заменить платное специализированное программное обеспечение.

OCR-система была внедрена в Google Docs в июне 2010 года. Первоначально сервис поддерживал пять языков: английский, французский, итальянский, немецкий и испанский. По словам Google, качество распознавания текстов на этих языках в обновленной версии OCR-системы было улучшено. Кроме того, сервис стал бережнее относиться к форматированию исходных документов, стараясь максимально приблизить вид распознанного текста к оригиналу.

Сервис Google Docs включает онлайн-инструменты для офисной работы: текстовый и табличный редактор, а также веб-приложение для создания презентаций. Сервис позволяет организовать совместную работу над документами. На минувшей неделе компания Google выпустила плагин Cloud Connect для пакета Microsoft Office, позволяющий пользователям совместно работать с офисными документами и синхронизировать файлы со своими учетными записями в Google Docs.

Лента новостей
0