Немного о графических файлах. Сжатие. Распознавание текста

Публикация № 1056836

Программирование - Инструментарий

Обработка. Импорт изображений Распознавание текста

44
Простые и доступные методы борьбы с лишним весом графических файлов и распознавание текста.

Самый простой способ борьбы с лишним весом 

 Работаем, работаем, записываем графические файлы в базу и вдруг бац. База неотвратимо приближается к терабайту. И все из-за них. 

В борьбе за байты, наверное, подойдут любые методы, даже широко известные Com объекты от Майкрософт, как: “WIA.ImageFile" и “WIA.ImageProcess”. Они просты и доступны с Windows XP pac. 2. То есть целую вечность. Но, увы, работают с диском и не могут перезаписать исходный файл

Что эта парочка умеет. Обрезать, изменять размер, поворачивать, конвертировать, сжимать и наклеивать другое изображение. То есть практически все.  

Самый простой способ борьбы с лишними байтами это сконвертировать тяжелые файлы. То есть Формат BMP можно смело конвертировать, не забивая себе голову. Как минимум мегабайт экономии 

Создаем объекты 

 

ImageProcess = новый COMОбъект("WIA.ImageProcess");
ImageFile = новый COMОбъект("WIA.ImageFile"); 

 

Форматы 

 

wiaFormatBMP    = "{B96B3CAB-0728-11D3-9D7B-0000F81EF32E}";
wiaFormatJPEG   = "{B96B3CAE-0728-11D3-9D7B-0000F81EF32E}"; 

 

Ну и собственно, конвертация 

ImageFile.LoadFile(ПутьКФайлу);
НомерПараметра = 0; //Фильтр Convert должен применятся быть последним 
Если  ImageFile.FormatID = wiaFormatBMP Тогда  
	Filter = ImageProcess.FilterInfos("Convert").FilterID ;  
	ImageProcess.Filters.Add(Filter);  
	ImageProcess.Filters(НомерПараметра).Properties("FormatID").Value = wiaFormatJPEG; 
	//Сжатие изображения, если требуется ( 
	ImageProcess.Filters(НомерПараметра).Properties("Quality").Value = 5; 
	//) 
	newImageFile = ImageProcess.Apply(ImageFile);  
	ИмяНовогоФайла = ПолучитьИмяВременногоФайла(newImageFile.FileExtension);  
	newImageFile.SaveFile(ИмяНовогоФайла); 
КонецЕсли;

 

Распознавание текста. 

Бывает очень нужно, а  Файн ридера нет. 

"MODI.Document"  в помощь. Доступная бесплатная библиотека от MS.  Вполне себе сносно распознает текст. Правда только TIFF. Но мы то уже умеем конвертировать форматы. Вместо JPEG формата применяем TIFF формат

Document = Новый ComObject ("MODI.Document"); 
Document.Create(ИмяФайлаДляРаспознания); 
Document.OCR(25); //25 это Русский 
Result = Document.Images.item(0).Layout.Text; 
Document.Close(); 
ТД = Новый ТекстовыйДокумент; 
ТД.УстановитьТекст(Result); 
ТД.Показать(); 

Скачать библиотеку MODI.Document" можно с дистрибутивом SharePoint Designer 2007. Не нужен SharePoint, так установите только Microsoft Office Document Imaging.  Инструкция установки MODI с сайта поддержки майкрософт

В прилагаемой обработке пример работы с изображением. Коды форматов для WIA.ImageProcess и коды языков для MODI.Document.

Тестировалось на платформе 8.3.10 управляемое приложение. У пользователя было отключена  Защита от опасных действий.

44

Скачать файлы

Наименование Файл Версия Размер
Сжатие графических файлов и распознавание текста:
.epf 27,52Kb
05.05.19
4
.epf 1..0.0.0 27,52Kb 4 Скачать

См. также

Специальные предложения

Комментарии
Избранное Подписка Сортировка: Древо
1. kolya_tlt 11 07.05.19 09:41 Сейчас в теме
Для решения этой проблемы имеется подсистема Томов в БСП и причем кроссплатформенная, без всяких КОМов, майкрософтов и т.д.
2. tusv 127 07.05.19 12:28 Сейчас в теме
(1)Не подсистема томов, а Работа с файлами. И она не сжимает, ни распознает и использует внешние компоненты. ИМХО
3. Vasas2007 08.05.19 05:40 Сейчас в теме
(1)бсп может не быть в конфе.
4. Infector 129 08.05.19 10:48 Сейчас в теме
Самый простой способ борьбы с лишними байтами это сконвертировать тяжелые файлы. То есть Формат BMP можно смело конвертировать, не забивая себе голову.


в подавляющем большинстве случаев, но не всегда, т.к. качество изображения при такой манипуляции тоже меняется.
Простой эксперимент позволяем убедиться - рисуем в paint черный квадрат, сохраняем в BMP, открываем заново и увеличиваем масштаб, так чтобы разглядеть граничные пиксели. Затем пересохраняем в JPG и проводим тот же фокус с приближением масштаба.

Т.е. если появление градиента на границах элементов изображения не критично - можно делать. А вот если подразумевается обработка картинок какими-либо специфическими программами (например теми, которые пытаются конвертировать растровые избражения в векторные), то может отрицательно сказаться на результате.
5. tusv 127 08.05.19 12:25 Сейчас в теме
(4)Это да. Но кому надо качество. самый оптимальный путь организовать Фото банк
Оставьте свое сообщение