Ага, 2 листа - 64 кБ, 20 листов - 640 кБ. Много. Правда я это уже сказал создателю.
встроенные в рисунок :)
я понимаю, что весит довольно прилично, но ведь просил же порекомендовать ссылки где можно ознакомится с настройками или литературу.
я вплотую всего третий день созданием пдф занимаюсь (точнее третью ночь).
и с аглицким у меня не очень.....
если найду здесь у себя в городе человека, который обьяснит, то вполне возможно, что потом пдф будут меньше.
Второй PDF от hairsа лежит там же, где и первый, качайте.
Переделал 1-й PDF в HTML. Закинул на larsen-ltd. В архиве весит 6486 Б. Просите у hairs или rgt, чтобы выложили.
короче, посоветовашись с Hidden , наверно будет лучше если доки будут и в pdf и в html. html-ы Hidden вроде как обещал сделать сам.
а потом уже каждый забирает в том , чём ему нравится.
дело за решением администрации.
Выложил архив с html-версией первой статьи. Живет в том же месте
P.S. Там же добавился еще один pdf, но уже на полмега
P.P.S. И еще один...
P.P.P.S. Восстановил Pdf-ки и исправил ссылку на них. Если мне пришлют html версии, то и их туда выложу.
короче у меня трагедия. следела винда, а вместе с ней и настройки дистилера.
я напрочь забыл что ему накручивал что пдф-ки становились довольно небольшими (по крайней мере удавалось их сделать в два раза меньше вордовского исходника).
очень хотел бы увидеть линк на настройку.
поэтому всем говорю: получаются толстые! Hidden обращайся за вордовскими исходниками.
Немного не в железячную тему, но всеж...
Требуется: сохранить в электронном виде кучу бумажек, которые никак не могут быть быть подвергнуты OCR , т.е они должны оставаться изображением, но при этом нужно производить поиск по этим бумажкам. Вроде PDF как нельзя лучше подходит, но оказалось что Fine Reader может сохранять только распознанный текст :(
Или такое вообще невозможно ?
ghostman
Вообщем попробуй так>
берешь FR (желательно последней версии http://www.dldportal.ru/soft/ocr/afr70pro.htm) открываешь свой документ в нем, выделяешь нужную область, правой кнопкой мышы,тип блока,картинка, распознаешь(он у тя будет в таком виде как есть),сохранить PDF и усе должно получится :wink:
Да, акробат позволяет вставлять графические обьекты и работать с ними,
Но для тупого архивирования Djvu формат лучше. Поищи в инете Djvu Solo 3,
бесплатную версию и попробуй. Она поддерживала и многостраничный режим.
Вообщем в гугль пожалуйста... Да чуть не забыл, на СКР, у кубанских радиолюбителей, тоже можно на эту тему почитать немного.
Apple
Djvu-это хорошо, но вроде FR не сохраняет в ентот формат :!: :?:
В свойствах сохранения в PDF указал распологать распознанный текст под изображением страницы, при этом видно только картинку страницы, но и можно производить поиск по словам.
Спасибо всем за помощь :)
MOZAS, а я про адобовский формат и не говорил, а про лизардтековский - он объём меньший занимает, хотя потеря на сервисе - от этого не уйти. Но при некотором обьёме выгоднее поисковый шелл писать, а бумаги в неизменяемом виде сжатыми держать.
Конкретный вариант выбирается исходя из заданных требований.
В файнридере всегда можно поставить: блок - картинка, так он и будет сохраняться в графическом виде. Но это для неизменяемых архивных документов только. При этом проигрываем лизардтеку по степени сжатия изображения и его качеству - в исходном гифе, в чёрно-белых документах, появляются артефакты, "что не ест быт карашо"... :D
Не подскажете кстати, как в пдф, в нераспознанных картинках, поиск по словам организовать? Что-то я непонимаю... :roll:
Не подскажете кстати, как в пдф, в нераспознанных картинках, поиск по словам организовать? Что-то я непонимаю...
Я не спец, но общая теоретическая подготовка подсказывает - никак...
Чудес не бывает.
Поэтому либо распознаете текст и по нему поиск МОЖЕТ вестись, либо не распознаете и видите текст как картинку...
Во что сканить книги?
PDF - только если распознавать. Тогда размер и качество получаются приемлемыми. Если НЕ распознавать, то получается пдф очень больший размеров :( Все-таки картинки :(
DjVu - иедален для нераспознанного текста. Книжка в нем занимает много меньш, чем в PDF и даже отдельном наборе картинок.. Поиска, ясен пень, нету, но где в нормальных бумажных книгах Вы видели поиск? :lol: Указатель - пожалуйста, поиск - ни-ни.
Конечно, можно организовать следующий финт - ракспознать текст и вставить его в Djvu как отдельный слой...
Короче, читайте статью http://dstu2204.narod.ru/doc/djvu/djvu.htm и наслаждайтесь выбранным форматом :)
подновляю тему..
все сделанные доки доступны отсюда
http://linux.nist.ru/rgt/BIOS/PDF/
я вплотую всего третий день созданием пдф занимаюсь (точнее третью ночь).
и с аглицким у меня не очень.....
если найду здесь у себя в городе человека, который обьяснит, то вполне возможно, что потом пдф будут меньше.
а потом уже каждый забирает в том , чём ему нравится.
дело за решением администрации.
P.S. Там же добавился еще один pdf, но уже на полмега
P.P.S. И еще один...
P.P.P.S. Восстановил Pdf-ки и исправил ссылку на них. Если мне пришлют html версии, то и их туда выложу.
я напрочь забыл что ему накручивал что пдф-ки становились довольно небольшими (по крайней мере удавалось их сделать в два раза меньше вордовского исходника).
очень хотел бы увидеть линк на настройку.
поэтому всем говорю: получаются толстые!
Hidden обращайся за вордовскими исходниками.
Требуется: сохранить в электронном виде кучу бумажек, которые никак не могут быть быть подвергнуты OCR , т.е они должны оставаться изображением, но при этом нужно производить поиск по этим бумажкам. Вроде PDF как нельзя лучше подходит, но оказалось что Fine Reader может сохранять только распознанный текст :(
Или такое вообще невозможно ?
Вообщем попробуй так>
берешь FR (желательно последней версии http://www.dldportal.ru/soft/ocr/afr70pro.htm) открываешь свой документ в нем, выделяешь нужную область, правой кнопкой мышы,тип блока,картинка, распознаешь(он у тя будет в таком виде как есть),сохранить PDF и усе должно получится :wink:
Но для тупого архивирования Djvu формат лучше. Поищи в инете Djvu Solo 3,
бесплатную версию и попробуй. Она поддерживала и многостраничный режим.
Вообщем в гугль пожалуйста... Да чуть не забыл, на СКР, у кубанских радиолюбителей, тоже можно на эту тему почитать немного.
Djvu-это хорошо, но вроде FR не сохраняет в ентот формат :!: :?:
Спасибо всем за помощь :)
Конкретный вариант выбирается исходя из заданных требований.
В файнридере всегда можно поставить: блок - картинка, так он и будет сохраняться в графическом виде. Но это для неизменяемых архивных документов только. При этом проигрываем лизардтеку по степени сжатия изображения и его качеству - в исходном гифе, в чёрно-белых документах, появляются артефакты, "что не ест быт карашо"... :D
Не подскажете кстати, как в пдф, в нераспознанных картинках, поиск по словам организовать? Что-то я непонимаю... :roll:
Я не спец, но общая теоретическая подготовка подсказывает - никак...
Поэтому либо распознаете текст и по нему поиск МОЖЕТ вестись, либо не распознаете и видите текст как картинку...
Во что сканить книги?
PDF - только если распознавать. Тогда размер и качество получаются приемлемыми. Если НЕ распознавать, то получается пдф очень больший размеров :( Все-таки картинки :(
DjVu - иедален для нераспознанного текста. Книжка в нем занимает много меньш, чем в PDF и даже отдельном наборе картинок.. Поиска, ясен пень, нету, но где в нормальных бумажных книгах Вы видели поиск? :lol: Указатель - пожалуйста, поиск - ни-ни.
Конечно, можно организовать следующий финт - ракспознать текст и вставить его в Djvu как отдельный слой...
Короче, читайте статью http://dstu2204.narod.ru/doc/djvu/djvu.htm и наслаждайтесь выбранным форматом :)
все сделанные доки доступны отсюда
http://linux.nist.ru/rgt/BIOS/PDF/