Проблема конвертации PDF
Опубликовано сб, 07/06/2008 - 08:33 пользователем MegaDwarf
Forums: Проблема заключается в том, что при сохранении некоторых пдф книг в ТХТ файл (к примеру средствами того же адоби ридера) каждая строка начинается с новой строчки :))). Т.е. напиханы символы возврат каретки и новая строка (так что ли называется? \r\n короче). Как будто это стихи... Ну и в общем на КПК это безобразие читать потом очень неприятно. Может кто-то с этим сталкивался и успешно решил эту незадачу? ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 8 часов
tvv RE:DNS 1 день sem14 RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 1 день MrMansur RE:<НРЗБ> 4 дня Stager RE:Беженцы с Флибусты 6 дней Tramell RE:Серия "Библиотека французской литературы" (Макбел) 6 дней sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 неделя sem14 RE:Современная корейская литература. Книжная серия... 1 неделя sem14 RE:Серия "Символы времени" издательства "Аграф" 2 недели sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 2 недели sem14 RE:«Юмористическая серия» 2 недели larin RE:Оплатил. Абонемент не отображается 2 недели larin RE:Оплатил, но абонемент не отображается 3 недели alexk RE:Багрепорт - 2 1 месяц Isais RE:Семейственность в литературе 1 месяц Violontan RE:Жан Батист Мольер воскрешенный 1 месяц sem14 RE:Гонкуровская премия 1 месяц Саша из Киева RE:Приключения белочки Рыжки 1 месяц Впечатления о книгах
lorealke про Птица: Конструктор живых систем [СИ] (Альтернативная история, Городское фэнтези, Стимпанк, Самиздат, сетевая литература)
03 01 Очередная агитка под видом «боярки» для подростков. Антагонисты слеплены по методичке из телевизора: мерзкий поляк, подлый грузин и надменный швед против «святого» русского мальчика. Весь мир книги — это унылая «осажденная ……… Оценка: плохо
mysevra про Лукьяненко: Последний Дозор (Фэнтези)
03 01 В своё время я была в восторге от первых двух книг, а эта – просто выжимки из опилок, не стоящие внимания. И очень повлияла на моё восприятие творчества автора его гражданская позиция – оказалось, что это не просто фантаст, ……… Оценка: плохо
mysevra про Сегень: Поп (Историческая проза, Православие)
03 01 Интересные страницы истории. Люди, у которых есть чёткие моральные принципы и жизненные ориентиры на любой случай (неважно, чем продиктованные: традициями, профессией, религией или понятиями) – им и сложнее, и проще одновременно. ……… Оценка: хорошо
mysevra про Бачило: Пленники Черного Метеорита (Боевая фантастика, Космическая фантастика)
03 01 Не знаю, не зашло, хоть я честно старалась. Оценка: плохо
lorealke про Астахов: Император Пограничья 1 (Фэнтези, Попаданцы, Самиздат, сетевая литература)
03 01 Типичнейшая «мужская фантастика» формата АТ: чистейший литературный попкорн, который жуется легко, потому что сюжет не провисает, а бодро несется по рельсам нагибаторства. Художественной ценности, понятно, кот наплакал — ГГ ……… Оценка: неплохо
lorealke про Метельский: Кровь легиона [СИ] (Фэнтези, Самиздат, сетевая литература)
03 01 Очередная графоманская ода «священной Империи» с невыносимым количеством воды и бухгалтерии. Вместо сюжета — унылый цикл: убил моба, продал лут, посчитал медяки, попил кофе — и так сотни страниц. Герой — абсолютная картонка, ……… Оценка: нечитаемо
hocmun про Ливадный: Дорога к фронту (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
02 01 К сожалению автор скатился в чуть ли не обычную пропаганду замаскированую под лит рпг и аля попаданцы . все решат ... После такой шедевральной серии как ,,Истоирия галактики,, к этому ? Простите друзья но это путь почившего ……… Оценка: плохо
lorealke про Тен: Шайтан Иван. Книга 1 [СИ] (Альтернативная история, Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
02 01 Лютая графомания с чудовищной орфографией, от которой буквально вытекают глаза. Герой — картонный нагибато» в вакууме: и спецназовец, и певец, и оружейник, решающий любые проблемы щелчком пальцев одной левой. Сюжета нет, сплошное ……… Оценка: плохо
lorealke про Мясников: Новороссия. ВоZVращение. Краткая история от Екатерины ll до Путина (История, Публицистика)
02 01 Типичная пропагандистская агитка. Мусор. Оценка: нечитаемо
Дей про Провинциалка в высшем свете
02 01 Существует ли хоть один детективно-любовный роман, в котором бы гг не была дурой? Влюбляется, как кошка - не успела уйти от одного (обманувшего её), как тут же увлеклась другим (пренебрежительно к ней относившемся), а потом ………
Лысенко Владимир Андреевич про Мясников: Новороссия. ВоZVращение. Краткая история от Екатерины ll до Путина (История, Публицистика)
02 01 Все предсказуемо, только русские могут быть правы, а весь мир против них. Оценка: нечитаемо
Олег Макаров. про Васильев: По государеву указу (Городское фэнтези, Рассказ, Самиздат, сетевая литература)
02 01 Удивительно слабая вещь для Васильева. Или как будто "на отвяжись" написана. Оценка: плохо |
Re: Проблема конвертации PDF
попробуй его загнать сначала в html, а уже потом в fb2
Re: Проблема конвертации PDF
BD и FBD в помощь. OCRpad тоже хорош.
Re: Проблема конвертации PDF
Всем спасибо! Разобрался маленько :) Только вот OCRpad найти не удалось - все ссылки битые.
Re: Проблема конвертации PDF
Умеешь торрентами пользоваться? Если умеешь, вот:
http://thepiratebay.org/tor/4073583/Book_Processing_Soft_%5BScanning__Scan_Conversion_Processing__OCR_
- ссылка на соответствующий софт (там гигабайт 7, выбирай, что хошь)
Re: Проблема конвертации PDF
Да просто я не очень люблю всякие там торренты и проч. :) Но в отсутствии альтернативы пришлось заюзать твою ссылку. Спс
Re: Проблема конвертации PDF
Могу прислать/выложить более полные скрипты для OCR pad. Те, что в комплекте - далеко не все случаи обрабатывают.
Линк на саму прогу OCR pad и описание: (http://www.the-ebook.org/rus/?p=250)
Re: Проблема конвертации PDF
Ну если не очень сложно, то конечно выложи куда-нить: полюбопытствую, да может еще кому-нибудь будет полезно :)
Re: Проблема конвертации PDF
Распаковать, положить в папку "Bookcleaner что-то там" где установлена сама прога ocr pad.
http://www.savefile.com/files/1601114
при запуске Bookcleaner-а (иконка-веник) выбрать этот файлик, нажать реплэйс ол и вперед.
При необходимости - редактирвать этот файл, или создать новый, добавляя свои варианты замен.
Re: Проблема конвертации PDF
Распаковать, положить в папку "Bookcleaner что-то там" где установлена сама прога ocr pad.
http://www.savefile.com/files/1601114
при запуске Bookcleaner-а (иконка-веник) выбрать этот файлик, нажать реплэйс ол и вперед.
При необходимости - редактирвать этот файл, или создать новый, добавляя свои варианты замен.