Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Isais RE:Издательство "Медуза" 2 дня
Larisa_F RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 дня нэнси RE:Подайте бедному копеечку на книжку с литреса... 5 дней edvud RE:Багрепорт - 2 6 дней sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 неделя babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Kiesza RE:Бушков умер. 2 недели sibkron RE:Серия "Библиотека французской литературы" (Макбел) 2 недели Isais RE:Игорь Северянин - Том 2. Поэзоантракт 2 недели sem14 RE:Современная корейская литература. Книжная серия... 3 недели sem14 RE:Семейственность в литературе 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц kopak RE:На 78-м году жизни скончался советский и российский... 1 месяц Саша из Киева RE:Подводное течение 1 месяц konst1 RE:Переименовать ник (имя учетки) 1 месяц Larisa_F RE:Таррин Фишер 2 месяца Aleks_Sim RE:Беженцы с Флибусты 2 месяца Впечатления о книгах
mysevra про Стругацкие: Обитаемый остров (Вариант 1971 года) (Космическая фантастика)
20 10 Одновременно и восхитительно, и запредельно бесчеловечно. Пробирает. Великолепная книга, которая читается взахлёб. Оценка: отлично!
mysevra про Дочинец: Многії літа. Благії літа [uk] (Современная проза)
20 10 Так гарно, душевно та мудро. Доки не згадується втеча, описана у інший книзі – «В’язень замку Паланок». Тоді вже всі слова автора сприймаються як лицемірство. Оценка: неплохо
mysevra про Лазарев: Кочевница (Боевая фантастика)
20 10 Мир далёк от канона, и события не такие уж яркие. Опять же, текст не правлен стилистически - тавтология почти на каждой странице. В принципе, история хороша, изложить бы её красиво. Продолжение читать желания нет, но отдельное «спасибо» за идею. Оценка: хорошо
mig2009 про Мур: Дурак [Fool ru] (Юмористическая проза)
20 10 Этакая интерпретация-пародия-видение автора (шута) на известную трагедию. Корделию он не умертвил, а так, в целом все по канве. Зашел глянуть, не появилась ли третья книга (в смысле перевод) из цикла, в 2020 издана, Shakespeare for Squirrels. Ан нет( Оценка: хорошо
Stager про Бохэннон: ЕВА. История эволюции женского тела. История человечества [litres] (История, Биология, Научпоп)
20 10 Почему американцы такие тупые? Оценка: нечитаемо
Oleg68 про Кобен: Скованные одной цепью [Live Wire ru] (Крутой детектив)
19 10 Как всегда-отлично. Это последняя книга в серии о Майроне Болитаре? Оценка: отлично!
Олег Макаров. про Путилов: Постовой [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
18 10 Феерически безграмотный текст. Просто невозможно читать Оценка: нечитаемо
lukyanelena про Сергей Васильевич Лукьяненко
18 10 Фантастический писатель Лукьяненко. Вроде и книги пишет с моралью, и метания главного героя всегда правильные высокоморальные... но как же бесит этот русский шовинизм, лезущий из всех щелей, просто ужас. И Украину обязательно ………
mixentiy про Ильичев: Ворожей Горин – Зов крови (Приключения: прочее, Городское фэнтези, Мистика, Самиздат, сетевая литература)
18 10 Многословно. Тот случай, когда диалоги и размышлизмы должны быть проще. Забавненько. Немного утомляют медицинские познания автора, вываливаемые на читателя к месту и совсем не. Но "специалист подобен флюсу" - суть ………
Isais про Руж: Авалон (Исторический детектив)
17 10 Цирк одного шоумена. Весь вечер на манеже фокусник! Показывает фокусы на вербальном материале, или лексическом уровне, или, проще говоря, на словах. Он и так умеет, и сяк умеет, и знает, как ментов называли в 1920-е, и Булгакова ……… Оценка: плохо
Дей про РОС: Граф Рысев
17 10 Сначала шло туго, меня бесил наглый, самоуверенный и хамоватый ГГ. Да и события развивались ни шатко, ни валко. А дальше автор стал выдавать текст всё лучше и лучше, что большая редкость. Понравилось. |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы