Вы здесьКак правильно отсканировать?
Опубликовано сб, 14/03/2009 - 12:36 пользователем thirteen
Есть сканер, есть Файнридер, есть книга, которую хочу выложить, точно знаю, что в сети её нет. Посоветуйте правильные настройки при сканировании (разрешение, цвет...) и в каком формате лучше сохранять? Я пытался в ПДФ, но он даже при скромных размерах книги получается почти 60 мег. Что я делаю не так?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
PipboyD RE:Подайте бедному копеечку на книжку с литреса... 6 часов
larin RE:Оплатил. Абонемент не отображается 1 день Larisa_F RE:«Юмористическая серия» 3 дня Larisa_F RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 3 дня Larisa_F RE:Серия "Символы времени" издательства "Аграф" 3 дня larin RE:Оплатил, но абонемент не отображается 6 дней nehug@cheaphub.net RE:DNS 1 неделя alexk RE:Багрепорт - 2 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели Isais RE:Семейственность в литературе 2 недели Violontan RE:Жан Батист Мольер воскрешенный 3 недели sem14 RE:Гонкуровская премия 3 недели Dead_Space RE:Беженцы с Флибусты 4 недели Саша из Киева RE:Приключения белочки Рыжки 1 месяц alex-from RE:Оплатил два раза, но абонемента нет 1 месяц Kiesza RE:На 78-м году жизни скончался советский и российский... 1 месяц Paul von Sokolovski RE:Бушков умер. 1 месяц lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Впечатления о книгах
Никос Костакис про Гор: Шаровая молния [СИ] (Попаданцы, Самиздат, сетевая литература)
17 12 Как там у еще не родившегося Ивасюка? Повсюду буйно квитна черемшина..." ______________________ Ага. "Почему я не сокол?" (с)
decim про Осояну: Дети Великого Шторма [сборник litres] (Героическая фантастика, Фэнтези, Морские приключения)
16 12 Очень похоже на "Дитя приливов" Р.Дж. Баркера. В дамском изводе, т.е. с постоянным и многословным выяснением отношений. Ладно хоть, что не отношенек. Ещё напомнило эпопею Суржикова. Воды налито немало, и если бы подсушить ………
Oleg68 про Кобен: Убегай! [Run Away ru] (Триллер, Детективы: прочее)
16 12 Классная книга. Неожиданный конец. Оценка: отлично!
petr1464587 про Вязовский: Пепел на губах [СИ] (Фэнтези, Попаданцы, Самиздат, сетевая литература)
16 12 Это неудачный черновик? Кто эту дрянь выложил? Оценка: нечитаемо
Дей про Шалашов: Призраки Черного леса (Альтернативная история, Героическая фантастика)
16 12 Лучше читать "Невесту наёмника", там нет этой странной ерунды с попаданцем. Оценка: неплохо
Iron Man про Гессен: Во глубине сибирских руд... (Биографии и Мемуары)
15 12 Восхитило содержание узников "кровавого царизма": «В Чите рудников не было. Здесь работа была другая, более легкая: декабристы чистили казенные хлевы и конюшни, подметали улицы, копали рвы и канавы, строили дороги, мололи ………
mysevra про Каку: Физика невозможного [Physics of the Impossible: A Scientific Exploration into the World of Phasers, Force Fields, Teleportation, and Time Travel ru] (Физика, Научпоп)
15 12 Читается легко, как художественное произведение. Автор – настоящий энтузиаст своего дела, способный объяснить сложные теории простым языком. Самое замечательное то, что книга написана не сегодня и уже многие «предсказанные» ……… Оценка: отлично!
mysevra про Балашова: Фатальное прикосновение (Исторический детектив)
15 12 Начало довольно бодрое, а потом увязли в подробностях и отступлениях. Оценка: неплохо
mysevra про Лондон: Великий кудесник [The Master of Mystery ru] (Классическая проза ХX века)
15 12 Сурово так: методы воспитания детей, способы экзорцизма, да и плата за чудеса. Мне понравилось. Оценка: отлично!
nik_ol про Донцова: Дочь Скупого Клопа (Иронический детектив, Дамский детективный роман)
14 12 Спасибо огромное, что выложили наконец-то! Чмоки) Оценка: хорошо
Kromanion про Лагин: Старик Хоттабыч [litres] (Советская классическая проза, Сказка)
14 12 Старик Хоттабыч почти целиком спижжен с Энсти "Медный кувшин", и отличается лишь противоестественными "острополитическими" вставками, которые, видимо Лагин менял согласно флюгеру внешнеполитического курса. Сами вставки инородны ………
Никос Костакис про Вячеслав Солдатенко (Слава Сэ)
14 12 Я больше классиков люблю: Лёву Тэ или Федю Дэ... |
Комментарии
Отв: Как правильно отсканировать?
Тут кт-то писал про сканирование фотоаппаротом.
Вот несколько мыслей из моего опыта.
Требования к фотоаппарату
Сразу и бесповоротно – мыльницы не подойдут.
За редким исключением. Например такие как некоторые модели Canon
В фотоаппарате должны быть.
1. Минимум – 6 Мпиксел, Оптимально – 8 Мпиксел Идеал – 12 и более Мпиксел.
2. Обязательным условием является наличие оптического (не электронного!) стабилизатора ихображения
3. Желательно наличие дистанционного пульта управления.
4 Из обязательных условий – наличие ручной настройки и фокусировки. Автоматика исключается...
Для сканирования фотоаппаратом нужно собрать установку. Основой лучше всего является штативная стойка фотоувеличителя.
Но главное внимание нужно уделить освещению. Вспышка – исключена. Сканируемый текст должен быть освещён с обеих сторон ярким рассеянным светом.
Преимущества фотоаппарата огромны.
Во-первых, можно сканировать разворот, превышающий стандартный для многих сканеров формат A4.
Во – вторых появляется возможность уже в процессе сканирования убрать лишний мусор. То есть перекрывать кусками белой бумаги нумерацию страниц, колонтитулы и прочее...
Есть ещё много мелких преимуществ, но это главные.
Отв: Как правильно отсканировать?
Все, вроде, так и есть, как написано. У меня как раз есть опыт работы "мыльницей", подтверждаю, что результаты не очень :(. И, следовательно, нужно оставить даже мысль о том (как думают некоторые), что сканировать фотоаппаратом - дешевле, легче и т.п. Один хороший штатив чего стоит, освещение, и прочее. Для рабочего места не полметра на столе, а куда больше требуется. Сложности большие, по сравнению со сканером в $50 (не идеал, конечно, но позволяет получить результат куда качественнее, чем обычная камера в $100). Преимущества совсем в другом!
Отв: Как правильно отсканировать?
Согласно данным требованиям, яндекс-маркет выдает следующее:
http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=4390456%2BGT%2Bsel%2B8-PF=15504541%2BTR%2Bsel%2Bselect-VIS=1F2-CAT_ID=100514-EXF=1-EXC=1-PG=10&hid=91148&filter=&num=&greed_mode=false
Ценник от 16 тыс. рублей за Sony Alpha DSLR-A100 Kit и выше.
Добавим к стоимости еще пару тысяч рублей минимум на установку со светом.
И вычеркнем из жизни пару-тройку квадратных метров площади квартиры. (У меня собрана такая штука, так что я в курсе, о чем говорю).
Согласен. Помимо скорости съемки - пока это единственное преимущество, которое я вижу.
На сканере это еще проще и быстрее )) Но не на всех книгах это реально сделать из-за бездарной верстки.
Но для книг давно есть книжные сканеры типа Plustek OpticBook 3600
http://market.yandex.ru/model.xml?hid=91112&modelid=858007
http://www.document-scan.ru/descr99.htm
Ценник - те же 15-16 тыщ, скорость скана высокая - только успевай листать, спец софт, спец конструкция сканера, высочайшее качество сканов, места занимает гораздо меньше фото-установки, в эксплуатации дешевле.
Отв: Как правильно отсканировать?
Распозновать надо, без сохранения структуры документа. То есть без колонок, картинок и всяких прочих ненужностей. Но всё равно, при передаче в Word, страницы не стыкуются. Странно, что Finerider не обрабатывает страницы как целое. Они сохраняются, каждая в отдельном разделе.
Чтобы соединить текст в одно целое, вроде бы достаточно убрать все разрывы раздела. Да не тут то было... В случае качественного оригинала три ситуации:
1. При стыковке должен получится новый абзац
2. При стыковке должна склеится строка
3. При стыковке должна склеится строка с удалением знака переноса, если слово в тексте переносится на следующую страницу.
При некачественном оригинале, нужно провести предварительную обработку, заключающуюся в удалении всех пробелов до знака конца абзаца. В принципе, это не помешает в любом случае.
Алгоритм склейки такой...
1. Ищется разрыв раздела
2. Анализируется стык на один из трёх вышеупомянутых случаев
3. Производится стыковка
4. Переход к другому разрыву.
В простейшем случае это реализуется четырьмя макросами.
Их вызов осуществляется кнопками выведенными на панель инструментов.
Первый макрос просто ищет первый разрыв раздела.
Анализ проводит человек и выбирает один из трёх других макросов, в зависимости от ситуации.
В принципе это можно автоматизировать, написав простейший анализатор, но в любом случае – автоматика может дать сбои. И поэтому лучше, если место стыка окрасить каким-нибудь цветом, для последующего контроля.
Вот 4 макроса, для полуавтоматической обработки.
Sub Разрыв_раздела_Поиск()
'
' Разрыв_раздела_Поиск Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Новая_строка()
'
' Новая_строка Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeParagraph
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Соединение_строк()
'
' Соединение_строк Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeText Text:=" "
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Удаление_переноса()
'
' Удаление_переноса Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeBackspace
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Но это не всё... есть ведь ещё и колонки....
Отв: Как правильно отсканировать?
Я тут начал для затравки про макросы писать.
Пробовал кто-нибудь?
Продолжать дальше или нет?
Отв: Как правильно отсканировать?
А Вы не хотите написать все, чем можете поделиться и, выложив на Либрусеке, дать ссылку? Смотреть лучше все в комплекте, а не выискивать по кусочкам. Пригодится это обязательно - на самом деле довольно много людей, даже зная как, не умеют это объяснить другим. Туда же и макросы напишите. Это очень, leoparrd, полезное дело Вы придумали.
Отв: Как правильно отсканировать?
Не устану повторять:
НЕ НАДО djvu!!!!!
Djvu - могила для текста.
Делайте PDF. Кого анноит размер - делайте правильно.
И ещё - не надо фотоаппаратов... Тем более - "простеньких". Сделать приемлемый скан фотоаппаратом - достаточно нетривиальная задача. И решить её - не проще, чем добыть нормальный сканер.
А 200 страниц - на любом сканере несложно.
Отв: Как правильно отсканировать?
Обоснуй ))
Распознавал с правильно сделанных дежавю неоднократно - иногда качество распознанного лучше, чем я сам сканером получаю.
Криво сделанный pdf не лучше криво сделанного дежавю. Плюс размер нехилый.
Отв: Как правильно отсканировать?
Скажите пожалуйста, а почему могила-то? Мне приходилось окрить с ДежаВю с прекрасными результатами распознавания, почти без ошибок. Или Вы о чем-то другом пишете?
Отв: Как правильно отсканировать?
Аналогично.
Страницы