Вы здесьУ меня есть книга, которой нет в интернете!!
Опубликовано ср, 28/05/2008 - 08:45 пользователем soshial
Появилась идея создать группу людей, которые будт обмениваться неэлектронными книгами, которых нет на Либрусеке и, возможно, сканировать их. Тем у кого есть книги, которых нет на Либрусеке и тем, кто хочет взять себе книгу отсканировать – отписывайтесь здесь. Также, всем настоятельно рекомендую ознакомиться с понятием слова буккроссинг здесь. Или в этой цитате: wikipedia написал: Буккро́ссинг (англ. bookcrossing, иногда «книговорот») — хобби и общественное движение, действующее по принципу социальных сетей и близкое к флешмобу.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 часа
babajga RE:Слева, где сердце: Повести и рассказы 4 часа babajga RE:Ежик покидает дом 8 часов babajga RE:Сказки без подсказки. Сборник 1 день ostap79 RE:Прошу переформатировать, распознать, etc... 1 час sibkron RE:«Уроки русского» 1 день babajga RE:сиреневая звезда 1 день edvud RE:Не работает регистрация и восстановление пароля 3 дня Larisa_F RE:Грушевое дерево 4 дня koifish RE:Оплатил абонемент, деньги списались, абонемента нет 5 дней Саша из Киева RE:Неудавшийся священник 1 неделя babajga RE:Повесть о чудесном одуванчике 1 неделя Саша из Киева RE:Ночной пассажир 2 недели larin RE:Оплатила,но абонемент не отображается 2 недели tvnic RE:Maxima-library - новый адрес 2 недели Саша из Киева RE:Хождение во власть. После путча 2 недели babajga RE:Алиса в стране чудес 3 недели babajga RE:Ёжик, который хотел обнять Луну 3 недели Впечатления о книгах
vadim_kz про Артем Всеволодович Туров (Art)
12 05 Немного занудно но вполне читаемо, даже несмотря на ошибки орфографии.
Isais про Белов: Книга 1. Слесарь [СИ] (Боевая фантастика, Фэнтези, Постапокалипсис, Самиздат, сетевая литература)
12 05 Автора аннотации обманули -- картинка на обложке с фовизмом рядом не пробегала. Максимум, на какое художественное течение она тянет, -- примитивизм. Если вообще считать, что эта картинка относится к искусству...
zingy про Медведева: Жена архимага [litres] (Любовная фантастика)
12 05 главный герой просто омерзителен Оценка: плохо
Dongel про Горький: Дед Архип и Лёнька (Русская классическая проза, Детская проза)
11 05 <<Прочитав в соответствующем -- т.е. в младшем школьном возрасте -- этот рассказ, я искренне, от души, навсегда возненавидел Максима Горького.>> Да, оставляет ощущение полной безнадеги. И я даже затрудняюсь с оценкой. ……… Оценка: отлично!
Дей про Хонихоев: Сяо Тай, специалист по переговорам [СИ] (Юмористическая фантастика, Фэнтези, Самиздат, сетевая литература)
11 05 Автор что, не помнит, о чём писал страницу тому назад? сначала его герой мальчик, потом внезапно девочка. Оценка: отлично!
udrees про Михайлов: Запертый [СИ] (Боевая фантастика, Постапокалипсис, Самиздат, сетевая литература)
11 05 Эта книга мне больше понравилась чем серия книг про Низшего гоблина Оди. Главный герой тут тоже низший и униженный, но пока в первой книге не такой безжалостный убийца и садист как Оди. Он тоже правдоруб, борец за справедливость, ……… Оценка: отлично!
udrees про Михайлов: Инфер-2 [СИ] (Боевая фантастика, Самиздат, сетевая литература)
11 05 Достойное продолжение для любителей серии про Низшего Оди. Описание все такое же стандартное, главный герой, не знаю почему, у меня не вызывает никакой симпатии. С одной стороны это властный, безжалостный и авторитарный лидер, ……… Оценка: хорошо
tamuh2 про Геммы
10 05 Классная книга, жду продолжения, замечательный мир с геммами, читала с удовольствием.
miri.ness_ про Еще не поздно (СИ)
09 05 Автор эрудирован (как специалист по МЭ говорю, из Зеленограда), но патологически глуп. Он так быстро накропал пять романов, что понятно, что уничижительные слова для всего всего, что было в жизни его родителей, он не подбирал ………
Sello про Труайя: Алеша (Историческая проза, Биографии и Мемуары)
09 05 О самой повестушке особо нечего сказать. Добротный язык, без выкрутасов, ясное содержание - пишет Труайя хорошо, что тут наворачивать словеса ради слов. Не первое его произведение, прочитанное мной. Другое приходит на ум: ……… Оценка: хорошо
decim про Карнеро: Пазолини. Умереть за идеи [litres] (Биографии и Мемуары, Изобразительное искусство, фотография)
09 05 Возбуждающая начальство тематика вымарана цензурой до такой степени, что от книги остались обрывки. Нечитаемо. Оценка: нечитаемо |
Комментарии
Re: Проект №2: (bookcrossing/OCR)
у меня есть пара книг, которых нигде нет:
1.
Ларс Кристенсен. Полубрат (норвежская проза)(сделано)2. Чинуа Ачебе. Стрела бога (африканская проза)
3. Мария Елиферова. Смерть автора (филологический триллер)
Re: Проект №2: (bookcrossing/OCR)
Есть Ларри Мэддок "Агентство ТЕРРА". Нет сканера :-(
Отв: Re: Проект №2: (bookcrossing/OCR)
Есть "Агенство Терра" и "Терра против империи". Могу отсканировать, распознать с fb2 не знаю, я тут ровно без году неделя. Кто дает отмашку на начало работы, чтобы не повторяться?
Отв: Re: Проект №2: (bookcrossing/OCR)
Никто. :)
Просмотрите и отпишитесь в этой теме - это максимум "гарантий". ;)
Если не хотите/можете конвертировать в fb2, выложите куда-нибудь скан. Кто-нибудь сделает. :)
Re: Проект №2: (bookcrossing/OCR)
Хавьер Мариас "Белое сердце". Нет сканера. Могу потом распознать и вычитать. Киев
Re: Проект №2: (bookcrossing/OCR)
Это интересное предложение вызывает только один вопрос. У нескольких писавших аргумент - нет сканера. В настоящее время мюстековский сканер Scan Express (более чем пригодный для OCR ;) стоит в районе $40. А сколько стоит пересылка по почте книги? А нескольких книг? Т.е. в таком случае, не проще купить сканер, если нет других препятствий? Или даже взять его на день-другой там, где он есть? Или прямо там и отсканировать? Поймите меня правильно, я просто удивлен, что в наше время это может быть проблемой. Вот отсутствие времени, скажем - это серьезнее.
Re: Проект №2: (bookcrossing/OCR)
сканер то есть, но сказать, что в этом опытен (для оцифровки книг), не могу, к тому же для меня время - основная причина создания темы))
Re: Проект №2: (bookcrossing/OCR)
Угу... Насчет времени - таки да... Та же проблема. А вот насчет опыта - а какой тут опыт нужен? Нужен сканер и файнридер (свободных, в том числе портэйбл-версий - море в Сети ;). После чего техника сканирования осваивается даже не за 5 минут, а просто по ходу работы ;).
Re: Проект №2: (bookcrossing/OCR)
Re: Проект №2: (bookcrossing/OCR)
Нет, туда нельзя! За ссылками активно охотятся и удаляют, это вам не хухры-мухры, а факн-ридер! ;) Вот одна из возможных ссылок, проверил, файл еще лежит, но полностью, конечно, не скачивал. Хотя пользуюсь версией из того же поста, но скачанной с другой ссылки, уже умершей :(. Версия работает без установки. Обратите внимание на пароль к архиву! Просьба не писать открыто имя программы, иначе ссылка сдохнет сразу же... Лучше в личку, если кому надо, давайте ссылку. Или перекладывайте куда-то.
Portable A-B-BBB-Y-Y F-i-kn-e-R-e-a-d-e-r 8.0.0.731 rus & enu
password:nnm.ru
Download http://rs182.rapidshare.com/files/67548469/FuckRussianShit_.rar
Кстати, живой пример, что такое факнридер. Только сегодня появилась ссылка на 9-ю версию (кстати, классная вещь, позволяет даже загружать pdf для распознавания), и вот результат (рапида):
Re: Проект №2: (bookcrossing/OCR)
Спасибо, скачал, авось пригодится.
На сайтах, выкладывающих линки на кино, такое бывает сплошь и рядом. Считается, что это работа платных сотрудников компаний, борющихся против распространения, чуть ли не самих киностудий. А что такое "Русский щит"?
Re: Проект №2: (bookcrossing/OCR)
Русский щит - это специальная компания, борющаяся с варезом в Сети по заданию (платному, конечно) компаний-производителей софта. Абби, в частности - ее весьма известный клиент. Правда, все это работает весьма избирательно. Например, одна и та же ссылка может быть срочно удалена с Рапиды, и неделями лежать на Депозите. Ну, это их дело. Можно лишь констатировать, что компании-производители софта зря тратят деньги на Щит, лучше бы софт удешевляли ;). А вы обратили внимание на имя файла для закачки? FuckRussianShit_.rar ;D
Re: Проект №2: (bookcrossing/OCR)
хаха))
lol)
Re: Проект №2: (bookcrossing/OCR)
Ага, понятно, спасибо. Я и не знал что уже есть такие российские компании. (и мимолетно позавидовал - вот работенка не бей лежачего!)
Насколько я понимаю, Рапида просто быстрее (практически мгновенно, в автоматическом режиме) реагирует на абьюз-жалобы. Ну и с Рапиды качают, конечно, больше, чем со всех остальных вместе взятых, так что она цель номер один.
Еще как обратил! Хорошо хоть мой корпоративный фильтр не обратил... ;-)
Re: Проект №2: (bookcrossing/OCR)
ребят, давайте все-таки обмен книгами обсуждать, м?
Re: Проект №2: (bookcrossing/OCR)
Да ну, не все так печально. На http://rapidlinks.ru/ поиском за пару секунд найдется с десяток программ АББИ - вполне рабочих. Та 9 версия, что я скачивал, с марта еще лежит, и ничего, не удаляют.
Re: Проект №2: (bookcrossing/OCR)
Для начала можно поюзать бесплатный CuneiForm. Основной его недостаток - не работает пакетно, приходится распознавать постранично и дописывать в файл. Но в целом неплох.
(чешет репу) ...где-то у меня была подборка мануалов по технике сканерёжки. Найти, да и вывесить... Авось пригодится кому.
Re: Проект №2: (bookcrossing/OCR)
Кунеформ - ацтой тот еще :(. Не тратьте на него время, плз! Файнридер лучше не на порядок, а даже сравнивать не с чем. Кунеформ по сравнению с ним - просто пустое место ;).
Материалы по технике сканирования - дело, может, и нужное, но, ИМХО, никакой техники-то и нет. Чесслово, не знаю, чему там учиться - режим LineArt, разрешение 300, и вперед! Можно, если нужны картинки, и режим серый или цветной использовать, файнридер последних версий позволяет, но идет куда медленнее. Вопрос же создания из сканов файлов книг - совсем другое дело, тут масса вариантов и форматов - дежаву, пдф, фб2 и прочее... В этом я, например, не копенгаген ;). Т.е. делал, конечно, но профессионалы настолько же выше меня, как файнридер - кунеформа ;D. А само сканирование требует, ИМХО, только одной науки - терпения :). Что да, то да! Терпение и свободное время, Ватсон - вот и все, что нам потребуется! - (С) - Конан Дойл. Сканирование 1 страницы даже на самом лучшем сканере отнимает не менее 30 сек, и через 100 страниц превращаешься в автомат по сканированию. Кошмар! Кто не пробовал, не представляет :(.
Re: Проект №2: (bookcrossing/OCR)
Да ладно народ-то пугать! )
400-500 страниц книга за 3 часа сканится легко. Только успевай листать, это точно - на автомате.
Сканер простецкий трехлетний епсон.
Re: Проект №2: (bookcrossing/OCR)
Ну, если это легко - флаг в руки! Но я не выдерживаю за сканером больше часа :(.
Re: Проект №2: (bookcrossing/OCR)
Э-э...5 минут вы это загнули. Хардкорным "клавишникам" это конечно не проблема, но все-таки заметная часть посетителей-потенциальных сканировщиков ими не является.
Могу добавить, что часто проблема еще состоит в особенностях книги. Например, у меня есть 3 тома "Материальной цивилизации" Броделя, которой в цифре я нигде не видел, хотя она и заслуживает этого. Но раскачаться на сканирование я не надеюсь. Там тонны графиков/картинок и прочих нехороших вещей. И если сделать из нее пдф/дежавю еще возможно, то цивилизованные хтмл/фб2 - "заибёсся". Про полную вычитку я даже не вспоминаю. Ну и общий объем тоже роль играет - под 2к страниц получается.
Re: Проект №2: (bookcrossing/OCR)
Вот ссылка про сканирование/распознавание.
_ttp://militera.lib.ru/ocr/01.html
Читать первые две страницы. Остальные (про ворд, макросы и т.д.) читать по желанию.
Re: Проект №2: (bookcrossing/OCR)
У меня на столе 2 компьютера умещаются. И сверху принтер. Сканер поставить некуда. :-)
Правильно ли я отсканил эту страницу???
вот пжалста сслыка: http://ifolder.ru/6856930
сканировал в оттенки серого/dpi 300/16 bit.
Re: Правильно ли я отсканил эту страницу???
16 бит нигде нафиг не надо. Ни в сером, ни в цветном. 8 ставь.
Re: Правильно ли я отсканил эту страницу???
ты сам файл смотрел??
а как бороться с тем, что посередине? или ocr скушает??
Re: Правильно ли я отсканил эту страницу???
Глянул. Херовато все.
1) Прижимать сильнее надо, книжку слегка развернуть на столе можно, чтобы легче раскрывалась. Окр не справится. Всего плохо все будет в середине.
2) Если просвечивают буквы с обратной стороны - подкладывать черную бумагу (на принтере можно распечатать).
(Я купил в канцтоварах несколько тоненьких пластиковых папок рублей по 10, у которых задняя часть из черного тонкого пластика. Нарезал этот пластик под размер типичных форматов страниц - вечная штука получилась.)
3) Если нет картинок в книге, то режим rgb (цветной) нафиг не нужен, достаточно чистого чб или грэй, 300 точек.
Re: Правильно ли я отсканил эту страницу???
Проблема на сгибе. Если корешок книги прочный, то можно прижать именно его к стеклу сканера. Края лучше не сканировать -- сразу обрезать во время сканирования.
Сохраняться лучше в тифе. 17 мбайт на страницу --многовато.
Количество точек лучше выбирать в зависимости от размера шрифта. Если страница примечаний со газетным шрифтом, то ч/б 300 точек мало, имхо.
P.S. Во время сканирования книжка не должна перемещаться по стеклу. Руки придётся потренировать.
Re: Правильно ли я отсканил эту страницу???
короче, резюмирую:
1. прижимать сильнее чтоб не смазывалась
2. избавиться от просвечивания
3. grey 300 dpi 8 bit tiff
4. обрезать края
5. не двигать рукой
okey, спасибо, а есть такие кто мог бы распознать отсканенную книгу?
ps. как ее засунуть в один файл кстати?))
Re: ДежаВю
После сканера получаются .tiff-ы россыпью
Их надо перегнать в единый .djvu
Я предпочитаю пользоваться для сего старенькой DjVu Solo 3.1, но "возможны варианты". Читать про формат и скачивать нужный софт здесь: http://djvu-inf.narod.ru/
Дежавюшный файл, если он делался из тиффов разрешения 300dpi, неплохо разделяется на страницы и распознаётся.
UPD: Кстати, насчет проблем на сгибе...
http://djvu-soft.narod.ru/scan/curved_text.htm
Re: Правильно ли я отсканил эту страницу???
Для данной картинки:
В данном случае это не является проблемой, от которой надо избавляться.
Не всю книжку, а корешок. На картинке не только яркость меняется, но и резкость теряется. Судя по картинке, книжка очень толстая. 485 страница находится где-то в середине книги. Можно попробовать прижать корешок каким-либо стержнем, засунутым внутрь корешка. Там не нужны большие усилия. (Конечно же, учитываем состояние самой книги!)
Если корешок удастся прижать, то чб 400 dpi и, возможно, подобрать яркость сканера. В редакторе удаётся сделать контрастное изображение, значит, и сканеру можно объяснить. Если проблема корешка останется, то grey.
Нет такой необходимости. Если файлы, например, перенумерованы, то FR легко воспринимает пачку файлов на входе.
Зы. Для распознавания текст лучше в tiff, а не djvu
Re: Правильно ли я отсканил эту страницу???
Вот вариант отсканенного разворота, когда практически идеально распознается текст.
(бумага плохая, сильно желтая, книжка старая)
(файл 1,5 мега, жпег)
Re: Правильно ли я отсканил эту страницу???
Re: Правильно ли я отсканил эту страницу???
Идея хорошая, типа бук-тур )) (по аналогии с шоп-турами).
3-4 часа на 400-600 страниц - пару-тройку книг за дождливый день осилить можно )
Главное проверяй, не пропустил ли где страницы... А то при таки объемах сканежки можно пропустить - обидно потом будет...
И скань все - от корки до корки, пригодится )
Re: Правильно ли я отсканил эту страницу???
Re: Проект №2: (bookcrossing/OCR)
Вообще в библиотеке Ершова можно почитать про скан и распознавание.
Написано просто и по делу:
http://publ.lib.ru/publib.html
http://publ.lib.ru/OCR/_Ocr.html
Re: Проект №2: (bookcrossing/OCR)
А возьмется ли кто отсканировать вот эту книжку?
http://www.ozon.ru/context/detail/id/1595741/
Это сборник пьес Ю.М. Полякова. А я тогда, может, возьмусь ее OCR-ить и вычитывать...
Отсканированные книги
У меня есть некоторое количество отсканированной фантастики, ждущей вычитки и (около половины) распознавания.
В электронном виде не нашёл. Сканировал только те части сборников, которых нет в электронном виде.
Станислав Лем:
- "Моя жизнь" (автобиография)
Борис Хазанов:
- "Нагльфар в океане времён"
- "Чудотворец"
Виталий Бабенко (какая-то из книг издательства Текст, 1992 или около того):
- "Приблудяне"
- "Земля"
- "Авангардист"
- "Трудоустройство"
- "New-Москва"
- "Нечеловек-невидимка"
- "Феномен всадников"
- "Игоряша-робинзон"
- "Игры на Красной площади"
- "Холодильник"
- "Поражение"
Василий Головачёв:
- "Реквием машине времени" (оригинальная версия, ещё не переработанная в отстойный цикл)
Из сборника "Ночь, которая умирает":
- Доминик Дуэ "Кочезе из Северамы 10"
- Кодзи Танака "Погоня"
- Джозев Дилейни "Скачок мысли"
- Пьер Буль "Сколько весит сонет?"
- Герд Прокоп "Смерь "бессмертных""
- Доналд Уэстлейк "Смерть на астероиде"
- Радомир Клабал "Если вы такой умник, то скажите, где трупы?"
- Дж. Венс "Удар милосердия"
Из сборника "Компьютер по имени Джо":
- Рикардо Гарсиа Леон "Дарик"
- Джон Макинтош "Дело рук компьютера"
- Иржи Колафа-мл. "Обман"
- Любен Дилов "Очередной номер"
- Даина Чавини "Опять этот робот!"
- Гюнтер Теске "Талантливый футболист"
- Ульф Мальмгрен "Три желания"
- Герберт Франке "Управляемые на расстоянии"
Из сборника "Обратная связь":
- Филип К. Дик "Дублёр президента" (в сети лежит другой текст, так озаглавленный - это ошибка!)
- Карл-Хайнц Тушель "Экспертная система"
- Дж. Уодемс "Имитроника"
- Стен Драйер "Конец шпината"
- Грегори Бенфорд "Под Леннона"
- Джон Койн "Позвоните мне!"
- Джон Браннер и О. Генри "Затруднения с кредитом"
Вячеслав Крапивин:
- "Возвращение клипера "Кречет""
- "Мушкетёр и фея"
- "Ковёр-самолёт"
- "Сказки Севки Глущенко"
Из сборника "Лалангамена":
- Теодор Томас "Целитель"
Из сборника "Перпендикулярный мир":
- Анатолий Гланц "Блудный сын промышленности"
- Грегорий Николаев "Кроссворд"
- Михаил Кривич, Ольгерт Ольгин "Лунная ночь в двадцать первом веке"
- Авдей Каргин "Мы вам докажем, что нас нет"
- Николай Блохин "Настоящим направляю заявку..."
- Георгий Николаев "Восприимчивый"
Из сборника "Продаётся Япония":
- Саке Комацу "Да здравствуют предки"
- Синити Хоси "Корабль сокровищ"
- Таку Маюмура "Приказ о прекращении работ"
- Синити Хоси "Рационалист"
Филип Фармер:
- "Конец времён"
Из сборника "Фата-моргана":
- Гербен Хелинга-мл. "Чудо-цветок"
- Ллойд Дж. Бигл-мл. "Крылья песни"
Re: Отсканированные книги
cпасибо большое.
мы обязательно этим займемся!!
то, что надо просто вычитывать/конвертировать в fb2 - обращайтесь через личку к golma1
а то, что сканить можете пока обратиться к Polarnik, ща еще других соберу ocr'ить.
пока им напишите. вотъ. скоро отвечу о том, как дела: есть ли ресурсы.
Re: Отсканированные книги
Пообщался в личке и с golma1 и с Polarnik.
У меня внезапно не оказалось места, куда можно положить файлы.
Есть какой-нибудь ftp для заливки сырых файлов, предназначенных для дальнейшей обработки?
Re: Отсканированные книги
Чтобы держать статус в одном месте.
Прогнано через OCR, имеется в виде .txt и .rtf (картинки утрачены), требует вычитывания:
- Бабенко "Приблудяне"
Прогнано через OCR, имеется в виде .rtf и в виде картинок, требует вычитывания и конверсии. Качество OCR местами плохое из-за плохого переплёта книг.
- весь Бабенко, кроме "Приблудяне" и "Земля"
- Фармер
- Рассказы из сборника "Фата-Моргана"
- Лем
- Головачёв
Отсканировано, имеется в виде картинок:
- Бабенко "Земля"
- Рассказы из сборника "Компьютер по имени Джо", "Лалангамена", "Ночь, которая умирает", "Обратная связь", "Перпендикулярный мир", "Продаётся Япония",
- Крапивин
- Хазанов
Re: Проект №2: (bookcrossing/OCR)
Я ответила Вам в личке, предложила Рапиду.
Но вообще-то есть ftp Либрусека:
login: ocr
password: newbook
Правда, были какие-то сложности с местом. Не знаю подробностей.
Re: Проект №2: (bookcrossing/OCR)
ok, с этой частью разобрались, нашёл место.
с не-OCR-енными книжками - чуть позже.
Отв: Re: Проект №2: (bookcrossing/OCR)
Мдэ. Пока личка не работает - пишу сюда :)
Оставшиеся странички сфотографировал, выложил: http://artifact-master.com/pages/ - там их по четыре экземпляра каждой, на случай неудачной съёмки.
Отв: Re: Проект №2: (bookcrossing/OCR)
ОК. Спасибо. :)
Я всё скачала на свой комп. Можно удалять.
Re: Проект №2: (bookcrossing/OCR)
Ищу "Вчера будет война" (Сергей Буркатовский) http://www.ozon.ru/context/detail/id/3856135/
Заранее благодарен!
Отв: Проект №2: (bookcrossing/OCR)
наиболее быстро "сканирует" цифровой фотоаппарат. Единственный секрет выставленная вручную диафрагма и выдержка + освещение парой настольных ламп. ~ 5 секунд на страницу, причем большее время уходит на переворачивание :)
Отв: Проект №2: (bookcrossing/OCR)
а что за фотик ?
я баловался 6-мегапиксельной мыльницей fuji - результат так себе.
:)
Отв: Проект №2: (bookcrossing/OCR)
кенон, результат хороший только при отключении автомата и выставлении ручных настроек диафрагмы и выдержки.
Отв: Проект №2: (bookcrossing/OCR)
Тем у кого нет сканера.
А цифровым фотоаппаратом никто не пробовал?
Все пытаюсь создать электронный вариант: Большая книга драконов (Лора С. Айриш)
Но тут нюанс - там большие картинки, а fb2 под это дело не шибко заточен
Страницы