Вы здесьПроект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.
Опубликовано пт, 04/04/2008 - 01:59 пользователем soshial
Форум пока очень неудобный для этого, так что пока будем обсуждать здесь...
Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;)
я предлагаю "сплочиться" =D
просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет.
СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ.
FAQ:
> Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу.
Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =)
что хотите то и выбираете)
> С каким форматом предстоит работать?
с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =)
общая информация здесь и тут
в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;)
1. общая информация о формате
2. описание тегов и простой пример книги.
3. как сделать книгу
4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только
5. несколько статей и инструкций по fb2
6. Создание электронных книг в формате FictionBook 2.1: практическое руководство
> Условия, правила вычитки, форматирования?
правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.)
[quote]а теперь главное!
в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Larisa_F RE:Собираем серию: "Мастер серия", издательство "Лимбус". 1 час
Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 час Larisa_F RE:За иллюминатором (серия) - чего не хватает? 3 часа Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 3 часа Rebellioner RE:Подайте бедному копеечку на книжку с литреса... 1 день sem14 RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 дня larin RE:Пропал абонемент 6 дней tvv RE:DNS 1 неделя MrMansur RE:<НРЗБ> 1 неделя Stager RE:Беженцы с Флибусты 2 недели Tramell RE:Серия "Библиотека французской литературы" (Макбел) 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели sem14 RE:Современная корейская литература. Книжная серия... 2 недели sem14 RE:Серия "Символы времени" издательства "Аграф" 3 недели sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 3 недели sem14 RE:«Юмористическая серия» 3 недели larin RE:Оплатил. Абонемент не отображается 3 недели larin RE:Оплатил, но абонемент не отображается 1 месяц Впечатления о книгах
Barbud про Старицын: Балаклава Красная (Альтернативная история, Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
11 01 Дерьмовенько, как и все прочее у этого автора. Герои скучны, безэмоциональны и безмысленны, как какие-то юниты в компьютерной игре. Клик мышкой - на суше врага разбили, еще клик - на море эскадру потопили, новый клик - заводы ……… Оценка: плохо
Barbud про Алмазный: Казачонок 1860. Том 1 (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
11 01 Скучно, вторично. Сюжет этого писева очень напоминает опусы еще одного воспевателя казачества, почти калька, но написано намного хуже, хотя, казалось бы, хуже уже некуда. Однако же вот... Оценка: плохо
lorealke про Arladaar: Калгари 88 (Самиздат, сетевая литература)
11 01 Читать, ЕСЛИ: Вам нравятся спортивные драмы, технические детали тренировок и жанр попаданцев. Выкинуть в мусорку, ЕСЛИ: Вас тошнит от бесконечных описаний того, как фигуристка выполнила «прыжок в три с половиной оборота ……… Оценка: хорошо
obivatel про Вперёд в прошлое
10 01 2 Barbud, и у вас, и у автора наблюдается непонимание прописных истин управления 1. У любой проблемы ВСЕГДА есть как минимум одно очевидное недорогое легкореализуемое НЕВЕРНОЕ решение 2. Никто не правит в одиночку. 3. ………
obivatel про Возвращение Безумного Бога
10 01 То ли ИИ писал по мотивам корейских манг (типа, Она открыл книга и дёрнул за обложка) , то ли одно из двух. Множественные нарушения логики, противоречия описаний и событий, несоответствия хронологии событий -- всё это режет ………
Никос Костакис про Махров: Спасибо деду за Победу! Это и моя война [litres] (Боевая фантастика, Попаданцы)
09 01 Рубашка броская – косоворотка белого цвета в национальном стиле, с вышитым воротником и этим… как его? – не помню, вокруг застежек, короче". ______________________________ Дело происходит возле украинского "бандеравского" села. Косоворотка, как украинская одежда??? Ну-ну...
M_osk про Спинрад: Русская весна (Научная фантастика)
08 01 очерк = Виталий Бабенко. Пятое время года добавлен, а также отсутствующие иллюстрации Оценка: отлично!
svetik489 про Иевлев: Ковыряла (Киберпанк, Социальная фантастика, Самиздат, сетевая литература)
05 01 было бы хорошо,но такой перебор со сленгом.... поэтому неплохо Оценка: неплохо
lorealke про Птица: Конструктор живых систем [СИ] (Альтернативная история, Городское фэнтези, Стимпанк, Самиздат, сетевая литература)
03 01 Очередная агитка под видом «боярки» для подростков. Антагонисты слеплены по методичке из телевизора: мерзкий поляк, подлый грузин и надменный швед против «святого» русского мальчика. Весь мир книги — это унылая «осажденная ……… Оценка: плохо
mysevra про Лукьяненко: Последний Дозор (Фэнтези)
03 01 В своё время я была в восторге от первых двух книг, а эта – просто выжимки из опилок, не стоящие внимания. И очень повлияла на моё восприятие творчества автора его гражданская позиция – оказалось, что это не просто фантаст, ……… Оценка: плохо
mysevra про Сегень: Поп (Историческая проза, Православие)
03 01 Интересные страницы истории. Люди, у которых есть чёткие моральные принципы и жизненные ориентиры на любой случай (неважно, чем продиктованные: традициями, профессией, религией или понятиями) – им и сложнее, и проще одновременно. ……… Оценка: хорошо |
Комментарии
Отв: несколько орг. вопросов по вычитке
golma1 Есть несколько орг. вопросов по вычитке, свяжись, плиз, со мной по почте: epaper.ru[собака]gmail.com
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Добавлю вдогонку: если автор в библиотеке уже есть, лучше всего сохранять уже существующее написание (с отчеством или без, например).
Я сама на этом споткнулась с Гумилёвым.
имя автора
Гм... Хоть я и не согласен с таким подходом (ИМХО, если было без отчества, но оно известно, то стоит отчество добавить), но на будущее - учту
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Беру Барбара Хэмбли-Вампиры
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
В распознании висит две книги, после Вампиров, если никто не займёт, могу распознать.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Насчёт распознавания я не в курсе. Нужно подождать soshial.
Всё остальное внесла в таблицу. :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
эт две книги висят на ocr'e - кто-то отсканить должен.
а распознаваний пока нет, но если хочешь могу скинуть - правда, я не уверен, что ты возьмёшься за учебник польского))
да и не знаю, возможно ли это: из djvu одних картинок склепать pdf с нормальным текстом без слоя со сканом???
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Девятый файнридер вроде такое умеет: finereader.abbyy.com/?param=137522#Formats. Сама не пробовала.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Если задача из djvu в pdf (хорошее качество скана), думаю можно без распознавания. djvu открыть в IrfanView, затем печать в PDFCreator.
Как вариант сойдёт и 9-й Файнридер.
Скинь ссылки на djvu - посмотрю.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
http://lib.rus.ec/b/104779
http://lib.rus.ec/b/104814
это те учебники, из которыхз надо бы удалить слой сканннинга и оставить текст (векторный, ну ты понимаешь ;))
и еще, я тут книгу одну собираюсь сканить... тебе можно будет ее кинуть в tiff'e?
за распознание возьмешся?
если да - то отвечай в личку.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Учебники в pdf будут под 20 Мб - нужны?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
я думал, что если из них сделать ocr/pdf, то как наоборот весить они будут меньше...
Наталья Галкина - done
Теперь можно и за Андрэ Нортон взяться... :)
Ударнику труда!
Да Вам фронт работ никак не обеспечить. ;-)
Всё отметила.
Андрэ Нортон
Похоже, без "работы" Вы не останетесь. :-(
Сегодня у Нортон появилось ещё 3 книги в doc - см. серию "Повелитель животных".
Re: Андрэ Нортон
Так это же хорошо! :)
Re: Андрэ Нортон
А как Вы относитесь к англоязычным книгам? Всё так же "одной левой"? ;-))))
Re: Андрэ Нортон
С Повелителем животных" все оказалось намного проще :)
Он был в моей библиотеке...
Залил на сайт :)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ой-ой-ой... Я в этом ничего не понимаю.
Придётся мне пользоваться "стандартными" программами.
В любом случае, спасибо за разъяснения.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
http://www.the-ebook.org/forum/viewtopic.php?t=7858
http://www.the-ebook.org/forum/viewtopic.php?p=124019#124019
Много всего вперемешку, но и про CSS хватает. Это только темы, которые навскидку нашлись.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ага. Спасибо, я почитаю. Но, по-моему, ты слишком хорошо обо мне думаешь. В-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Так у меня для Вас уже ого-го какой список. :-D
А тут всё добавляется и добавляется. ;-)))
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
привет, помнишь про мою просьбу? =)
*конспирируясь* спросила его? ;)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Нет. Забыла. :-Р
Re: Проект по вычитке книг, подобный альдебарановскому
Английский у меня - со словарем :(
Поэтому могу "зевать" кучу ляпов :(
Думаю, к англоязычным книгам можно будет приступать, когда не останется русскоязычных :)
Re: Проект по вычитке книг, подобный альдебарановскому
Слушай, тут книга эксклюзивная... нигде не мог найти - даже в мегараздачах на торрентсе.
В этом или прошлом году автор получил Путлицеровскую премию...
можно тебя попросить в fb2 перегнать?? пожалуйста.
http://lib.rus.ec/a/30558
Re: Проект по вычитке книг, подобный альдебарановскому
ОК, перегоним :)
Re: Проект по вычитке книг, подобный альдебарановскому
ух ты!!! спасибо тебе большое!!! =)
Re: Проект по вычитке книг, подобный альдебарановскому
Вот теперь - пожалуйста :)
Книга залита :)
ЗЫ Качество распознавания - паршивое :( Что смог - пофиксил
Re: Проект по вычитке книг, подобный альдебарановскому
спасибо!!
много багов осталось, но их я вычитаю ;)
еще раз благодарю! =)
С Андрэ Нортон покончено (-)
-
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Барбара Хэмбли - Вампиры готова http://lib.rus.ec/b/105617
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
ОК, отметила.
Что-нибудь ещё себе присмотрели? ;-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Собиратели осколков - вычитать? Или проверить на полноту книги?
На всякий случай скачал, почитаю, если что будет исправит - исправлю :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Там какая-то странная книга. Я в неё заглянула, но не поняла: то ли это огромное количество опечаток, то ли автором так задумано.
Надеюсь, Вы сумеете разобраться. ;-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Самое интересное
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Вот-вот! Вычитываю Ле Гуин "Толкователи". Тоже nickname - rusec -nickname
email -lib_at_rus.ec - email
author program-used - LibRusEc kit
и 2013 год. Открылся только Букдизайнером.Интересно, а зачем rusec делает такие "инвалидные" книжки?Нечаянно?
Вручную пришлось прописывать тэги и стряпать валидный файл. Вроде получилось.
И что обидно, только я знаю, что это с моей стороны подвиг, т.к. тяжело болею компьютерным идиотизмом и обоеруколевостью.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Это книги автоматом сконвертированные, с соответствующим качеством :-\ из txt (если не ошибаюсь, из библиотеки Мошкова), в самом начале работы либрусека. Наверное, только для первоначального привлечения.
Если находится такая книга, и есть "нормальный", не "автоматизированный", вариант, то желательно залить нормальный вариант в эту библиотеку.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Практически все файлы, созданные "rusec", нуждаются в обработке. Так что нужно принять как данность и всё.
Как правильно заметил Cd_spb, проще всего заменять такие файлы. Ну, или править ручками, если нет другого варианта. :-(
Ну, а за подвиг - гран мерси! Мы все ценим. :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Я уже увидела "Толкователей". Посмотрела в своих читалках - всё в порядке. :-)
Кстати, замену дефисов на тире в FBE можно делать как "заменить все". Только нужно выбрать [пробел-дефис-пробел] и, соответственно, [пробел-тире-пробел]. Потом можно пройтись ещё раз с комбинацией [дефис-пробел] заменить на [тире-пробел] - для реплик в диалоге.
Или в Investigator'e можно воспользоваться юникодами:
(uni32)(uni45)(uni32)
заменить на
(uni32)(uni151)(uni32).
И тоже выбрать "replace all".
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Только, ради бога, не пробел! Перед тире, если вас не затруднит, ставьте неразрывный пробел, а в начале реплик после тире - тоже неразрывный. А то очень мерзко смотрится, когда в длинном диалоге на выровненном тексте тире стоят строем, а текст после тире отплясывает. Да и тире, оторвавшееся от предыдущего слова и улетевшее на следующую строку, изящества тексту не добавляет. :(
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
А можно с помощью этих интересных символов найти и заменить следующее , (запятая) слово (-а), затем закрывающая скобка, на ((скобка) слова, слова) (скобка)?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Попробуйте почитать Кондратовича, раздел Регулярные выражения (приложение Д).
Там много интересного. ;-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Для меня это пока китайская грамота, м.б. сумею разобраться.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Не подскажете, как это сделать в FBE?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ага, у меня уже тик начинается от "Собирателей осколков"
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Сочувствую.
Я только заглянула, и мне уже плохо стало.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
При просмотре fb2 в AkelPade имеются куски текста - "Российская Федерация( Белоруссия и Украина( выступившие" - со скобками (не закрываются), такое можеть быть? Причём эти скобки идут по всему абзацу.
Страницы