Вы здесьДоска почета
Опубликовано вс, 12/04/2009 - 02:46 пользователем lankier
Продолжаем исследовать валидность файлов в библиотеке. Три последних архива по 1000 после удаления дублей. Проверка на внутреннюю консистентность. Сообщения об ошибках: not linked image - в файле присутствует изображение на которое нет ссылки в тексте. Соответственно изображение показано не будет. external image - ссылка на внешнее изображение. Не все (ни одна?) читалки умеют загружать внешние изображения. bad internal link - внутренняя ссылка, которая никуда не ведет. Есть href="#foo", но нет тега с соответствующим id. bad external link - неправильная внешняя ссылка. Правильная должна начинаться с "http:", "https:", "ftp:", "mailto:". Чисто теоретически возможны другие протоколы (например gopher), но они не проверяются. external note - внешняя сноска. empty link - пустая ссылка. очень много ошибок - ошибок слишком много. Чтобы не мусорить в эфире они не показаны. 137573-138420.zip Хэнкок - Следы богов bad internal link: #http://reeed.ru/, bad internal link: #http://reeed.ru/, bad internal link: #http://reeed.ru/, bad internal link: #http://reeed.ru/ (исправлено) 138421-139848.zip Фронтин - Стратегеммы. Военные хитрости очень много ошибок 139850-140188.zip Диккенс - Посмертные записки Пиквикского клуба bad internal link: #undefined (исправлено)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 часа
Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 день Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 дня larin RE:Заблокирован 3 дня alexk RE:Прошу переформатировать, распознать, etc... 6 дней konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 недели Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 недели fixel RE:Пропал абонемент 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 1 месяц Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 2 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 2 месяца tvv RE:faq brainstorm =) 2 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца larin RE:абонемент не обновлен 2 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 2 месяца sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 месяца Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 месяца Впечатления о книгах
mysevra про Вольнов: Ловчий желаний [litres] (Боевая фантастика)
05 04 Слишком витиевато на мой вкус. Много забавного, но лишнего, не по теме. Оценка: неплохо
mysevra про Каляева: Порождения войны (Альтернативная история, Героическая фантастика, Исторические приключения, Самиздат, сетевая литература)
05 04 Для меня самая мякотка в книге – загадка, возможность строить предположения и угадывать, что же за всем этим скрывается. А тут – хороший язык, яркие персонажи, месмеризм, опять же, но той самой загадки нет, всё на поверхности. Вот это для меня минус. Оценка: хорошо
mysevra про Пинтер: Симулятор убийств [litres] (Детективная фантастика, Триллер, Детективы: прочее)
05 04 Не скажу, что я в восторге, но, в принципе, неплохо. Оценка: неплохо
udrees про Каменистый: Убийца легенд (Боевая фантастика, Фэнтези, Попаданцы, ЛитРПГ)
05 04 Отличное продолжение приключений попаданца в теле аристократа. Написано живо, красочно, с оттенками юмора, без всяких пошлостей. В книге хватает сражений с самыми разными противниками, для которых подбирается своя тактика. ……… Оценка: отлично!
udrees про Володин: Газлайтер. Том 13 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
05 04 Дурацкая книга о слишком сильном телепате-школьнике, вчера закончившем школу, но успевшем стать супербизнесменом, приближенным Царя, еще и в другом мире захватил пару королевств, женился на 4-х девушках, одна из них не-человек, ……… Оценка: плохо
udrees про Хендерсон: Книга о самых невообразимых животных. Бестиарий XXI века [litres] [IThe Book of Barely Imagined Beings: A 21st Century Bestiary ru] (Биология, Научная литература: прочее)
05 04 Я не очень понял по какому принципу автор отбирал животных для своей книги, я думал тут будут интересные факты о необычных животных, ну ладно там аксолотль. Но тут сборная солянка, все идет по алфавиту и видимо для соответствия ……… Оценка: плохо
udrees про Макнилл: Моргенштерн (Боевая фантастика, Эпическая фантастика)
05 04 Просто пьеса, как у Шекспира и других. Никаких почти действий. Коротенький рассказ-пьеса, где примарх и Ариман идут и разговаривают. Не скажу что было интересно читать. Оценка: неплохо
udrees про Френч: И настала полночь [ЛП] (Боевая фантастика)
05 04 Неплохой рассказик о ночи накануне великого сражения за Дворец Императора. Хорошо показано висящее напряжение, прям как 22 июня 1941 года. Ожидание конечно действует сильнее самого сражения. Оценка: неплохо
udrees про Вальтер: Браконьер 3 (Боевая фантастика, Приключения: прочее, Постапокалипсис, Самиздат, сетевая литература)
05 04 «Ещё год назад я и понятия не имел, что такое боли в спине.» - вот это отрадно читать. Чувствуется что писатель явно не школьник и более менее обладает житейским опытом. Сама книга довольно интересная, написана в том ……… Оценка: хорошо
Yuriko про Кусков: В Россию с любовью (Героическая фантастика, Фэнтези, Самиздат, сетевая литература)
04 04 Поверил аннотации автора, что эта книга - "лютый бред". Не буду читать.
Sello про Хемлин: Третья мировая Баси Соломоновны (Современная проза)
04 04 Свести к общему знаменателю абсолютно разнородные тексты, что, в общем-то, понятно, не получается. Понравились рассказы Аксенова, Вронского (особенно) и мемуарец о Леснёве Сергея Юрского. Абсолютно остался мной не понятым ……… Оценка: хорошо
tvv про Лотош: Одинокие искры над бездной (Космическая фантастика, Социальная фантастика, Самиздат, сетевая литература)
03 04 Текст третьей книги на сайте автора, http://lotosh.1gb.ru/txt/5-03 call of the infinity.htm |
Комментарии
Отв: Доска почета
Ой, пожалуйста, пожалуйста! Ведь большинство читателей все же не любят делать плохие файлы. И если люди у себя смогут проверить книжку перед заливкой, и получить ясный ответ - что, черт возьми, не так с этим файлом, это же здорово. Какой Вы молодец!
Отв: Доска почета
Сделал. 6.8 MB, извините. 8) Зато больше ничего не надо (по крайней мере в теории).
В архиве:
одна програмка с GUI:
validator-gui.exe - обертка для валидатора (примитивная)
три коммандно-сточных:
fb2stat.exe - для сбора статистики
fb2validator.exe - валидатор
fb2recovery.exe - недоделано (должен быть аналог fb2fix)
Использовать.
validator-gui.exe - просто запустить, и дальше Open files|Open dir - указать файл(ы) или каталог.
fb2stat.exe - запускать лучше всего так:
fb2stat dirs|files 2>log.txtfb2validator.exe - собственно валидатор:
fb2validator files|dirs.Если указан каталог - программы будут обходить все вложенные каталоги рекурсивно и искать файлы (поэтому указывать C:\ - лучше не надо :). Файлы могут быть в zip-архивах.
Отв: Доска почета
Проверило 1 файл распакованный, 5 выбранных архивов, 1 папку с файлами и... упало:(. На прощанье в логе трижды записало вот такую красоту:
И как это я этого достигла? А, главное, что теперь с этим делать?
Отв: Доска почета
Это похоже какой-то архив неправильный. Оказался не по зубам питону. Можно, конечно, распаковать какой-то внешней программой и подсунуть в распакованном виде. Я еще подумаю.
Отв: Доска почета
Вся беда в том, что змейка подавилась и умерла совсем. После этого сообщения не ест даже распакованные файлы. Т.е. если ей попадется что-либо в этом роде один раз - она сломается бесповоротно. ИМХО, средний юзер пользоваться не сможет из-за уязвимости. Или сразу надо наложить запрет на архивы.
Отв: Доска почета
А всё-таки это не питон виноват, зубов у него хватает. Это была моя ошибка. Выложил исправленную версию. Теперь должно нормально кушать русские файлы в архивах.
Отв: Доска почета
Спасибо! Здорово.
Все работает, на кривых архивах не валится. Немного эту программку погоняем и запишем в темы конвертация, вычитка и рек.стандарты и FB2-софт, если Вы не против. Хотя в софт, наверное и сейчас надо внести - пусть народ потестирует.
Еще раз огромное спасибо!
Отв: Доска почета
Огромное спасибо! Работает )
А можно сделать возможность копирования текста из окна лога под виндой? А то выделить можно, а скопировать не получается ((
И нумерацию файлов в логе очень желательно, для поиска ошибок.
А в идеале галочку (и ключ для команд лайн) - не писать в лог файлы без ошибок ))
Отв: Доска почета
Там используется очень простой тулкит - Tk (Tkinter). Далеко не всё там делается просто, если делается вообще. Я там сделал кнопочку "save log" именно поэтому, чтобы потом лог можно было открыть в текстовом редакторе. Но я подумаю, что там можно сделать.
Это можно. Попозже сделаю.
Хорошая идея. Почему она мне самому в голову не пришла? :)
upd: Оказыватся копирование и так работает. Выделить -> нажать ctrl-c.
Отв: Доска почета
Не удалось воспроизвести (в режиме оболочки для винды).
На обеих версиях проги.
Из хотелок:
1) Результаты проверки бы еще в конец лога можно?
Типа проверено 400 файлов,
невалидных 10,
минор еррорз - 20
и т.п.?
2) Выводить в лог (как опция с ключом-галочкой) только список файлов с грубыми ошибками, когда невалидный файл.
3) "Лишние" строки не писать в лог (как опция с ключом-галочкой):
(как опция с ключом-галочкой).
*** Validation of file ......***
* Try the DOM parser *
xml validity check passed
* Schema validation *
fb2 validity check passed
* Extra FB2 checkup *
ERROR: not linked image: _003.jpg
> Some errors found <
Т.е. записывать именно только про ошибки в файле. Если xml validity check passed и fb2 validity check passed, то и накой они нам в отчете? ))
Отв: Доска почета
Выложил новую версию. Добавлена опция --quiet и одноименная кнопка. Копирование - в меню по правой кнопке мыши. Туда же (в меню) убрал "save log". Подсветка результата проверки. Всякие мелкие улучшения. Надеюсь ничего не сломал.
Честно говоря не хочется дублировать функциональность. fb2stat это уже делает.
Ну да. Теперь так и работает. С опцией quiet пишет только имена плохих файлов и только ошибки. Если файл хороший, вообще ничего не выведет.
В русской раскладке у меня тоже не работает. А в английской всё нормально.
Отв: Доска почета
"Фронтин - Стратегеммы. Военные хитрости http://lib.rus.ec/b/138462 очень много ошибок" если честно не пойму в чем дело... файл валидацию проходит везде где только можно кроме Вашего скрипта... может быть из-за гиперссылок!?
Отв: Доска почета
Ну не очень много, но есть. :)
* Extra FB2 checkup *ERROR: bad internal link: #c_1.5.5
ERROR: bad internal link: #c_1.5.28
ERROR: bad internal link: #c_1.7.6
ERROR: bad internal link: #c_2.5.13
ERROR: bad internal link: #c_2.8.14
ERROR: bad internal link: #c_3.13.1
ERROR: bad internal link: #c_4.2.4
ERROR: bad internal link: #c_4.3.7
ERROR: bad internal link: #c_4.3.10
ERROR: bad internal link: #c_4.5.6
ERROR: bad internal link: #c_4.7.1
ERROR: bad internal link: #c_14.7.14
ERROR: empty link
empty link это href=""
Отв: Доска почета
Гм, и правда... подглючило меня;)
Большое спасибо!
Исправил!
Страницы