Вы здесьПроверка валидности fb2-файла при загрузке ???
Опубликовано ср, 27/08/2008 - 05:42 пользователем Ghost mail
Forums: Сложно ли добавить автоматическую проверку валидности книг перед их загрузкой на сайт и "не пропускать" невалидные файлы ???
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
monochka RE:Подайте бедному копеечку на книжку с литреса... 5 часов
Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 неделя sem14 RE:Серия "Символы времени" издательства "Аграф" 1 неделя Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 недели tvv RE:faq brainstorm =) 2 недели Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 недели Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 3 недели sem14 RE:За иллюминатором (серия) - чего не хватает? 3 недели sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 3 недели Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 3 недели larin RE:Пропал абонемент 1 месяц tvv RE:DNS 1 месяц MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
MrMansur про Дубнов: Книга жизни [воспоминания и размышления] (Биографии и Мемуары)
07 02 Так есть же в формате fb2 http://209.42.197.18/b/786038
MrMansur про Прилепин: Тума (Современная проза)
07 02 Первая мысль - как же много крови проливали. Но потом осознание: почему проливали? Так было, ьак есть и так будет пока существует эта раковая опухоль - человек... Владея русским и татарским, было интересно читать многоязычные ……… Оценка: отлично!
polyn про Корсакова: Лисье золото [СИ litres] (Ужасы, Триллер, Самиздат, сетевая литература)
07 02 Очень интересное начало серии Оценка: отлично!
udrees про Каменистый: Запрещённый юг (Боевая фантастика, Фэнтези, Попаданцы, ЛитРПГ)
07 02 Смешно написано, продолжение хорошее. Понравится любителям серии. Герой снова попадает в переделки, снова сражается с сильными противниками, и снова получает кучу прогресса. Описания статов и достижений иногда могут раздражать, ……… Оценка: отлично!
udrees про Атаманов: Новые Боги (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
07 02 Смешное окончание приключений. Все было бы хорошо, если бы не вмешательство богов в дела земные. Хотя конечно изначально все предупреждены, что они игроки в большой Игре. Но в 4-й книге приключения в своем стиле, интересные ……… Оценка: хорошо
udrees про Атаманов: Верховья Стикса [СИ] (ЛитРПГ, Самиздат, сетевая литература)
07 02 Я полагаю не вторая, а третья книга может быть окончанием всей серии. Концовку чуть поменять и все, логический венец приключений гоблина. Собственно, в таком же стиле грамотное описание приключений гоблина, победы над сильными ……… Оценка: хорошо
udrees про Атаманов: Сохранить крылья [СИ] (ЛитРПГ, Самиздат, сетевая литература)
07 02 Совершенно сумасшедшее продолжение истории про приключения гоблина-травника в игровом мире, заодно перемежающееся с событиями в реальном мире. Автор часто использует такой прием в своих книгах. Не знаю, в «Забаненном» меня ……… Оценка: хорошо
alexk про Цзи Юнь: Заметки из хижины «Великое в малом» [сборник litres] (Древневосточная литература)
07 02 Издание повторяет старый советский вариант, только предисловие выкинули. И издание, и сам файл хуже предшественника.
decim про Смурыгина: Дефицит. Как в СССР доставали то, что невозможно было достать (История, Публицистика)
05 02 Даже забег по мос. лавкам в понедельник приносил урожай, а уж в посёлках чего только не было. Среди тамошнего населения считалось предосудительным носить не то, что принято - т.е. спецовку на каждый день и старый шерстяной ………
Barbud про Трофимов: Толмач [litres] (Боевая фантастика, Попаданцы)
05 02 Автор успел накропать уже целую охапку писева про данный исторический период, но так и не озаботился получше узнать о реалиях того времени, хотя бы учебник истории почитать - ну да, чукча не читатель, чукча писатель. Тут у ……… Оценка: плохо
irukan про Ланцов: Шанс (Альтернативная история, Социальная фантастика, Самиздат, сетевая литература)
04 02 Хорошо зашла книга! На одном дыхании прочёл. Давно у Ланцова такого не было. Наш совеременник попадает в Константинополь за несколько лет до его падения. То есть, понимаешь, что всё у него получится, но всё равно до конца держит в напряжении Оценка: отлично!
blahblah про Смурыгина: Дефицит. Как в СССР доставали то, что невозможно было достать (История, Публицистика)
04 02 Ужасная книга! Автор интервьюировала знаменитых людей, которые в тоже время в большинстве своём были детьми и внуками других знаменитых людей, ездили за границу, жили в привилегированных домах, получали спецпайки, джинсы во ……… Оценка: плохо |
Отв: Проверка валидности fb2-файла при загрузке.
Сложно ли вам, Ghost mail, указать в своем сообщении утилиту для "проверки валидности" fb2, которую вы предлагаете ???
Отв: Проверка валидности fb2-файла при загрузке.
Однако, эти редакторы-утилиты для работы с командной строки, а нужна проверка на php, которая бы работала на веб-сервере перед загрузкой файла книги.
В-действительности, прежде всего этот вопрос нужно решить "политически" - нужно или не нужно 8-)
Мое личное мнение,- нужно. Лучше пусть будет немного меньше книг, но они будут "качественнее" (будут соответствовать стандарту FB2)
Отв: Проверка валидности fb2-файла при загрузке.
Предлагаете "прикрутить" FBE? Или fb2fix? :)
Идеально "валидных" fb2-файлов на сегодня не существует, как и программы, которая бы это определяла - и все благодаря "стандарту FB2". За работой скриптов приходится убирать вручную, валидность книги - определять "на глазок".
От "политического" решения ничего не изменится - кроме громких фраз: программа не появится, вычитка файлов не улучшится. Кроме того, найдя незакрытый тег в fb2-книге - гораздо легче его закрыть, чем брезгливо отбросить этот файл и отсканировать книгу по-новой.
Отв: Проверка валидности fb2-файла при загрузке ???
И файл может быть невалидным, но содержать полный текст, и другого в библиотеке может не быть. Невалидность мы поправим.
Отв: Проверка валидности fb2-файла при загрузке ???
Не пропускать невалидные файлы - это вряд ли реально нужно, а вот некая пометка, позволяющая невалидников обнаружить - не помешала бы.
Отв: Проверка валидности fb2-файла при загрузке ???
А кто-нибудь более-менее формально описать процедуру валидации может?
Разобрать XML, проверить возможность тэгов и словарно-кодируемых полей?
Всё?
Если всё, я в свой скрипт могу это добавить (XML-разбор там уже есть)...
Он, правда, не на ПХП, а на Питоне, но не думаю, что это нынче проблема для большинства хостингов.
Отв: Проверка валидности fb2-файла при загрузке ???
Формализовать процедуру "исправления" невалидного файла, чтобы он стал валидным, почти невозможно. Можно только пытаться проверять и исправлять набор часто встречаемых ошибок (как-то : неправильный порядок тегов 'title' и 'epigraph'; тег 'title' в середине текста; оформление стихов в тексте тегом 'epigraph' и так далее).
Однако задавая вопрос в теме топика я имел в виду : проверять валидность перед загрузкой на сервер и в случае ошибок,- сообщать пользователю об этом и не загружать невалидный файл. Подразумевается, что после этого пользователь потратит еще 1-2 минуту на исправление своего файла, и загрузит этот файл исправленным 8-)
Отв: Проверка валидности fb2-файла при загрузке ???
>тег 'title' в середине текста
А это из чего следует что невалидно? это допускает схема, и, более того, явно присуствует в примерах на fictionbook.org.
Это какой-то тогда не XML уже получается, а некий формат издалека напоминающий XML :-)
Отв: Проверка валидности fb2-файла при загрузке ???
title должно быть в начале секции. Это переводится как заголовок, если вы не в курсе. В середине секции title быть не может.
Правильно:
<section>
<title></title>
<p></p>
<p></p>
</section>
Не правильно:
<section>
<p></p>
<title></title>
<p></p>
</section>
Отв: Проверка валидности fb2-файла при загрузке ???
Отв: Проверка валидности fb2-файла при загрузке ???
Проверка валидности очень не помешала бы.
В некоторых файлах, (в них сказано что сделаны они в "LibRusEc kit") пометки, сноски, перевод разных понятий заключены в знаки < >,хотя по спецификации XML они должны быть в виде
< >соответственно, также иногда попадается знак & (амперсанд) хотя и он должен быть написан не прямо, а специально вот так&Из-за таких нарушений формата разметки XML некоторые файлы не возможно читать программами которые четко следуют спецификации XML
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Проверка валидности при загрузке fb2-файлов от автора "LibRusEc kit" - хорошая шутка, спасибо :)
Если серьезно - дайте ссылки на книги, а еще лучше - давайте исправим их вместе.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Я могу сгенерить список. Только, боюсь, в нем будет несколько десятков тысяч (не несколько тысяч, а несколько десятков тысяч) книг. И што мы будем с ими делать?
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Точнее, 47 642 : http://lib.rus.ec/stat/document-author .
Проверить на другие варианты файла - скачать - открыть - поиск символов с автозаменой - сохранить - залить на Либрусек.
repeat
Всего по 23 821 на рыло.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
:) Да, рыла могут треснуть.
На самом деле немножко меньше: у меня готовятся что-то в районе четырех тысяч книг с Алдебарана/Литреса, которые будут заменой Либрусек-Киту. Но пока никак не приспособлюсь чтобы залить их без ручных разборок с дублями... :((
С другой стороны - супротив 47-ми тысяч оно не то чтобы совсем уж мертвому припарки... но и ненамного больше.