Вы здесьПроверка валидности fb2-файла при загрузке ???
Опубликовано ср, 27/08/2008 - 05:42 пользователем Ghost mail
Forums: Сложно ли добавить автоматическую проверку валидности книг перед их загрузкой на сайт и "не пропускать" невалидные файлы ???
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Американская мозаика 9 часов
Саша из Киева RE:Три минуты истории 10 часов Саша из Киева RE:С того света 10 часов konst1 RE:Подайте бедному копеечку на книжку с литреса... 11 часов babajga RE:Maxima-library - переезд 2 дня darkvova RE:librusec.pro 2 дня Саша из Киева RE:Счастливая скамейка 3 дня Саша из Киева RE:Помни их имена 3 дня Саша из Киева RE:Приятное с полезным 3 дня Саша из Киева RE:Букет колючек 3 дня sem14 RE:Плохой, негодный файл. 4 дня nehug@cheaphub.net RE:There is no option to read the book 5 дней logusss RE:Прошу переформатировать, распознать, etc... 6 дней nehug@cheaphub.net RE:Доступ 1 неделя sibkron RE:«Уроки русского» 1 неделя edvud RE:Не работает регистрация и восстановление пароля 1 неделя Larisa_F RE:Грушевое дерево 1 неделя koifish RE:Оплатил абонемент, деньги списались, абонемента нет 1 неделя Впечатления о книгах
obivatel про Первухин: Сиротка [СИ] (Фэнтези, Попаданцы, Самиздат, сетевая литература)
21 05 Да, наивняк. Не столько роялей (и поболе видал), сколько логических натянутостей (собственно, почему и наивняк). С учётом всего, в целом неплохо, можно даже поставить хорошо. Оценка: хорошо
kolombok про Князь Барятинский
21 05 Ну начало было многообещающее, потом всё ушло по накатанной дорожке. Гарем, дуэли, и детский сад. Шаблон на шаблоне сидит. Гарри Поттер блин, только уровнем похуже. Просто не понимаю как взрослый мужик может попасть в тело ………
Barbud про Вдовин: Война по обе стороны экрана (Публицистика, Военная документалистика)
20 05 Тошнотворное заказное пропагандонское чтиво. Геббельс аплодирует автору из ада. Оценка: нечитаемо
voronin345 про Григорий Владимирович Вдовин
20 05 мдя. агитка. и не самая умная. обмельчали пропагандоны. советские были на порядок умнее. какое образование, такой и выхлоп. хотя........для такого населения и дерьмо - конфетка.
obivatel про Садов: Кристалл Альвандера. Корабль Альвандера [Компиляция] (Боевая фантастика)
19 05 2 DUSHENKA Компилировали, компилировали, пока недовыкомпилировали. =) . На самом деле, жестокий облом: я-о думал, во второй книге он куда-то полетит.... а тут повтор уже прочитанных глав. . 2 snovaты Дык это ……… Оценка: хорошо
Sello про Каверин: Перед зеркалом (Советская классическая проза)
18 05 Любовь, втиснутая в рамки эпистолярного жанра, - особый вид литературы. Потому что оголенность чувств исторических персонажей, отношения их друг с другом - не надуманная фантазией писателя переписка, а действительная, взятая ……… Оценка: отлично!
Dongel про де Камп: Ревущая труба [The Roaring Trumpet] [The Incomplete Enchanter ru] (Фэнтези)
17 05 Чуть не сдох, пытаясь читать эту тягомотину. Не осилил. Сорри, гайз...
Barbud про Плетнёв: Выход на «бис» [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
17 05 Первые две книги были еще так-сяк, читать можно. Дальше пошла однообразная многостраничная тягомотина "за политику" на тему "как нам спасти СССР", перемежаемая унылым "наши шли, враги напали, от них геройски отбились" - и ……… Оценка: плохо
Игорь Гор про Денисенко: Сказка (Альтернативная история)
17 05 немного Альтернативная история, но в целом надо читать. Оценка: хорошо
StrelaVV про Шнейдер: Попаданка для лорда (Эротика, Любовная фантастика, Самиздат, сетевая литература)
15 05 Мне очень понравилась книга. Прелестная история попаданки получилась у автора Оценка: отлично!
дядя_Андрей про Злотников: Пощады не будет [litres] (Боевая фантастика, Попаданцы)
15 05 fуlhtq, Тамарис это остров на который в первой части попал Пушкевич. А мир называется Оокона. Но, в принципе, ты прав.
Лысенко Владимир Андреевич про Видум: Под знаком Песца [СИ] (Фэнтези, Самиздат, сетевая литература)
15 05 Читается хорошо, понравилось. Оценка: отлично! |
Отв: Проверка валидности fb2-файла при загрузке.
Сложно ли вам, Ghost mail, указать в своем сообщении утилиту для "проверки валидности" fb2, которую вы предлагаете ???
Отв: Проверка валидности fb2-файла при загрузке.
Однако, эти редакторы-утилиты для работы с командной строки, а нужна проверка на php, которая бы работала на веб-сервере перед загрузкой файла книги.
В-действительности, прежде всего этот вопрос нужно решить "политически" - нужно или не нужно 8-)
Мое личное мнение,- нужно. Лучше пусть будет немного меньше книг, но они будут "качественнее" (будут соответствовать стандарту FB2)
Отв: Проверка валидности fb2-файла при загрузке.
Предлагаете "прикрутить" FBE? Или fb2fix? :)
Идеально "валидных" fb2-файлов на сегодня не существует, как и программы, которая бы это определяла - и все благодаря "стандарту FB2". За работой скриптов приходится убирать вручную, валидность книги - определять "на глазок".
От "политического" решения ничего не изменится - кроме громких фраз: программа не появится, вычитка файлов не улучшится. Кроме того, найдя незакрытый тег в fb2-книге - гораздо легче его закрыть, чем брезгливо отбросить этот файл и отсканировать книгу по-новой.
Отв: Проверка валидности fb2-файла при загрузке ???
И файл может быть невалидным, но содержать полный текст, и другого в библиотеке может не быть. Невалидность мы поправим.
Отв: Проверка валидности fb2-файла при загрузке ???
Не пропускать невалидные файлы - это вряд ли реально нужно, а вот некая пометка, позволяющая невалидников обнаружить - не помешала бы.
Отв: Проверка валидности fb2-файла при загрузке ???
А кто-нибудь более-менее формально описать процедуру валидации может?
Разобрать XML, проверить возможность тэгов и словарно-кодируемых полей?
Всё?
Если всё, я в свой скрипт могу это добавить (XML-разбор там уже есть)...
Он, правда, не на ПХП, а на Питоне, но не думаю, что это нынче проблема для большинства хостингов.
Отв: Проверка валидности fb2-файла при загрузке ???
Формализовать процедуру "исправления" невалидного файла, чтобы он стал валидным, почти невозможно. Можно только пытаться проверять и исправлять набор часто встречаемых ошибок (как-то : неправильный порядок тегов 'title' и 'epigraph'; тег 'title' в середине текста; оформление стихов в тексте тегом 'epigraph' и так далее).
Однако задавая вопрос в теме топика я имел в виду : проверять валидность перед загрузкой на сервер и в случае ошибок,- сообщать пользователю об этом и не загружать невалидный файл. Подразумевается, что после этого пользователь потратит еще 1-2 минуту на исправление своего файла, и загрузит этот файл исправленным 8-)
Отв: Проверка валидности fb2-файла при загрузке ???
>тег 'title' в середине текста
А это из чего следует что невалидно? это допускает схема, и, более того, явно присуствует в примерах на fictionbook.org.
Это какой-то тогда не XML уже получается, а некий формат издалека напоминающий XML :-)
Отв: Проверка валидности fb2-файла при загрузке ???
title должно быть в начале секции. Это переводится как заголовок, если вы не в курсе. В середине секции title быть не может.
Правильно:
<section>
<title></title>
<p></p>
<p></p>
</section>
Не правильно:
<section>
<p></p>
<title></title>
<p></p>
</section>
Отв: Проверка валидности fb2-файла при загрузке ???
Отв: Проверка валидности fb2-файла при загрузке ???
Проверка валидности очень не помешала бы.
В некоторых файлах, (в них сказано что сделаны они в "LibRusEc kit") пометки, сноски, перевод разных понятий заключены в знаки < >,хотя по спецификации XML они должны быть в виде
< >
соответственно, также иногда попадается знак & (амперсанд) хотя и он должен быть написан не прямо, а специально вот так&
Из-за таких нарушений формата разметки XML некоторые файлы не возможно читать программами которые четко следуют спецификации XML
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Проверка валидности при загрузке fb2-файлов от автора "LibRusEc kit" - хорошая шутка, спасибо :)
Если серьезно - дайте ссылки на книги, а еще лучше - давайте исправим их вместе.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Я могу сгенерить список. Только, боюсь, в нем будет несколько десятков тысяч (не несколько тысяч, а несколько десятков тысяч) книг. И што мы будем с ими делать?
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Точнее, 47 642 : http://lib.rus.ec/stat/document-author .
Проверить на другие варианты файла - скачать - открыть - поиск символов с автозаменой - сохранить - залить на Либрусек.
repeat
Всего по 23 821 на рыло.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
:) Да, рыла могут треснуть.
На самом деле немножко меньше: у меня готовятся что-то в районе четырех тысяч книг с Алдебарана/Литреса, которые будут заменой Либрусек-Киту. Но пока никак не приспособлюсь чтобы залить их без ручных разборок с дублями... :((
С другой стороны - супротив 47-ми тысяч оно не то чтобы совсем уж мертвому припарки... но и ненамного больше.