Технические замечания

Большое спасибо за ресурс, буду краток и по существу.

При обработке дубликатов не слшком юзабельный интерфейс для выбора того который будет оставлен.
1. Я бы переименовал ссылки вида "удалить XXX, оставить YYY" в "оставить этот".
2. Стоит выводить какое-то описание источника из которго была получена книга. Например lib.aldebaran.ru по качеству превосходит lib.ru и на основании этого уже можно делать выбор
3. Формат Фамилия-Имя-Отчество для авторов не слишком удобен. Как, к примеру записать в него Эренсто "Че" Гевару? Увы, FB2 страдает тем же недостатком, что сильно вредит именованию иностранных авторв. К сожалению у меня нет готового решения этой проблемы.
4. В личном меню есть две разных ссылки с одинаковым названием "популярные страницы". Стоит переименовать одну из них.

1. Сделано.

2. А как его определить? Вот, влил мне некто некую книгу (опция добавления книг открыта всем зарегистрированным пользователям), как узнать, где он её взял? Кроме того, неочевидно, что книга с либру хуже. Там может лежать авторский вариант, а на альдебаране - сканированный.
Добавил вывод document-info, в случае с Альдебараном должно помочь. Но не везде они прописаны, увы.

3. Такой уж стандарт FB2, с него и делалось. Часто лучше пользоваться плохими стандартами, чем изобретать велосипеды.

4. На всякий случай удалил обе. Не нужны они :)

2. Значит источником будет тот, кто книгу залил. В отдаленном будущем можно ввести систему рейтингов, основанную на активности и репутации.
3. Тем не менее, в FB2 есть поле nickname, а то что здесь называется "отчество" там middle-name. Поддерживать, так уж до конца.

Так middle-name это и есть отчество? Или оно какой-то другой смысл имеет?
Зачем нужен nickname я понка не понял. Пойму - добавлю. Может быть. Когда нибудь.

Middle-name это второе имя. То есть по форме это именно имя. К человеку по имени Джон Вильям Смит можно обращаться как Джон и как Вильям. Часто второе имя дают в честь отца или деда, но и в этом случае оно остается именем. Важно, что у человека может быть несколько middle-name, например Andrew _Albert Christian_ Edward. Русские обычно путают middle-name с отчеством порождая шедевры вида Boris A. Gladkih (читается как Борис Афанасий Гладких) Правильно писать Boris Gladkih или Boris Afanas'evich Gladkih. Такая семантическая путаница ведет к тому, что иностранцы неправильно читают русские имена. В данном конкретном случае достаточно переименовтать поле "Отчество" в "Отчество/второе имя" и все встанет на свои места.

Nickname это прозвище или псевдоним. Например Владимир "Ленин" Ульянов или Эрнесто "Че" Гевара. Оно нужно для того чтобы можно было искать авторов по широко известному псевдониму, даже если он не совпадает с реальным именем.

Осознал. Добавил.

Как я понимаю, при объединении авторов лучше использовать формат Ф-И-О (или L-F-M - кому как нравится :D ), а не просто Ф-И? Чем больше информации об авторе сохранится, тем лучше?

Сохранятся в любом случае оба варианта, посмотреть можно в http://lib.rus.ec/node/51. Ничего не теряется.
При дальнейших поступлениях книги обоих будут попадать куда надо.
Поэтому я делаю так, как привычнее звучит.
Скажем, Фёдор Михайлович Достоевский но Сергей Лукьяненко.
.

Понял. Будем использовать наиболее привычные варианты.

Кстати, Илья, по какому признаку скрипт удаляет дубли произведений при объединении имён? Что происходит, если у синонимов есть две книги с одинаковым названием, но разного размера (соответственно, файлы не идентичны)?

Если один файл меньше, и без аннотации, а другой больше и с аннотацией - выбор очевиден.
В противном случае - на усмотрение оператора.
Ничего лучшего пока не придумалось.

если русский текст, но закодирован UTF-8 - будет иметь размер в 2 раза больше чем windows-1251.
Например "стеклянное море" Лукьяненко

Да, я тоже недавно заметил.
Вообще-то utf8 - это правильно, это наше будущее.
Но автомат надо будет подработать.
Я подумаю.

Если можно, поменяйте цвет рубрик в списках новинок и т.п., чтобы он не сливался с самими списками. Например, на темно-синий.

так лучше?

Самое оно. Спасибо.

А можно при пакетной загрузке добавить возможность ложить описаня аннотации и возможно коментарии пользователей в виде txt или html

При удалении дублей приходится сравнивать тексты двух книг. Хорошо бы, если бы небольшие начальные фрагменты текстов были в таблице сравнения (достаточно нескольких абзацев, чтобы понять, что это разные варианты).

Ещё одна опция на рассмотрение: выводить (да/нет) признак наличия иллюстраций в тексте. ...Как правило варианты с иллюстрациями - более хорошо оформлены и потому предпочтительнее.

Также может быть использован признак наличия аннотации прямо в тексте файла (но не знаю, можно ли это сделать), ибо он тоже характерен для хорошо оформленных книг.

Не помню, при сравнении дата создания файла выдаётся?... Честно говоря, так и не решился покамест ничего удалить. Пусть будет много лишнего, нежели один хороший, но удалённый... :)

1) Дата есть, но она не очень помогает.
2) Удаленную книжку-дубль можно восстановить.
3) Аннотацию в документе можно определить по выводимым fb-тегам.
4) Если книжки одинаковые, приходится просмтратривать весь текст. Вдруг в одном тексте есть, например, курсив, а в другом он отсутствует. А вот разные книжки, или разные переводы, или разные варианты перевода можно было бы сразу определить по начальным фрагментам.
5) Лучше удалять дубли не у всех подряд, а у тех авторов, кого хорошо знаешь. Мне для уточнения информации приходилось пользоваться бумажным вариантом.

Большая просьба: при заказе файла по email добавлять в Subject автора и название произведения, или хотя бы название произведения. Думаю технически это несложно сделать, а вот поиск по почтовому архиву в будущем очень облегчит

А мне не хватает просто фильтров. Вот например прихожу на сайт, смотрю поступления, и страницы 4 листаю "журнал квант за такой-то число", илипроизвдения на англицком, или испанском... А был-бы фильтр: Только русскоязычные произведения, и галочки у предпочитаемых жанров поставить - как было-бы легче и удобнее.

Фильтры есть и по жанров и по языку и по типа книги (fb2 и пр)
http://lib.rus.ec/rules#comment-5067

Ещё раз: В "Последние поступления".
Там сего фильтра нет, и приходится перелопачивать кучу ненужного, пока увидиш что-то для себя.

http://lib.rus.ec/books
Это как раз последние поступления, если не отсортировать иным образом.
Фильтровать можно по любому критерию.

О как. А так сразу и не поймеш. Тогда маленькая просьба добавить туа как к обычному "Последние поступления" галочку аннотации", и... Сделать возможность выбора языка, а не прописывать в поле. А то я даж не знаю, что там писать. "Русский"?. "RUS"?. Или просто "RU"?
То же самое касательно фильтра жанры. Мне например хочется скачивать и фантастику, и Алтернативную и историю, и боевую фантастику, и приключения. И как это всё в оджном поле уместить? А был-бы список жанров, где просто тупо ставиш галочки - было бы ИМХО и понятнее,и полегче.
Естественно, почитав пост от pkn я понял что мну и куда. Но человеку впервые пришедшему на сайт, или пришедший полгода назад, и сделав закладку на новых поступления - это в глаза бросаться не будет.

О фильтрах прочитайте, пожалуйста, здесь: http://lib.rus.ec/node/100027

Не работает поиск авторов через первую букву

Нельзя ли сделать в "Последних поступлениях" наименование рубрик/тем четче/ярче? Их невнятный серый цвет затрудняет поиск по темам.

Столкнулся с разным отображением текста в фб2-книгах.
В некторых книгах текст в обычом начертании (не болд), заголовки выделены болдом, в других - все болдом.
В том числе все болдом в тех книгах, что я сам делал и заливал.
Подскажите, в чем косяк и как побороть?

Вот тут все ок, как и в подавляющем большинстве книг:
http://lib.rus.ec/b/66080/read

а тут везде болд:
http://lib.rus.ec/b/104071/read
http://lib.rus.ec/b/102840/read
http://lib.rus.ec/b/102821/read (тут еще и выравнивание по центру происходит во всем тексте).

Возможно причина в кодировке? У 104071, 102840, 102821 windows-1251, у 66080 UTF-8.

Спасибо за наводку, вечером попробую пересохранить какую-нить книгу в утф и перезалить...
А может сделаю новую книгу, как раз вчера вычитку очередного скана закончил ))

Аватар пользователя Captain Scarlett

Kiri написал:
Возможно причина в кодировке? У 104071, 102840, 102821 windows-1251, у 66080 UTF-8.

http://lib.rus.ec/b/103930/read
UTF-8

Проверил пару книг - в обеих <?xml version="1.0" encoding="windows-1251"?>
Отображаются по-разному...
http://lib.rus.ec/b/93218/read (эта - нормально)
http://lib.rus.ec/b/102821/read (эта - болдом и по центру)

Да, причина видимо не столько в кодировке, сколько в том как она написана. Если заглавными буквами, то шанс корректного отображения больше. Книга 102821, изменено windows на WINDOWS http://lib.rus.ec/b/104641/read
Но http://lib.rus.ec/b/93218/read в это не попадает.

Да, не в кодировке дело, похоже... Залил вторую версию книги
http://lib.rus.ec/b/102840/read
в кодировке utf-8 вместо 1251 - обе версии выглядят одинаково криво.

надо Ларина по этому поводу трясти и трести сразу многим людям, а то мои скромные попытки никакого эффекта не дадут))

Все то же самое. Глючит онлайн-читалка (артефакты fb2, не закрыты <h3>):

<h3 class=book>
<P>Виталий Нехаев</P>
<P>Восемь лап, четыре уха:</P>
<P>Истории про Пса и Кота, советы по их воспитанию и содержанию</P>
</TITLE>

<a name=t1></a><h3>
<P>Размышления в начале повествования</P>
</TITLE>

ты у нас гуру кодинга - может сможешь поправить код генерения текста?
вот пояснение к коду "самого" Ларина)))
http://rusec.livejournal.com/42587.html?thread=832091#t832091

soshial написал:
ты у нас гуру кодинга

Угу. А еще я знаю кунг-фу :D
soshial написал:
может сможешь поправить код генерения текста?

Хз, хз... PHP - это вообще-то не мой профиль...

Курил я код долго, но глюка так и не словил :(
Могу только предложить тупо чистить string после парсера, заменяя </TITLE> на </h3> и </SECTION> на <BR>
Авось позже разберемся...

ага, спс, но если всё будет норм выглядеть - напиши что книжка плохо отображается без скрипта, чтобы знать...

Цитата:
чистить string после парсера

Это я не про скрипт. В скрипте оно тормозить будет страшно.


А у меня все эти книги отображаются нормально ;(
Что я делаю не так?
Update:
А почему http://lib.rus.ec/sql/librusec.rar имеет расширение .rar, если это zip?

У меня теперь тоже, нормально... Этот глюк уже достал :'(

да, Ларин починил читалку вроде...
все нечитаемые ранее книги теперь стали читаемыми =))
единственное, что не прошло проверку - это вот это: http://lib.rus.ec/b/104411/read

Да её уже несколько раз "чинили"...

Ну вот - опять оно глючит. Да что ж за...

здесь тоже глючит: http://lib.rus.ec/b/104863/read

Теперь, действительно, нормально отображаются книги )

Вопрос такой - а как посмотреть последние поступления в конкретном жанре?
(видел где-то в обсуждениях такое для фантастики и некоторых других жанров)

На http://lib.rus.ec/new
есть выбор языка и формата.
Хотелось бы кнопочку выбора жанра и/или при входе в конкретный жанр видеть недавно добавленные книги (оптимально - с указанием периода - например, начиная с 15 мая 2008 и по сегодняшний день)

Страницы

X