B147858 Рубрикатор как инструмент информационной навигации
Опубликовано пт, 15/05/2009 - 12:27 пользователем oldvagrant
Forums: Рубрикатор как инструмент информационной навигации to Ulenspiegel
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
nehug@cheaphub.net RE:Подробнее о правилах, если можно? 7 часов
Isais RE:Беженцы с Флибусты 8 часов Isais RE:Семейственность в литературе 1 день nehug@cheaphub.net RE:Обновление FictionBook Editor 1 день konst1 RE:Подайте бедному копеечку на книжку с литреса... 1 день kopak RE:Небольшой тест. 2 дня kopak RE: День рождения человечества 2 дня nehug@cheaphub.net RE:Как тут читать и скачивать книги? 3 дня nehug@cheaphub.net RE:Домен и сертификаты 3 дня HEPO RE:Багрепорт - 2 6 дней Впечатления о книгах
Barbud про Иванов: Толян и его команда [СИ] (Самиздат, сетевая литература)
01 10 Автор включил для ГГ "режим бога". Все у него получается, бабы в койку прыгают, деньги рекой текут, противники штабелями на ринг ложатся, двери в обком открывает ногой, партийные функционеры чуть не в десны целуют. В сложных ……… Оценка: неплохо
Masterion про Далин: Убить некроманта [litres] (Героическая фантастика, Фэнтези)
01 10 Сильная книга. Отличная иллюстрация людской неблагодарности и того, что для толпы важны цветные фантики, а не реальные дела. Оценка: отлично!
Masterion про Злобин: Медиум [litres] (Боевая фантастика, Детективная фантастика, Городское фэнтези)
01 10 Вторично. Но писать автор умеет, так что если хотите почитать о том, как одиночка вступает в противостояние с обществом, теряя при этом остатки человеческого облика, как в прямом так и в переносном смысле, то добро пожаловать. Оценка: неплохо
Masterion про Иванов: Полуварвар (Фэнтези)
01 10 Викинги, магия, эльфы. Да, вторично. Но автор ответственно подошёл к написанию, поэтому мир прописан качественно, прям до цветной картинки. Стилистика на высоте, читается легко и ненапряжно. Очень хорошее послевкусие, проду однозначно почитаю. Оценка: хорошо
Masterion про Парсиев: Адвокат вольного города 1 (Боевая фантастика, Городское фэнтези, Самиздат, сетевая литература)
01 10 Хрень. Фентези тут нет, прикручен антураж инфантильно-быдловастой вселенной "Рос", скорее всего потому, что у этих писюков коллаба по взаимному распространению своих высеров. Сам сюжет - будни ИП: тут с кредиторами встретился, ………
Trinki про Черубаев: Приключения Олжика и Вовки (Приключения: прочее, Детская литература: прочее, Юмор: прочее)
01 10 Мда, советские писатели любой национальности начали бы с подачи места происходящего. А когда Вовке и Олжику с русскими фамилиями алгебру преподает Динара Кудайбергеновна, и прыгают они через арыки... При всем уважении к народам России, кукуха отъезжает.
Oleg V.Cat про Черубаев: Приключения Олжика и Вовки (Приключения: прочее, Детская литература: прочее, Юмор: прочее)
01 10 Мне эта книжка напомнила заказную топорную агитку про межнациональную дружбу. Но про Королева и паяльную лампу куда лучше написано... https://lib.rus.ec/b/773933
Старший про Хренов: Путь Силы [СИ] (Фэнтези, Попаданцы, Самиздат, сетевая литература)
01 10 Так себе, тройка много, двойка мало.
Oleg V.Cat про Щепетнёв: Зимний мальчик [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
01 10 Ламповая вещь. Хотя и скучноватая. Оценка: хорошо
Oleg V.Cat про Дей-Льюис: Происшествие в Оттербери [The Otterbury Incident ru] (Детские остросюжетные)
01 10 Отличнейшая вещь, с живыми людьми для живых людей. Оценка: отлично!
evgen007 про Ким: Девятый легион [litres] (Боевая фантастика, Героическая фантастика, Фэнтези, Попаданцы)
01 10 Бесчеловечность же опытов потрясла всех – в целях медицинской необходимости на базе был введен жесточайший сухой закон." Книжка с юмором. Если упоминание Украины не вызывает фантомных болей, то может понравиться. Оценка: хорошо
Masterion про Владимиров: Стаф [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
30 09 Очень затянутое начало. Половина книги, а ГГ до сих пор не отмылся от грязи в которую вляпался при переносе. Но потом автор видимо накатил ускорителя и события вошли в нормальный ритм. Ну а дальше началась добротная такая ……… Оценка: хорошо |
Отв: B147858 Рубрикатор как инструмент информационной навигации
Легко. Тезис первый, он же главный - "хоть чучелом, хоть тушкой, но ехать надо".
Stager - отмалчивается, как девушка в ответ на вопрос "Ты меня любишь?", а найти что-либо техническое, не зная заранее названия, в библиотеке ... сложновато.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Отв: B147858 Рубрикатор как инструмент информационной навигации
Ну хорошо. Предположим, случилось страшное, и Вас заинтересовало программирование PIC-контроллеров. Поиск по "PIC" в библиотеке результатов не даст, поиск по "контроллеры" - даст набор книг на "Генезисе", но - если искомая книга называлась "Программирование средств промышленной автоматизации" - этот бесценный труд пролетит мимо Вас.
Найти библиографию по теме где-нибудь в и-нете, безусловно, можно, но хотелось бы, чтобы Либрусек был в этом смысле вещью самодостаточной.
Отв: B147858 Рубрикатор как инструмент информационной навигации
А чё я, чё я-то? Я ваще завсегда за.
Мой тезис таков:
Отличие информационной организации от склада - в наличии тематического поиска. Любая библиотека - что электрическая, что бумажная - это в первую очередь склад (с более или менее развитой логистикой). А библиотекой, т.е., храмом знаний, этот склад делают средства тематического поиска.
Раньше в бумажных библиотеках такие средства были - тематический каталог, библиографические издания плюс собственно библиографы. Теперь всё умерло, и этот механизм погребён под завалами информации. С альтернативами, в общем, плохо.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Я бы, честно говоря, к поиску добавил еще и навигацию по классификационному дереву. Что-то типа "А что у нас тут по программированию есть ? А для Web ? А чтоб еще и PHP присутствовало ?"
При любом раскладе - то, что "всё плохо", мы уже поняли. Теперь хотелось бы узнать, что надо сделать, чтобы всё опять стало хорошо :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Ну это и есть оно.
Правильно в наше время это оно должно выглядеть так:
Юзер в свободной форме даёт запрос.
В ответ он получает список понятий, соответствующих запросу.
Кликнув по понятию, юзер переходит в ту или иную классификационную систему, в то место, где это понятие находится.
И видит там книжки - по теме, по теме уже, по теме шире, по теме сбоку.
А если не понравилось - то выбрать список понятий, которым требуемое должно удовлетворять.
Тогда и будет -
Такое "оно" называется - "сужать запрос по тезаурусу". Но в современной программистской мысли почему-то модно расширять...
Как минимум - не класть книжки в картинках....
Отв: B147858 Рубрикатор как инструмент информационной навигации
Это невозможно.
Миссия pdf, кстати, была в частности в том, чтобы совместить текстовое представление с обеспечением сохранности содержания. Иначе научные статьи публиковали бы в rtf, скажем. Хорошо, если djvu или pdf файл имеет текстовый слой. В том случае, если он получен из авторского текста. Если из OCR - то такая естественнонаучная книжка годится только на шпаргалки студентам.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Книжка в картинках - это всё равно, что ничего.
Господа! Сказать файнридеру "распознать всё" - это один клик. Второй - создать pdf с текстовым слоем. И не обязательно класть текстовый слой поверх картинки - можно и наоборот.
Даже если результат будет содержать массу дефектов распознавания, в нём исчезнут формулы и картинки - всё равно его будет достаточно для более-менее адекватного автоматического индексирования. А альтернативы автоматическому индексированию нет.
Любая самая крутая классификация требует, чтобы кто-то соотнёс книгу с этой самой классификацией. Проиндексировал, типа. В процессе систематизации или предметизации. Три четверти книг в этой стране систематизируются примерно двадцатью сотрудниками Ленинской библиотеки. По ББК. Их не будет больше, и работать лучше они тоже не будут - работа эта низкооплачиваемая, однако требует наличия ума и образования.
Очевидно, тексты, книгами не являющиеся, никто никогда не проиндексирует. И какого тематического поиска вы хотите? Особенно, если курочите заглавия - лишая себя возможности воспользоваться плодами труда профессиональных систематизаторов?
Альтернатива - автоматическое индексирование. А для художественной литературы - вообще единственная возможность, ибо её никто не систематизирует. Да и классификаторов для неё нет.
Автоматическое индексирование даёт посредственный результат, требует специально заточенных классификационных систем - но это единственный путь. Но что-то вы не пылаете энтузиазмом...
Резюме: нет волшебного рецепта. Вот я скажу - и всё будет. Нет. Чтобы было - нужно делать. Нужно составить и поддерживать рубркатор. Нужно иметь текстовые книги. Нужно поддерживать в правильности их реквизиты. Нужно как-то соотнести книги с рубрикатором. И только потом - воспользоваться плодами.
А я вообще полагаю, что большинство народу тайно глубоко убеждено, что компьютер умеет думать, и если подождать -он всё придумает. Сам.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Вы хотите сказать, что в документе djvu или pdf могут параллельно существовать распознанный текстовый слой (пусть коряво распознанный, но невидимый для читающего и видимый для инструмента индексирования) и тот же текст в виде обычной картинки?
Если так, то ситуация кардинально меняется...
Отв: B147858 Рубрикатор как инструмент информационной навигации
В DJVU - однозначно может. И, более того, там даже может существовать оглавление, распознаваемое djvulibre (по крайней мере).
Более того, есть даже инструмент, позволяющий автоматизировать процесс (DjvuOCR), хоть и не "в один клик". И если суровый Stager предлагает сделать стандартом для добавления технической литературы DJVU с текстовым слоем и оглавлением (как минимальное требование), я, наверное, подчинюсь :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Я бы предложил - толку что?
Отв: B147858 Рубрикатор как инструмент информационной навигации
Нууу... Мне самому такая мысль уже приходила в голову. О том, чтобы нераспознанную книжку - сперва в морилку, потом в распрямилку, распознать и сделать оглавление. Проблема в том, что с технологией всего процесса я еще только разбираюсь, получается медленно - а залить что-нибудь свеженькое иногда свербит, и сильно. Скажем так - буду стремиться к окультуриванию. Но - проблемы классификации это автоматом не решает :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Не знаю за djvu, но длля pdf -
Отв: B147858 Рубрикатор как инструмент информационной навигации
Ну почему же... я - пылаю. Точнее, тлею. Пока что на этапе думания, да и то - с продолжительными остановками (реал, знаете ли, заедает...). Но вот уже, в дополнение к предыдущему разговору, додумался до того, что neural network для автораспознавания жанров художки таки придётся использовать. И до того, что не так neural network страшен, как его малюют - есть вполне пригодные готовые библиотеки, я остановился на FANN. Теперь вот думаю, нельзя ли всё-таки и подбор кивордов (ага, лошадей с мечами) тоже автоматизировать. Пока, правда - тупик...
Отв: B147858 Рубрикатор как инструмент информационной навигации
Звездолет на дикой планете. Звездолет упоминается раз пять, лошади с мечами - раз 100. К какому жанру причислит такую книгу ИскИн?
Отв: B147858 Рубрикатор как инструмент информационной навигации
К фентези. And rightly so.
Отв: B147858 Рубрикатор как инструмент информационной навигации
А как? Я совсем не понимаю в нейроных сетях, но, вроде, обучающая последовательность должна иметь однозначные критерии соответствия определённому результату, причём - одному. Как найти (составить?) текст, стопудово соответствующий одному делению классификации из (хотя бы) двух сотен, и стопудово не соответствующий никакому другому - я не представляю.
Ну тут правда тупик :-) Этот вопрос исследовался и многие пытались. Для отдельного текста - можно. Общие для двух - ну, где-то как-то... Для трёх - уже только местоимения :-)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Не хотелось бы поднимать старый флейм на тему, "что лучше - книга в плохом формате или вообще никакой".
Скажем так - скорость конвертации и вычитки мною книг существенно ниже скорости появления в и-нете любопытной литературы, и с этим я мало что могу поделать.
Но это - что касается программы минимум. А мне, честно говоря, хотелось большего - услышать от Вас, как профессионала, конкретные рекомендации. На уровне "копать здесь, кидать сюда, пока летит - отдыхать" :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Чисто технически: имя файла отданной книги - горбатое, и сам файл - классический пример того, как не надо использовать djvu. Я полагаю, распознать и закатать в .txt изготовителю помешали исключительно религиозные соображения.