B147858 Рубрикатор как инструмент информационной навигации
Опубликовано пт, 15/05/2009 - 12:27 пользователем oldvagrant
Forums: Рубрикатор как инструмент информационной навигации to Ulenspiegel
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
mazay RE:Беженцы с Флибусты 4 часа
babajga RE:Подайте бедному копеечку на книжку с литреса... 3 дня Isais RE:DNS 1 неделя Саша из Киева RE:Приключения белочки Рыжки 1 неделя alex-from RE:Оплатил два раза, но абонемента нет 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели Kiesza RE:На 78-м году жизни скончался советский и российский... 2 недели Paul von Sokolovski RE:Бушков умер. 3 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 недели mig2009 RE:Багрепорт - 2 4 недели Isais RE:Издательство "Медуза" 1 месяц babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 4 дня Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц Впечатления о книгах
alexk про Резанова: Чудо и чудовище (Историческое фэнтези)
18 11 дурацкий знаккачества и мания величия isais, ничего не поправить, ничего не дополнить
mazay про Arladaar
18 11 Жеке сегодня, как минимум, под 70. Так что Аня могла бы быть Жекиной внучкой. Тем более, что писал, всё-таки, мужчина. Или диктовал!
Олег Макаров. про Максимушкин: Бомбардировщики (Альтернативная история)
17 11 строители коммунизма и последователи национал-социализма решили объединиться" ... вот это аттракицон срывания всех и всяческих масок Удивительно, что автор не привлечён до сих пор ни по какой статье
mysevra про Панов: Яр(к)ость [litres] (Социальная фантастика)
17 11 Хорошо, но преследует ощущение, что это компиляция старых текстов и идей, вплоть до того, что начинаешь заранее узнавать ещё не прочитанные диалоги и сюжетные повороты. Продолжение не заинтересовало. Оценка: хорошо
mysevra про Гитин: Эта покорная тварь – женщина (Психология, Эротика, Секс)
17 11 Читано давно, во времена босоногой юности. И впечатление произвело ошеломительное. Мерзкое, но ошеломительное. А сейчас бегло просмотрела: ну да, как в той притче, в которой кто за что подержал слона, тот так его и описал. ……… Оценка: плохо
mysevra про Смеклоф: Тайны Кипеллена. Дело о запертых кошмарах (Детективная фантастика, Самиздат, сетевая литература)
17 11 Водянистое какое-то. Натужное. Словно неотредактированное школьное сочинение. Оценка: плохо
Belomor.canal про Сэнсом: Камни вместо сердец [litres] [Heartstone ru] (Исторический детектив, Триллер)
16 11 Вполне на общем уровне серии книга. Как ни странно присутствует современная проблематика и мерин Метью имеет самую оригинальную кличку из всех данными ему переводчиками! Оценка: отлично!
Belomor.canal про Сэнсом: Соверен [Sovereign ru] (Исторический детектив)
16 11 Одна из лучших книг серии! Здесь ещё мерин Мэтью имеет кличку Предок, но в следующей книге будет по другому. Как именно? Читайте и узнаете! Оценка: отлично!
Belomor.canal про Сэнсом: Мертвая земля [litres] [Tombland ru] (Исторический детектив, Детективы: прочее)
16 11 Прочитав все семь "сезонов" очень не хочется расставаться с полюбившейся компанией Тамазин Ридбурн, Джек Барак, Гай Малтон и конечно наш Мэтью. Так и хочется проехать до станции метро Holborn и пойти в Линкольнс-Инн к сержанту ……… Оценка: отлично!
Lan2292 про Бобров: Чужак. Том 1, том 2 [СИ] (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
16 11 начинала три раза,дошла до второго тома, не нравится, скучно Оценка: плохо
udrees про Саркисянц: Английские корни Третьего Рейха. От британской к австро-баварской «расе господ» [Adolf Hitlers englische Vorbilder: Vom britischen zum ostmärkisch-bajuwarischen Herrenmenschentum [Vorlesungen[,] gehalten an der Heidelberger Universität.] ru] (История, Политика, Публицистика)
15 11 Поначалу интересно было читать, но потом книга кажется скатилась в один повтор, как все в Англии восхищались Гитлером и помогали ему начать войну. Первая половина книги ничего, описывается как Британия правила в колониях, ……… Оценка: неплохо
udrees про Мантикор: Город, которого нет 4 [СИ] (Фэнтези, Самиздат, сетевая литература)
15 11 По сравнению с предыдущими тремя книгами серии больше занимает поиск героем истины, своего пути. Боевых сцен достаточно немного, они есть и тоже имеют свою специфику, но идут не так непрерывно как в первых книгах. В целом ……… Оценка: хорошо |
Отв: B147858 Рубрикатор как инструмент информационной навигации
Легко. Тезис первый, он же главный - "хоть чучелом, хоть тушкой, но ехать надо".
Stager - отмалчивается, как девушка в ответ на вопрос "Ты меня любишь?", а найти что-либо техническое, не зная заранее названия, в библиотеке ... сложновато.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Отв: B147858 Рубрикатор как инструмент информационной навигации
Ну хорошо. Предположим, случилось страшное, и Вас заинтересовало программирование PIC-контроллеров. Поиск по "PIC" в библиотеке результатов не даст, поиск по "контроллеры" - даст набор книг на "Генезисе", но - если искомая книга называлась "Программирование средств промышленной автоматизации" - этот бесценный труд пролетит мимо Вас.
Найти библиографию по теме где-нибудь в и-нете, безусловно, можно, но хотелось бы, чтобы Либрусек был в этом смысле вещью самодостаточной.
Отв: B147858 Рубрикатор как инструмент информационной навигации
А чё я, чё я-то? Я ваще завсегда за.
Мой тезис таков:
Отличие информационной организации от склада - в наличии тематического поиска. Любая библиотека - что электрическая, что бумажная - это в первую очередь склад (с более или менее развитой логистикой). А библиотекой, т.е., храмом знаний, этот склад делают средства тематического поиска.
Раньше в бумажных библиотеках такие средства были - тематический каталог, библиографические издания плюс собственно библиографы. Теперь всё умерло, и этот механизм погребён под завалами информации. С альтернативами, в общем, плохо.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Я бы, честно говоря, к поиску добавил еще и навигацию по классификационному дереву. Что-то типа "А что у нас тут по программированию есть ? А для Web ? А чтоб еще и PHP присутствовало ?"
При любом раскладе - то, что "всё плохо", мы уже поняли. Теперь хотелось бы узнать, что надо сделать, чтобы всё опять стало хорошо :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Ну это и есть оно.
Правильно в наше время это оно должно выглядеть так:
Юзер в свободной форме даёт запрос.
В ответ он получает список понятий, соответствующих запросу.
Кликнув по понятию, юзер переходит в ту или иную классификационную систему, в то место, где это понятие находится.
И видит там книжки - по теме, по теме уже, по теме шире, по теме сбоку.
А если не понравилось - то выбрать список понятий, которым требуемое должно удовлетворять.
Тогда и будет -
Такое "оно" называется - "сужать запрос по тезаурусу". Но в современной программистской мысли почему-то модно расширять...
Как минимум - не класть книжки в картинках....
Отв: B147858 Рубрикатор как инструмент информационной навигации
Это невозможно.
Миссия pdf, кстати, была в частности в том, чтобы совместить текстовое представление с обеспечением сохранности содержания. Иначе научные статьи публиковали бы в rtf, скажем. Хорошо, если djvu или pdf файл имеет текстовый слой. В том случае, если он получен из авторского текста. Если из OCR - то такая естественнонаучная книжка годится только на шпаргалки студентам.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Книжка в картинках - это всё равно, что ничего.
Господа! Сказать файнридеру "распознать всё" - это один клик. Второй - создать pdf с текстовым слоем. И не обязательно класть текстовый слой поверх картинки - можно и наоборот.
Даже если результат будет содержать массу дефектов распознавания, в нём исчезнут формулы и картинки - всё равно его будет достаточно для более-менее адекватного автоматического индексирования. А альтернативы автоматическому индексированию нет.
Любая самая крутая классификация требует, чтобы кто-то соотнёс книгу с этой самой классификацией. Проиндексировал, типа. В процессе систематизации или предметизации. Три четверти книг в этой стране систематизируются примерно двадцатью сотрудниками Ленинской библиотеки. По ББК. Их не будет больше, и работать лучше они тоже не будут - работа эта низкооплачиваемая, однако требует наличия ума и образования.
Очевидно, тексты, книгами не являющиеся, никто никогда не проиндексирует. И какого тематического поиска вы хотите? Особенно, если курочите заглавия - лишая себя возможности воспользоваться плодами труда профессиональных систематизаторов?
Альтернатива - автоматическое индексирование. А для художественной литературы - вообще единственная возможность, ибо её никто не систематизирует. Да и классификаторов для неё нет.
Автоматическое индексирование даёт посредственный результат, требует специально заточенных классификационных систем - но это единственный путь. Но что-то вы не пылаете энтузиазмом...
Резюме: нет волшебного рецепта. Вот я скажу - и всё будет. Нет. Чтобы было - нужно делать. Нужно составить и поддерживать рубркатор. Нужно иметь текстовые книги. Нужно поддерживать в правильности их реквизиты. Нужно как-то соотнести книги с рубрикатором. И только потом - воспользоваться плодами.
А я вообще полагаю, что большинство народу тайно глубоко убеждено, что компьютер умеет думать, и если подождать -он всё придумает. Сам.
Отв: B147858 Рубрикатор как инструмент информационной навигации
Вы хотите сказать, что в документе djvu или pdf могут параллельно существовать распознанный текстовый слой (пусть коряво распознанный, но невидимый для читающего и видимый для инструмента индексирования) и тот же текст в виде обычной картинки?
Если так, то ситуация кардинально меняется...
Отв: B147858 Рубрикатор как инструмент информационной навигации
В DJVU - однозначно может. И, более того, там даже может существовать оглавление, распознаваемое djvulibre (по крайней мере).
Более того, есть даже инструмент, позволяющий автоматизировать процесс (DjvuOCR), хоть и не "в один клик". И если суровый Stager предлагает сделать стандартом для добавления технической литературы DJVU с текстовым слоем и оглавлением (как минимальное требование), я, наверное, подчинюсь :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Я бы предложил - толку что?
Отв: B147858 Рубрикатор как инструмент информационной навигации
Нууу... Мне самому такая мысль уже приходила в голову. О том, чтобы нераспознанную книжку - сперва в морилку, потом в распрямилку, распознать и сделать оглавление. Проблема в том, что с технологией всего процесса я еще только разбираюсь, получается медленно - а залить что-нибудь свеженькое иногда свербит, и сильно. Скажем так - буду стремиться к окультуриванию. Но - проблемы классификации это автоматом не решает :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Не знаю за djvu, но длля pdf -
Отв: B147858 Рубрикатор как инструмент информационной навигации
Ну почему же... я - пылаю. Точнее, тлею. Пока что на этапе думания, да и то - с продолжительными остановками (реал, знаете ли, заедает...). Но вот уже, в дополнение к предыдущему разговору, додумался до того, что neural network для автораспознавания жанров художки таки придётся использовать. И до того, что не так neural network страшен, как его малюют - есть вполне пригодные готовые библиотеки, я остановился на FANN. Теперь вот думаю, нельзя ли всё-таки и подбор кивордов (ага, лошадей с мечами) тоже автоматизировать. Пока, правда - тупик...
Отв: B147858 Рубрикатор как инструмент информационной навигации
Звездолет на дикой планете. Звездолет упоминается раз пять, лошади с мечами - раз 100. К какому жанру причислит такую книгу ИскИн?
Отв: B147858 Рубрикатор как инструмент информационной навигации
К фентези. And rightly so.
Отв: B147858 Рубрикатор как инструмент информационной навигации
А как? Я совсем не понимаю в нейроных сетях, но, вроде, обучающая последовательность должна иметь однозначные критерии соответствия определённому результату, причём - одному. Как найти (составить?) текст, стопудово соответствующий одному делению классификации из (хотя бы) двух сотен, и стопудово не соответствующий никакому другому - я не представляю.
Ну тут правда тупик :-) Этот вопрос исследовался и многие пытались. Для отдельного текста - можно. Общие для двух - ну, где-то как-то... Для трёх - уже только местоимения :-)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Не хотелось бы поднимать старый флейм на тему, "что лучше - книга в плохом формате или вообще никакой".
Скажем так - скорость конвертации и вычитки мною книг существенно ниже скорости появления в и-нете любопытной литературы, и с этим я мало что могу поделать.
Но это - что касается программы минимум. А мне, честно говоря, хотелось большего - услышать от Вас, как профессионала, конкретные рекомендации. На уровне "копать здесь, кидать сюда, пока летит - отдыхать" :)
Отв: B147858 Рубрикатор как инструмент информационной навигации
Чисто технически: имя файла отданной книги - горбатое, и сам файл - классический пример того, как не надо использовать djvu. Я полагаю, распознать и закатать в .txt изготовителю помешали исключительно религиозные соображения.