скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
PipboyD RE:Прошу переформатировать, распознать, etc... 23 часа
нэнси RE:Подайте бедному копеечку на книжку с литреса... 3 дня konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 5 дней Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 6 дней fixel RE:Пропал абонемент 1 неделя sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 недели sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 1 месяц Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 месяц sem14 RE:Серия "Символы времени" издательства "Аграф" 1 месяц tvv RE:faq brainstorm =) 2 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 2 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 2 месяца sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 месяца Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 месяца tvv RE:DNS 2 месяца Впечатления о книгах
Александр Лагода про Амлинский: Тучи над городом встали (Советская классическая проза)
24 03 В числе того, что следует прочесть из военной прозы -- эта повесть. Читая, дышите глубже.
nik_ol про Полякова: Племя Майи (Детективы: прочее)
24 03 На Флибусте уже давно лежит новая книга, а тут почему нет? Правда, я уже прочитала, и рада, что дело Татьяны продолжает Анна, люблю Полякову и очень оггорчилась, когда та скончалась. Оценка: отлично!
mysevra про Нэйлер: Гора в море [litres] (Научная фантастика)
23 03 Как по мне, маловато триллера и слишком много размышлений о природе сознания и экологии. Вот всё то же самое, только поживее – было бы интереснее. Оценка: неплохо
mysevra про Карризи: Воспитание бабочек [L'educazione delle farfalle ru] (Триллер, Детективы: прочее)
23 03 Пока всё, что читала у этого автора, на уровне. Замечательный полёт фантазии и умение плести интригу. Оценка: отлично!
mysevra про Иванов: Вегетация (Киберпанк, Постапокалипсис)
23 03 Приятный язык, и события присутствуют. Но до чего же унылый и угнетающий мир описан в книге. Конечно же, понравилось, но хотелось бы больше драйва и лёгкости. Оценка: отлично!
udrees про Джадсон: Каждой твари – по паре: Секс ради выживания (Биология, Научпоп)
21 03 Очень интересная научно-популярная книга, давно такой не читал, посвященная теме размножения и секса в дикой природе. Написана в живом и юморном стиле, в каждой главе начало показано как обращение какого-нибудь живого существа ……… Оценка: отлично!
udrees про Брукс: Лелит Гесперакс: Королева Ножей [ЛП] (Эпическая фантастика)
21 03 Не очень люблю читать истории про темных эльдаров с их сумасшедшими загонами насчет пыток и постоянных убийств. Тут относительно небольшая история одной великой суккубы – Лелит, как всегда интрига с борьбой с потенциальной ……… Оценка: неплохо
udrees про Френч: Ариман: Вечный (Эпическая фантастика)
21 03 Читать истории про легионеров Тысячи Сынов немного сложновато из-за их погруженности в книги, заклинания и метания в паутинах варпа. Простых добрых сражений с мечом и болтером, как у других легионов, куда как меньше, и много ……… Оценка: хорошо
udrees про Володин: Газлайтер. Том 11 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
21 03 Как понятно из 10й книги, эта посвящена полностью войне с Китаем, империей Хань. Как и вся книга, которая предельно несерьезная, примитивная, то и война такая же несерьезная, как детская войнушка. На нее собираются совершенно ……… Оценка: неплохо
udrees про Вааль: Достаточно ли мы умны, чтобы судить об уме животных? (Биология)
21 03 Прочитав эту книгу об умственных способностях животных, я так и не получил доказательств разума у братьев наших меньших. Половина книги или больше посвящена шимпанзе, которые справедливо считаются самыми умными среди животных. ……… Оценка: неплохо
iggy71 про Сашар: Я не верю в монстров [There’s a Boy in the Girls’ Bathroom ru] (Детская проза)
20 03 Шедевр. И перевод великолепный. Оценка: отлично!
iggy71 про Буайе: Ромашка. Легенда о пропавшем пирате [litres] (Исторические приключения, Морские приключения)
20 03 Эту муть мог сочинить только ИИ или наркоман. Оценка: плохо |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.