Рецензия на книгу «Голая статистика»
12 июня 2016
Рецензия на книгу «Голая статистика»
- 626
- 0
- 1
-
Автор
-
Редактор
Темы
Статистику сложно назвать самостоятельной наукой, это скорее набор инструментов и моделей, который помогает нам более объективно оценить данные в различных областях знаний. Тем не менее, чтобы разбираться в статистике, нужно потратить много времени на обучение, неплохо знать математику и понимать принципы комбинаторики и теории вероятности. Чем сложнее наши знания о мире и теории, с которыми мы работаем, тем важнее правильно понимать и применять статистические методы. И как в любой достаточно сложной области, в статистике есть поле для заблуждений и манипуляций фактами. В своей книге «Голая статистика» (Naked statistics) Джон Уилан пытается максимально наглядно объяснить, на чем же строятся статистические подходы и разобрать наиболее частые ошибки применения статистики и интересные статистические казусы.
Задача, которую поставил автор книги «Голая статистика» (Naked statistics), переведенной и выпущенной издательством Манн, Иванов и Фербер, вообще говоря, очень сложная и нетривиальная — он пытается достаточно наглядно и просто объяснить базовые принципы статистического анализа тем, кто вообще мало слышал о статистике и не слишком разбирается в ее математическом аппарате.
Во введении предпринята довольно своеобразная (и, на мой взгляд, не самая удачная) попытка прорекламировать статистический анализ и объяснить, что кроется за громоздкими математическими формулами и почему разбираться в статистике важно и полезно, даже если вы не блещете вычислительными навыками и математическим складом ума, что, впрочем, не отменяет важности этой идеи. Тем не менее, Чарльз Уилан вполне справляется с заявленной в книге целью — познакомить читателей со статистическими концепциями в их непосредственной связи с повседневной жизнью.
Думаю, для большинства читателей, которые возьмут эту книгу с целью почитать про основы статистики, начало может показаться достаточно скучным — если вы собрались заняться статистикой, полагаю, вы все-таки немножко знаете про математический аппарат, и ваша подготовка в математике все-таки несколько глубже, чем у американского выпускника школы (я делаю этот вывод, основываясь на рассказе самого автора: уже студентом он понял, откуда следует сходимость некоторых числовых рядов, хотя до этого полагал, что сумма любого ряда положительных чисел устремляется к бесконечности).
В первой части описываются основные понятия описательной статистики — выборка и совокупность, среднее и медиана и отличия этих понятий, меры размаха выборки. Уилан разбирает, о чем нам говорят и о чем не говорят описательные статистики, как с помощью описательных статистик можно манипулировать представлением данных и какую информацию мы можем извлечь из их сопоставления. Математические формулы и примеры расчетов исключены из основного текста и приведены в приложении к главам.
Отказавшись от математических формул, Чарльз Уилан не стал использовать другой удобный инструмент для описания статистических понятий: в книге довольно мало рисунков и схем; вместо этого читателю приходится читать пространные словесные описания примеров, которые вполне уложились бы в простенькую иллюстрацию.
На мой взгляд, главный недостаток этой книги — это использование английских мер измерения, которое редакторы сохранили в русском переводе. Представляете себе, как выглядит человек весом 150 фунтов и ростом 6 футов? А человек весом 68 кг и 183 см? Вообще-то это один и тот же человек, но это не очевидно, особенно если вы не в состоянии моментально перевести фунты и дюймы в систему СИ. Сам Джон Уилан описывает подобные сложности, когда он пользовался дальнометром, измерявшим дистанции в непонятных американцу метрах. Без привычных единиц измерения примеры из книги становятся для читателя довольно абстрактными (приблизительно как измерение удава в попугаях, только еще хуже: длина удава для нас тоже довольно абстрактная величина, а рост и вес человека — нет).
По многим описаниям видно, что книга задумывалась для американского читателя и опирается на его интересы и жизненный опыт. Большинство примеров из американского футбола и бейсбола (с отсылками к показателям игр и спортсменов, известным в США командам и звездам американского спорта) малопонятны и из-за этого тоже абстрактны. Приемы, использовавшиеся, чтобы сделать книгу более близкой и понятной американскому читателю, затрудняют адаптацию книги для аудитории из других стран, далеких от американских реалий.
Тем не менее, на протяжении книги описано много интересных примеров и казусов, связанных с применением и интерпретацией результатов статистического анализа. Автор довольно подробно рассказывает об одной из причин экономического кризиса, когда для расчета рисков и устойчивости глобальной финансовой системы применялись неадекватные математические модели, занижавшие риски возможных негативных исходов. Уилан приводит любопытные примеры, как статистику использовали в рекламных и маркетинговых кампаниях и на телевидении, как (с точки зрения статистики) устроена работа страховых компаний и криминалистов, как проходят опросы общественного мнения. Некоторые из примеров книги интуитивно ясны, другие на первый взгляд противоречат здравому смыслу, но имеют под собой прочное математическое обоснование.
Последние разделы книги дают обильную пищу для размышлений и содержат примеры элегантного решения реальных задач, которые невозможно решить с использованием стандартных подходов (а также почему это невозможно). Здесь приведено много интересных рассуждений о том, почему нужно с особенной осторожностью пользоваться статистикой в образовательной и социальной сфере, как легко перепутать хорошие результаты работы с прекрасными показателями, за которыми вообще-то нет никаких выдающихся результатов; как, вводя новые стандарты оценки работы школ или поликлиник, мы можем нарушить их работу и сделать только хуже (хотя сами показатели будут говорить нам об обратном). Также в книге подробно разобран вопрос, почему корректно проведенный статистический анализ — не панацея, насколько важно качество данных, и почему статистика ничего не говорит нам о причинно-следственных связях явлений, особенно если речь не идет об управляемом эксперименте с опытом и контролем.
Я бы не стала рекомендовать эту книгу тем, кто хотел бы с нее начать именно изучение статистики, но без сомнений посоветовала бы ее всем, кому интересно, как устроены финансовые биржи, страховые компании, составление рейтингов, проведение опросов и экзаменов и многие другие сферы повседневной жизни, куда проникла и где прочно обосновалась статистика.