Недавно мы провели вебинар «Где применяется теория вероятностей», где статистика и идея вероятности объяснены по-простому.
Вот какие книги были использованы для подготовки материала.
«Черный лебедь (под знаком непредсказуемости)»
Автор — Нассим Талеб.
Книга-критика. Речь идёт о том, что ни учёные, ни экономисты на самом деле ничего не могут предсказать, т.к. пользуются гауссовой кривой там, где этого делать нельзя. Из-за этого неожиданно для них может происходит огромное по масшатабам и абсолютно непредсказумое событие — так называемый "чёрный лебедь". Они не могли предсказать ни приход Гитлера к власти, но обвал биржи в конце 80х.
Например, это видно по тому, что люди продолжали оптимистично покупать государственные облигации даже в начале Второй Мировой войны — ведь никто не мог даже предположить, что война станет мировой и затяжной.
Билл Гейтс и его нереально большое состояние — тоже пример чёрного лебедя, ибо сколько человек не включай в выборку, один Билл Гейтс перекроет чуть ли ни всех, и считать средние показатели по такой выборке будет бессмысленно.
«Закономерности окружающего мира»
Автор — Тарасов Л.В.
Это произведение состоит из трёх томов, и я прочёл только первый из них. Автор рассматривает вопросы, касающиеся устройства мира вообще — от симметрии до вероятностей.
Мне понравилось, что он приводит три психологических этапа, которые проходит каждый человек, изучающий теорию вероятностей:
- "я смогу предсказывать исходы!"
- "я ничего не смогу предсказывать..."
- и наконец "я смогу предсказывать, но не конкретные исходы".
Книга большая, и вопросы разобраны очень подробно.
«Невероятно — не факт»
Автор — Александр Китайгородский.
Интересно! Рассказывает, как Альберт Эйнштейн увязал вместе теорию вероятостей и случайные блуждания элементарных частих при броуновском движении, а также как это приводит к идее нормального распределения.
Ещё в книге говорится о том, что математическая модель казино крутится вокруг того, что есть сектор "ноль".
Сама книга называется так из-за закона 3 сигм, когда вещи, имеющие совсем уж низкую вероятность (невероятные), можно исключать из рассмотрения.
«(Не)совершенная случайность. Как случай управляет нашей жизнью.»
Автор — Леонард Млодинов.
Очень интересно, рекомедую. Много истории возниковения теории вероятностей — и Паскаль, и Бернулли, и сотни других учёных.
Отсюда я узнал про эффект возврата к среднему на примере вылетов пилотов — их начальник считал, что если после плохих вылетов устроить им взбучку, то из-за взбучки пилоты начинали летать лучше, а на самом деле просто происходил возврат к среднему.
Интересная, живая и необычная книга.
«Практическая бизнес-статистика»
Автор — Эндрю Сигел.
Эту книгу очень трудно найти в бумажном варианте, но мне повезло — знакомая из Danmarks Statistik дала экземпляр почитать. «Практическая бизнес-статистика» — это отлично организованный вводный курс по статистическим методам анализа данных. Прямо по пунктам, последовательно разобраны основные понятия статистики, приведены примеры использования и даже даны задачи на самопроверку — тут и анализ финансового состояния компаний, оценка фондового рынка, прогноз уровня продаж фирмы, предсказание результатов выборов, анализ качества и выводы о сортности продукции, эффективность рекламных кампаний и много других задач, с которыми сталкивается бизнес.
Книжка очень толстая, больше 1000 страниц, но где-то треть этого объёма занимают задачи, довольно однотипные. Сама книга написана понятно и доходчиво, но не примитивно. Множественные аха!-моменты вам обеспечены.
«Duelling Idiots and Other Probability Puzzlers»
Ерунда, не тратьте время — просто много оторванных от практики задач на теорию вероятностей, очень сухо и академично. Там был только один классный пример использования теории вероятностей — когда медикам нужно задать тысячам пациентов деликатный вопрос, и нет возможности собрать всех сразу. Если опрашивать по-одному, то пациент может постесняться честно ответь "да" или "нет" на щекотливый вопрос, поэтому к этому вопросу добавили бросание монетки, и теперь пациент обезопасен — его ответ может являться ответом на исходный щекотливый вопрос либо же ответом на вопрос "выпала ли вам решка". А математики уже по таким сырым данным могут делать выводы о статистике ответов на неудобный вопрос.
«Big Data (Большие данные)»
Автор — Виктор Майер-Шенбергер.
Очень интересно. Много примеров статистики, например, как Google предсказывает эпидемии в США по тому, что люди ищут в этом поисковике. Или как WallMart предсказывал, кто из его покупателей-женщин скорее всего беременны — по совершённым ими покупкам, и заранее присылал им купоны на памперсы и товары для новорождённых (и как тут вышел скандал, когда такой купон прислали 15летней девушке — её отец разгневался на магазин, но оказалось, что статистика была права).
«Data Smart»
Автор — John W. Foreman
Не знаю, как книга будет называться по-русски; думаю, что-то типа "Подкованный в данных". Автор книги — ведущий программист емейл-платформы Mailchimp. Он объясняет основные методы статистики, применяя их к разным задачам на примере таблиц Excel. Тут и наивный байессовский классификатор, и транспортные задачи, и регрессии, и использование нормального распределения и трёх сигм. Объяснения даны очень хорошо, а вот в Excel-примерах легко увязнуть — слишком уж большие формулы получаются. Пример задачи — один мужчина ушёл на войну, а его жена вскоре забеременела, при этом было не понятно — то ли она забеременела через месяц после его ухода (т.е. измена), либо это просто нереально длинная беременность (версия этой женщины). С помощью анализа данных по роженицам в суде было установлено, что её случай выходит за пределы трёх сигм и поэтому считается изменой.
Приятного чтения. Не забудьте посмотреть запись вебинара.