Что почитать по теории вероятностей

Недавно мы провели вебинар «Где применяется теория вероятностей», где статистика и идея вероятности объяснены по-простому.

Вот какие книги были использованы для подготовки материала.

«Черный лебедь (под знаком непредсказуемости)»

Автор — Нассим Талеб.

Черный лебедь

Книга-критика. Речь идёт о том, что ни учёные, ни экономисты на самом деле ничего не могут предсказать, т.к. пользуются гауссовой кривой там, где этого делать нельзя. Из-за этого неожиданно для них может происходит огромное по масшатабам и абсолютно непредсказумое событие — так называемый "чёрный лебедь". Они не могли предсказать ни приход Гитлера к власти, но обвал биржи в конце 80х.

Например, это видно по тому, что люди продолжали оптимистично покупать государственные облигации даже в начале Второй Мировой войны — ведь никто не мог даже предположить, что война станет мировой и затяжной.

Билл Гейтс и его нереально большое состояние — тоже пример чёрного лебедя, ибо сколько человек не включай в выборку, один Билл Гейтс перекроет чуть ли ни всех, и считать средние показатели по такой выборке будет бессмысленно.


«Закономерности окружающего мира»

Закономерности окружающего мира

Автор — Тарасов Л.В.

Это произведение состоит из трёх томов, и я прочёл только первый из них. Автор рассматривает вопросы, касающиеся устройства мира вообще — от симметрии до вероятностей.

Мне понравилось, что он приводит три психологических этапа, которые проходит каждый человек, изучающий теорию вероятностей:

  1. "я смогу предсказывать исходы!"
  2. "я ничего не смогу предсказывать..."
  3. и наконец "я смогу предсказывать, но не конкретные исходы".

Книга большая, и вопросы разобраны очень подробно.


«Невероятно — не факт»

«Невероятно — не факт

Автор — Александр Китайгородский.

Интересно! Рассказывает, как Альберт Эйнштейн увязал вместе теорию вероятостей и случайные блуждания элементарных частих при броуновском движении, а также как это приводит к идее нормального распределения.

Ещё в книге говорится о том, что математическая модель казино крутится вокруг того, что есть сектор "ноль".

Сама книга называется так из-за закона 3 сигм, когда вещи, имеющие совсем уж низкую вероятность (невероятные), можно исключать из рассмотрения.


«(Не)совершенная случайность. Как случай управляет нашей жизнью.»

(Не)совершенная случайность. Как случай управляет нашей жизнью

Автор — Леонард Млодинов.

Очень интересно, рекомедую. Много истории возниковения теории вероятностей — и Паскаль, и Бернулли, и сотни других учёных.

Отсюда я узнал про эффект возврата к среднему на примере вылетов пилотов — их начальник считал, что если после плохих вылетов устроить им взбучку, то из-за взбучки пилоты начинали летать лучше, а на самом деле просто происходил возврат к среднему.

Интересная, живая и необычная книга.


«Практическая бизнес-статистика»

Практическая бизнес-статистика

Автор — Эндрю Сигел.

Эту книгу очень трудно найти в бумажном варианте, но мне повезло — знакомая из Danmarks Statistik дала экземпляр почитать. «Практическая бизнес-статистика» — это отлично организованный вводный курс по статистическим методам анализа данных. Прямо по пунктам, последовательно разобраны основные понятия статистики, приведены примеры использования и даже даны задачи на самопроверку — тут и анализ финансового состояния компаний, оценка фондового рынка, прогноз уровня продаж фирмы, предсказание результатов выборов, анализ качества и выводы о сортности продукции, эффективность рекламных кампаний и много других задач, с которыми сталкивается бизнес.

Книжка очень толстая, больше 1000 страниц, но где-то треть этого объёма занимают задачи, довольно однотипные. Сама книга написана понятно и доходчиво, но не примитивно. Множественные аха!-моменты вам обеспечены.


«Duelling Idiots and Other Probability Puzzlers»

Duelling Idiots and Other Probability Puzzlers

Ерунда, не тратьте время — просто много оторванных от практики задач на теорию вероятностей, очень сухо и академично. Там был только один классный пример использования теории вероятностей — когда медикам нужно задать тысячам пациентов деликатный вопрос, и нет возможности собрать всех сразу. Если опрашивать по-одному, то пациент может постесняться честно ответь "да" или "нет" на щекотливый вопрос, поэтому к этому вопросу добавили бросание монетки, и теперь пациент обезопасен — его ответ может являться ответом на исходный щекотливый вопрос либо же ответом на вопрос "выпала ли вам решка". А математики уже по таким сырым данным могут делать выводы о статистике ответов на неудобный вопрос.


«Big Data (Большие данные)»

Big data

Автор — Виктор Майер-Шенбергер.

Очень интересно. Много примеров статистики, например, как Google предсказывает эпидемии в США по тому, что люди ищут в этом поисковике. Или как WallMart предсказывал, кто из его покупателей-женщин скорее всего беременны — по совершённым ими покупкам, и заранее присылал им купоны на памперсы и товары для новорождённых (и как тут вышел скандал, когда такой купон прислали 15летней девушке — её отец разгневался на магазин, но оказалось, что статистика была права).


«Data Smart»

Data Smart

Автор — John W. Foreman

Не знаю, как книга будет называться по-русски; думаю, что-то типа "Подкованный в данных". Автор книги — ведущий программист емейл-платформы Mailchimp. Он объясняет основные методы статистики, применяя их к разным задачам на примере таблиц Excel. Тут и наивный байессовский классификатор, и транспортные задачи, и регрессии, и использование нормального распределения и трёх сигм. Объяснения даны очень хорошо, а вот в Excel-примерах легко увязнуть — слишком уж большие формулы получаются. Пример задачи — один мужчина ушёл на войну, а его жена вскоре забеременела, при этом было не понятно — то ли она забеременела через месяц после его ухода (т.е. измена), либо это просто нереально длинная беременность (версия этой женщины). С помощью анализа данных по роженицам в суде было установлено, что её случай выходит за пределы трёх сигм и поэтому считается изменой.


Приятного чтения. Не забудьте посмотреть запись вебинара.


Подпишись на видео-курс

Лого курса

«Теория вероятностей»

Теория через практику: определяем язык текста