Google Flu Trends.
![](/upload/iblock/ce2/ce244559bd6d447933a8c84114f1cf56.jpg)
Сервис работает очень просто, многие заболевшие люди или те кто боится заболеть начинают искать в сети информацию о гриппе. Число таких запросов всегда увеличивается во время эпидемий. Сервис реагирует на это, и, используя специальную статистическую модель выявляет примерное общее число больных. В 2009 году разработчики поделились с журналом Nature своими данными. Другие исследователи также заявили, что увеличение популярности некоторых запросов совпадает со вспышкой эпидемий.
Однако в появившейся в Science статье показаны серьезные ошибки в прогнозах сервиса, оказалось, что он примерно на половину преувеличивает размах эпидемии в последние 2 года, в 2009 году он полностью прозевал появление свиного гриппа. Эти данные стали доводом против использования в данном случае «больших данных». Исследователи назвали статистическую модель Гугла провальной.
На самом деле, этот вывод не является настолько неожиданным. Просчеты сервиса отмечены на его же сайте, их никто не скрывает, разработчики дают возможность скачать с сайта все прогнозы, которые когда – либо были сделаны сервисом, в том числе и ошибочные, саму модель все время дорабатывают, чтобы в будущем было меньше ошибок. Она ежегодно сопоставляется с данными обычных систем наблюдения за эпидемиями, оценивается 3 различных показателя, на основании которых постоянно дорабатывается. Фактически, данная публикация стала неожиданностью лишь для считающих, что оценки сервиса абсолютно точны, его разработчики не относятся к числу таких оптимистов, они понимают, что даже самые математически выверенные в прошлом результаты не гарантируют абсолютной точности в будущем. В любых прогнозах возможны ошибки, а задача их авторов максимально сократить их число. Для того чтобы точнее прогнозировать эпидемию, нужно учитывать больше данных, так что можно сказать, что ожидаемая сенсация не состоялась.