Original size 1140x1600

Анализ данных о наблюдениях НЛО

(1) Описание

Существование внеземных форм жизни — давний вопрос, интересующий человечество и приобретающий все большую актуальность в условиях современного научно-технического прогресса.

Проект посвящен анализу данных о наблюдениях неопознанных летающих объектов (НЛО) за период с 1949 по 2014 год с целью выявления закономерностей в восприятии аномальных явлений очевидцами.

Данные взяты с сайта kaggle.com и содержат более 80 000 сведений, включающих информацию о городе, штате, времени, описании и продолжительности каждого наблюдения.

(2) Работа с данными

big
Original size 1922x680

1. Импорт библиотек 2. Стилевые данные 3. Открытие файла

Стилистические решения были обусловлены созданием эффекта наблюдения за летающими объектами с радаров, а зелено-лиловые цвета чаще всего ассоциируются с «инопланетным».

big
Original size 1922x549

#401B89, #93F581, #9C8DF5

После импорта данных я сосредоточусь на следующих задачах:

1. Проследить динамику свидетельств об НЛО с течением времени. 2. Определить, в каких регионах чаще всего фиксировали наблюдение. 3. Выявить преимущественно используемый образ для описания увиденных аномальных явлений респондентами.

Для наглядного отображения данных, я буду использовать: - Диаграмму рассеяния - Диаграмму облака слов - Столбчатую диаграмму - Круговую диаграмму

Original size 1922x1040

1. Диаграмма рассеяния, отражающая корреляцию количества свидетельств в зависимости от года.

Вычленив из данных количество упоминаний об НЛО и отсортировав их по годам, можно заметить постепенное увеличение количества фиксаций подобных явлений, из чего можно предположить следующее:

— Действительное увеличение количества атмосферных наблюдаемых явлений (возможно, из-за климатических явлений)

— Распространение информации об НЛО в СМИ создавало у людей фантомные иллюзии и повышало количество свидетельств

— Рост научного интереса к подобным явлениям и распростанение средств коммуникации обеспечивали пополнение количества респондентов.

Original size 1922x905

1. Код для диаграммы рассеяния

После выявление роста наблюдений НЛО я приступила к определению их локализации (*из взятого датасета) по городам.

Original size 1922x1344

2. Диаграмма облако слов, визуализирующая частоту наблюдений НЛО по городам

Визуализация через диаграмму облака слов показывает, что превалирующая часть городов из данных находится в США:

Phoenix, Seattle, San Diego, Tinley Park, Los Angeles, Miami, Dallas, Chicago, Houston, San Francisco.

Некоторая частотность наблюдалась и в других странах: London (Великобритания), Toronto (Канада), Johannesburg (ЮАР).

*На диаграмме даже оказался Санкт-Петербург

Original size 1922x636

2. Код для диаграммы облака слов

В какой-то момент я задалась вопросом о том, что частотность свидетельств о наблюдении НЛО не отражает их качества.

Так как датасет содержал показатели о длительности наблюдения, я решила определить в какой местности респонденты дольше фиксировали наблюдаемый феномен.

Original size 1922x1070

3. Столбчатая диаграмма, отражающая рейтинг стран по длительности наблюдения за НЛО.

Отфильтровав данные по длительности наблюдения (в датасете измеряются в секундах) и выявив их усредненные значения, я создала столбчатую диаграмму, коррелирующую с местоположением по странам.

Неожиданным открытием стала лидирующая позиция Великобритании (gb), и только после США (us) и Австралия (au). В рейтинг также вошли Канада (ca) и Германия (de).

Original size 1922x989

3. Код для столбчатой диаграммы

В заверешние моего исследования, я решила определить, какие образы и формы респонденты чаще всего используют при описании НЛО, и так ли оправдан канон «летающей тарелки».

Original size 1922x1464

4. Круговая диаграмма, показывающая главные описания форм НЛО.

С помощью круговой диаграммы я выявила 10 самых часто используемых слов для описания формы увиденного аномального явления респондентами с отображением в %.

Описания в виде «вспышки» заняло лидирующую позицию — 24,2%. Формы «треугольника» и «круга» также оказались распространенными — по 12%.

Более точные описания, подходящие под определение «летающей тарелки» — «сфера», «диск» и «овал» оказались менее популярны.

Original size 1922x622

4. Код для круговой диаграммы.

(3) Выводы

Проанализировав данные, самыми интересными для меня оказались открытия об активном всплеске увеличения количеств наблюдения НЛО в середине 1990-х годов.

Также данные показали что чаще всего акты наблюдений происходили в США и Англии, что скорее всего обусловленно СМИ и развитой системы репортинга в данных странах. Отдельного внимания заслуживают конкретные города, засвидетельствовавшие больше всего аномалий, что может привести к открытиям по данной тематике при их детальном изучении.

Original size 1280x720

UFO PROJECT

Анализ данных о наблюдениях НЛО
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more