Анализ данных

Интерфейс модуля «Анализ и визуализация данных»

Интерфейс модуля анализа данных условно можно разбить на два больших раздела: Параметры основные (вверху) и Инфографика (внизу). С помощью фильтров в верхней части экрана (Параметры основные) можно выбрать нужное подмножество из набора данных для визуализации его в виде графиков в нижней части экрана (Инфографика). Основные разделы модуля Анализ и визуализация данных.

Раздел «Параметры основные»

В верхней части экрана отображается вся метаинформация из набора данных в виде фильтров с выпадающими списками. Названия фильтров соответствуют названиям столбцов, а значения в выпадающих списках – значениям в ячейках исходной таблицы. При этом фильтры с названиями Группа микроорганизмов и Микроорганизмы всегда расположены внизу раздела Параметры основные.

В разделе Параметры основные существует два типа фильтров:

  • Фильтры для категориальных данных, у которых есть выпадающий список категорий/значений для выбора (например, вирулентность, геолокация и т.п.)
  • Фильтры для непрерывных данных (например, возраст, дата), которые задаются с помощью специального слайдера

При использовании фильтров для категориальных данных можно воспользоваться функцией поиска. В текстовом поле фильтра можно вводить нужное значение, и в списке категорий останутся те значения, в которых содержится введенный текст:

Фильтры категориальных данных

Иерархический принцип фильтрации

При применении какого-либо фильтра окно будет обведено синей рамкой.

Рамка вокруг фильтров

Все фильтры пронумерованы согласно их иерархии (от 1 до 12: чем меньше число, тем выше иерархия). При изменении значений фильтра высокой иерархии могут быть сокращены доступные для выбора категории в фильтрах более низкой иерархии (такие фильтры также будут обведены синей рамкой).

Пример
  1. Внести изменения фильтра 1 Lineage с помощью выбора категории I и III.
  2. В фильтрах 2, 3 и 5 сократилось количество категорий для выбора, и они обведены синей рамкой (например, в фильтре 3 Geographical_location_of_isolation вместо 17 осталось 7 категорий):
  3. Если снова изменить значение фильтра 1 Lineage, выбрав все категории:
  4. …то, все значения фильтров более низкой иерархии также изменятся (возвращение к исходным наборам категорий):

Таким образом, при работе с фильтрами лучше всего изменять их значения последовательно в том порядке, в каком они пронумерованы. Однако это правило не касается непрерывных данных, таких как возраст, дата и т.п.

Для того чтобы значения фильтров низкой иерархии не сбрасывались каждый раз при переключении вышестоящих фильтров – необходимо использовать функцию Удерживать фильтры:

Удержание фильтров
Следует отметить, что функция «Удерживать фильтры» применима только к фильтрам для категориальных данных.

Раздел «Инфографика»

Вкладки «Инфографики» позволяют методично изучать все аспекты данных, начиная с обобщенных данных во вкладке Структура данных до исследования частных вопросов во вкладке Сравнения.

7 вкладок раздела «Инфографика» предоставляют собой различные инструменты визуализации:

  • Вкладка Структура данных позволяет просмотреть общую структуру метаданных (распределение данных по различным категориям, взаимосвязь различных категорий данных, географическое распределение данных).
  • Вкладка Микроорганизмы отображает общую информацию о распределении различных штаммов или групп микроорганизмов в наборе данных. Вкладка может быть полезна для первоначального анализа набора данных и определения стратегии дальнейшего анализа.
  • Во вкладках Антибиотики (все), Выбранный антибиотик и Ассоциированная устойчивость можно просмотреть и проанализировать информацию о резистентности. Вкладки упорядочены по уровню детализации данных: от общего анализа к более глубокому. Использование вкладок в таком порядке поможет рассмотреть сначала «общую картину» – проблемные/интересующие области (устойчивость выбранных групп микроорганизмов к различным антимикробным препаратам, распределение МПК и т.д.), а затем перейти к детализации: рассмотрению взаимосвязей между резистентностью и метаданными (данные о пациенте, география, тип инфекции и т.д.), а также рассмотрению ассоциированной устойчивости (множественная устойчивость и т.д.)
  • Вкладка Маркеры позволяет исследовать взаимосвязь резистентности и генетических детерминант, а также установить корреляцию между всеми видами генетических маркеров и метаданными.
  • Вкладка Сравнения позволяет выделить на основе разных параметров две группы из исходного набора данных и сравнивать их между собой. Например, можно создать две группы: нозокомиальные и внебольничные инфекций, и сравнить в них распространенность резистентных изолятов, наличие различных маркеров или распределение метаданных.

Важно отметить, что для корректной визуализации данных, после изменения значений в разделе Параметры основные, необходимо нажать на кнопку Отобразить.

При этом выпадающие списки во вкладках раздела «Инфографика» меняют представление только одного конкретного графика/диаграммы, расположенного на этой же вкладке. После изменения значений фильтров внутри вкладок «Инфографики», необходимо нажать на кнопку Отобразить.

Все гистограммы, круговые диаграммы и графики в разделе «Инфографика» являются интерактивными. При наведении курсора на график, появляется всплывающее сообщение с информацией о названии категории данных и численном значении параметра. Отображаемые на графиках категории можно изменить, нажав на значок нужной категории в легенде (при этом численные значения категорий не изменятся).

Пример

При нажатии на соответствующий значок в легенде, категория Нет данных будет скрыта с гистограммы Процент изолятов:

Как упоминалось ранее, названия столбцов в импортированной таблице используются в качестве имен фильтров раздела Параметры основные. На этапе импорта система попросит отметить некоторые столбцы загружаемой таблицы, такие как Параметры или Маркеры: и те, и другие будут отображаться в разделе фильтров Параметры основные. Маркеры также будут отображаться во вкладке Маркеры раздела «Инфографика».

Также важно отметить, что если есть данные о нескольких генетических детерминантах, которые вызывают устойчивость к определенному классу антимикробных препаратов, то может быть полезно сгруппировать их в одну единую категорию (ознакомиться подробнее можно в Руководстве «AMRcloud. Импорт данных»).