Подготовка данных

«Золотые правила» для данных

Одним из ключевых этапов работы с платформой AMRcloud является структурирование исходных данных.

Основные принципы организации данных можно сформулировать в виде следующих «золотых правил», которые будут подробно описаны ниже:

  1. Каждая строка в таблице — это отдельный изолят.
  2. В таблице должно быть 5 обязательных столбцов (идентификатор, вид микроорганизма, группа микроорганизмов*, дата, чувствительность).
  3. Нзвание АМП пишется на английском с добавлением одного из трех суффиксов («_mic», «_dd», «_sir»).
  4. Дополнительные столбцы не являются обязательными (географические данные, метаданные, маркеры).

* - столбец “Группа микроорганизмов” может быть пропущен, т.к. AMRcloud может автоматически сгенерировать его по запросу

Образец данных

Основные требования к исходным табличным данным перечислены на вкладке Важная информация страницы импорта данных. Внизу страницы есть ссылка для скачивания образца таблицы, который можно использовать для редактирования исходных пользовательских данных.

Скачивание образца данных

Основные требования

Чтобы работать с AMRcloud необходимо привести данные к единому формату.

  1. Таблица должна быть плоской. Это означает, что она состоит из столбцов и строк, в которых нет дополнительных разделений - иерархий (нет подстрок или разделенных столбцов).

    Структура таблицы

  2. Первая строка таблицы должна содержать заголовки всех столбцов.

    Заголовочная строка таблицы

  3. Таблица должна содержать 5 видов обязательных столбцов:

    • Идентификатор изолята (ID_изолята)
    • Название вида микроорганизма
    • Название группы микроорганизмов
    • Дата
    • Результат определения чувствительности к антимикробному препарату (АМП)
Обязательные столбцы таблицы

Идентификатор изолята

В качестве идентификатора изолята допустимо использовать неуникальные номера. Идентификатор может быть буквенными или числовыми.

Вид микроорганизма

Для автоматической и быстрой интерпретации результатов AMRcloud использует полные названия видов микроорганизмов, поэтому Название вида микроорганизма должно быть полное. Сокращения в названии вида недопустимы.

Правильно:

Staphylococcus aureus, Streptococcus pneumoniae

Неправильно:

S. aureus, S. pneumoniae

Группа микроорганизма

Название группы микроорганизмов может быть сокращено, но сокращения необходимо сделать стандартными (одинаковыми по всему столбцу).

Правильно:

Enterobacterales, Staphyl, Enterobacterales, Staphyl (сокращенные названия - стандартизированы)

Неправильно:

Enterobac, Staph, Staphyl, Entbac, Staphylococ (сокращенные названия нестандартизированы)

На заметку!

Вы также можете оставить значения в столбце Название группы микроорганизмов пустыми или вообще удалить данный столбец из исходной таблицы, но в таком случае при импорте таблицы вам будет необходимо поставить галочку Сгенерировать группы организмов из названий видов в соответствующем разделе (см. “Шаг 2 - Выбор параметров”").

Дата

Система импорта автоматически определит любой стандартный вариант написания даты. Главным условием является универсальность оформления по всему столбцу.

Правильно:

12.08.2018, 20.05.2017, 16.03.2014 (единое оформление ДД.ММ.ГГГГ)

Неправильно:

12.08.2018, 20/05/19, 03/16/2014 (разное оформление ДД.ММ.ГГГГ, ДД/ММ/ГГ, ММ/ДД/ГГГГ)

Формат дат

Результаты определения чувствительности к АМП

Возможные форматы результатов:

  • Значения минимальных подавляющих концентраций (МПК) - мг/л
  • Диаметры зон подавления роста - мм
  • Категории чувствительности (S/I/R) - значения заранее определяются пользователем

Суффиксы в названии АМП

Название столбца с результатами определения чувствительности должно соответствовать следующим правилам:

  1. Название антимикробного препарата должно быть написано полностью, без сокращений, на английском языке. Список допустимых названий АМП можно скачать по ссылке внизу страницы.
    Список допустимых антибиотиков
  2. Для того, чтобы система могла автоматически проинтерпретировать результаты, к названию АМП должен быть добавлен через нижнее подчеркивание соответствующий суффикс:
Значения минимальных подавляющих концентраций _mic
Диаметры зон подавления роста _dd
Категории чувствительности _sir

Пример:

tobramycin_sir, tetracycline_sir, amoxicillin-clavulanic acid_dd, vancomycin_mic

На заметку!

Антибактериальные препараты с оценкой по “особым” критериям интерпретации (пользовательские категории S/I/R) и/или со значениями ECOFF могут быть записаны следующим образом:

amoxicillin-clavulanic acid_clsi_mic, moxifloxacin_clsi_sir, marbofloxacin_veterinary_sir

Допускается указывать нагрузку диска между названием антибиотика и суффиксом _dd:

amoxicillin-clavulanic acid_2-1_dd, moxifloxacin_5_dd

Важно!

  • Значения минимальных подавляющих концентраций

    • Измеряются в мг/л
    • Значения должны быть числовыми
    • Нечисловые значения, содержащие выражения <= ... или > ... или >= ..., будут преобразованы в числовые
    • Символы <= и >= перед числами — игнорируются
    • Числа после символа > будут умножены на 2
  • Диаметры зон подавления роста

    • Измеряются в мм
    • Значения — любые целые числа больше или равные 6
  • Категории чувствительности

    • Значения — “S”, “I”, “R”
    • Категория чувствительности может быть только одна

Правильно:

S, S, R (категория чувствительности 1 для каждого изолята)

Неправильно:

S+I, S+I, I+R (больше 1 категории чувствительности для каждого изолята)

Дополнительные столбцы

Дополнительные столбцы — заполнение таких столбцов не является обязательным.

  1. Географические данные
    • Географические объекты (город, область, страна и т.д.)
    • Широта
    • Долгота
  2. Метаданные (текстовые)
  3. Метаданные (числовые)
  4. Маркеры (генетические маркеры резистентности, особые фенотипы и/или факторы вирулентности)

Географические данные

Географические объекты могут включать название города, области, страны. Также пользователь может укзаать более подробные адресные данные (например, корпус ЛПУ). Широта и Долгота может быть изменена вручную, если не сработало автоматическое определение координат объектов.

Основные требования и рекомендации к географическуим данным представлены в разделе “Геокодирование”.

Метаданные (текстовые)

Пользователь может выбрать до 12 показателей в формате “текстовые данные” (если в таблице есть столбец с названием географических объектов, рекомендуется его также включать).

Например “Локализация инфекции”, “Отделение”, “Клинический материал”.

Кроме того, среди данных категорий могут быть включены индивидуальные характеристики пациента (например, столбец с категорией “Фебрильная лихорадка”). Рекомендованые обозначения: “Да”, “Нет”, “Неприменимо”.

Метаданные (числовые)

Пользователь может выбрать 1 показатель в формате “числовые данные”.

Например, “Возраст” или “Вес пациента”.

Маркеры

  • Общее количество маркеров неограничено
  • Возможно создание пользователем собственной “группировки маркеров”
  • Указываются генетические маркеры, особые фенотипы, факторы вирулентности

При расстановке показателей по генетическим маркерам и особым фенотипам рекомендована следующая система обозначений:

Поиск определенного генетического маркера или особого фенотипа... Значение в ячейке таблицы
...проводился, результат положительный "OXA-48", "KPC", "MRSA", "CTX-M-15" и т.д.
...проводился, результат отрицательный "Не обнаружено"
...не проводился "Не определено"
...для данного микроорганизма неприменим пустая ячейка
Генетические маркеры