Перейти к:
Дизайн научных исследований в медицине
https://doi.org/10.47093/2218-7332.2021.12.1.4-17
Аннотация
Адекватный дизайн является необходимым условием для проведения успешного научного исследования. В настоящем обзоре представлены основные типы дизайна научных исследований в области медицины. Авторы обсуждают основные различия между несколькими видами наблюдательных и интервенционных исследований, а также их преимущества и недостатки на примере опубликованных статей. В обзоре представлена концепция систематических ошибок и их возможные причины. Обсуждаются подходы к выбору дизайна исследования в зависимости от задач исследования, а также методы описания результатов. В тексте даны ссылки на рекомендации по организации и представлению результатов различных типов исследований, которые были предложены за последние годы.
Ключевые слова
Научные исследования в области медицины можно описать как «спланированные и систематизированные действия, направленные на получение достоверных данных для решения разных медицинских проблем, используя данные с высокой степенью точности» [1]. Получается, что цель медицинских исследований – это приобретение знаний, обладающих не только научной, но и практической значимостью для отдельного человека и общества в целом. Это накладывает большую ответственность на исследователя. Однако ученые порой забывают, что необходимым условием качественного исследования является тщательное планирование его дизайна. Ведь если ошибки, допущенные при статистической обработке данных, можно исправить, дизайн проведенного исследования изменить нельзя. Некачественное планирование дизайна является одной из главных причин отклонения рукописей научными журналами и одной из ключевых проблем исследований, проводимых российскими аспирантами [2].
При планировании исследования особого внимания заслуживают следующие два фактора. Первый и наиболее значимый фактор – точная формулировка научной гипотезы на основании тщательного изучения опубликованных работ и выявления существующих пробелов в исследуемой области [3]. Изучаемый вопрос должен соответствовать этическим нормам и обладать научной новизной, актуальностью и практической значимостью. Однако часто исследователи тратят свое время, силы и прочие ресурсы на решение уже изученных проблем или, наоборот, формулируют гипотезу, которую на практике проверить очень сложно. Иногда авторы не уделяют должного внимания этическими аспектам проведения и публикации исследований.
Второй важный этап планирования исследования – выбор типа дизайна. Он зависит от цели и задач исследования, которые бывают следующими: изучение этиологии и факторов риска, заболеваемости, распространенности, выживаемости, качества скрининговых процедур и диагностических тестов, эффективности и безопасности лечебных и профилактических вмешательств, показателей исходов, сообщаемых пациентами. Дизайны исследований различаются по простоте, доступности, времени и другим ресурсам, необходимым для их планирования и проведения. Цель данного обзора – описать ключевые моменты в планировании исследований, различия между наиболее частыми типами дизайна исследований, особенности их применения и недостатки. Кроме того, в тексте даны ссылки на руководства по оформлению дизайна основных видов исследований в клинической медицине.
Терминология
Ниже представлены определения некоторых терминов, которые используются в данном обзоре.
Субъект – это лицо (пациент), участвующее в исследовании.
Проспективные и ретроспективные исследования. В проспективных исследованиях группа субъектов наблюдается в течение заранее определенного периода времени, по истечении которого оценивается, наступил исход или нет. В ретроспективных исследованиях для уже известных исходов собирается информация (например, по данным медицинской документации) о воздействиях (факторах риска) в прошлом. Более сложным видом являются двунаправленные исследования, которые включают проспективную и ретроспективную фазы.
Показатель распространенности (превалентность) отражает встречаемость среди определенного населения в данный период времени изучаемого явления, независимо от давности его появления. Показатель распространенности выражают в процентах (например, 10%, то есть 10 человек из 100) или количестве случаев на 1000, 10 000 или 100 000 человек.
Показатель заболеваемости (инцидентность) отражает частоту вновь выявленных случаев изучаемого заболевания среди определенного населения за данный период времени. Показатель заболеваемости выражают в количестве новых случаев на 1000, 10 000 или 100 000 человек за определенный период времени, например 10 случаев на 1000 человек в год.
Ассоциация – взаимосвязь двух переменных (например, воздействующего фактора и исхода), которая не всегда подразумевает наличие причинно-следственной связи.
Причинно-следственная связь означает, что действие изучаемого фактора приводит к развитию исхода.
Систематическая ошибка (смещение, bias) представляет собой смещение в оценке результатов исследования из-за фактора, который не учитывался в статистическом анализе. Другими словами, bias – это тенденция переоценить или недооценить изученный параметр. Систематическая ошибка может возникнуть в любом исследовании и на любом этапе – от сбора данных до статистического анализа результатов [4].
Конфаундинг – это искажение эффекта изучаемого воздействия на исход, вносимое одним или несколькими вмешивающимися факторами (конфаундерами). Основной причиной конфаундинга является связь конфаундера как с изучаемым фактором, так и с исходом (рис. 1). Систематическая ошибка, вызванная присутствием вмешивающегося фактора, называется ошибкой конфаундинга.
FIG. 1. Illustration of confounding.
РИС. 1. Пример конфаундинга.
Note: statistical analysis showed that coffee consumption is a significant risk factor for heart disease occurrence. However, available evidence suggests that many subjects who regularly drink coffee are also smokers. In reality, smoking is the true risk factor of heart diseases development, but if the results of the study would not be adjusted for a potential confounder this may lead to significant bias – and the effect of coffee consumption on the occurrence of the heart diseases would be overestimated.
Примечание: представим, что по результатам некоторого статистического анализа чрезмерное употребление кофе является достоверным фактором риска сердечно-сосудистых заболеваний (ССЗ). При этом известно, что многие люди, регулярно употребляющие кофе, также являются курильщиками. Курение – один из истинных факторов риска ССЗ. Таким образом, если при статистическом анализе не сделать поправку на курение (стандартизацию по курению), можно допустить систематическую ошибку и влияние употребления кофе на развитие ССЗ будет переоценено.
Систематическая ошибка отбора – ошибка, вызванная различиями в исходных характеристиках участников сравниваемых групп. Такие различия между группами (речь не идет об изучаемом факторе или вмешательстве) могут существенно влиять на результаты исследования. Систематическую ошибку отбора можно избежать с помощью случайного распределения участников между группами воздействия и контроля (рандомизации).
Систематическая ошибка проведения исследования обусловлена различиями в уходе, оказываемом участникам исследования, за исключением сравниваемых методов лечения.
Систематическая ошибка измерения возникает из-за ошибок в измерении количественных признаков, например показателей биохимического анализа крови.
Систематическая ошибка памяти характерна для ретроспективных исследований и появляется вследствие неточных или неполных воспоминаний участников о прошлых событиях.
Систематическая ошибка наблюдателя возникает в тех случаях, когда исследователь знает, какая группа является экспериментальной, а какая – контрольной. В этом случае исследователь может придавать чрезмерное значение изменениям, которые он ожидает получить, и не замечать изменения, которые он не ожидает. Систематическую ошибку наблюдателя можно ограничить маскированием («двойным ослеплением»), при котором о характере проводимого вмешательства не будет знать ни исследователь, ни участник.
Систематическая ошибка информации – это погрешность в измерении воздействия или исхода, связанная, например, с неверным распределением участников на группы «случай» (заболевание) и «контроль» (без заболевания). Попадание участников с заболеванием в группу контроля может отразиться на характеристиках диагностического теста (например, чувствительности и специфичности).
Систематическая ошибка времени возникает при установлении неверной последовательности событий и приводит к ложному заключению о причинно-следственной связи. Данный вид ошибок преимущественно встречается в ретроспективных исследованиях.
Систематическая ошибка выбывания возникает, когда участники не доходят до конца исследования. Выбывание любого числа участников из экспериментальной или контрольной групп может менять их характеристики. Schulz и Grimes [5] считают, что потеря из исследования 5% участников не приводит к систематической ошибке, 5–20% – может стать причиной смещения результатов, а более 20% участников – сопряжено с высокой вероятностью систематической ошибки.
Систематическая ошибка публикации возникает в том случае, когда решение о публикации исследования принимается исходя из результатов работы. Например, исследования, содержащие статистически значимые результаты, имеют большие шансы быть опубликованными, чем исследования без них.
КЛАССИФИКАЦИЯ НАУЧНЫХ ИССЛЕДОВАНИЙ
Существуют различные классификации научных исследований в зависимости от способа сбора данных, цели (описательные и аналитические), наличия причинно-следственной связи между фактором и исходом и др. (рис. 2).
FIG. 2. Classification of study design in medicine.
РИС. 2. Классификация медицинских исследований.
Фундаментальные исследования
Фундаментальные (экспериментальные) исследования – это исследования, которые раскрывают причинно-следственные связи между изменением независимой переменной и ее влиянием на зависимую переменную в строго контролируемых условиях. Они применяются в разработке и совершенствовании аналитических процедур, включая биохимические и генетические тесты, методы инструментальной диагностики и статистического анализа. Фундаментальные исследования также включают эксперименты на животных, исследования клеточных культур, генетические, биохимические, фармакологические и физиологические эксперименты (см. пример [6] в таблице 1). При проведении фундаментальных исследований необходимо точно определить их условия, включая вид экспериментальных животных, количество животных в каждой группе, дозу тестируемого лекарственного препарата и т. д. [7]. Это позволит устранить влияние конфаундеров, повысить внутреннюю валидность исследования и снизить риск систематических ошибок. Однако внешняя валидность таких исследований (возможность обобщить выявленную связь на клинические ситуации) зачастую ограничена. Для проведения и представления результатов фундаментальных исследований с участием животных разработан ряд рекомендаций, одной из которых является руководство ARRIVE (Animal Research: Reporting Of In Vivo Experiments, исследования на животных: отчетность об экспериментах in vivo)1 [8].
Наблюдательные исследования
В ходе наблюдательных исследований исследователь никак не вмешивается в ход событий и не влияет на участников и изучаемые факторы. При этом результаты таких исследований, в отличие от фундаментальных, ближе к условиям реальной клинической практики. Наблюдательные исследования могут быть описательными и аналитическими. Описательные исследования представляют собой наблюдения отдельных клинических случаев или когорты, а аналитические – изучение взаимосвязи между фактором и исходом (рис. 1). В большинстве случаев в наблюдательных исследованиях используются описательные и аналитические приемы одновременно. К этому типу исследований относятся: описание клинического случая или серии, исследование «случай-контроль», а также поперечные, когортные и экологические исследования.
Описание клинического случая или серии случаев
Описание клинического случая используется для представления редких клинических наблюдений отдельного пациента (см. пример [9] в табл. 1) или серии случаев (см. пример [10] в табл. 1). Данные исследования являются наиболее простыми, поскольку не требуют наличия контрольной группы, вместе с этим они должны содержать четкую и подробную информацию о течении заболевания каждого пациента, чтобы читатели могли применить представленный опыт в своей практике. При описании серии случаев характеристики всех пациентов должны быть представлены одинаковым образом, для анализа используются методы дескриптивной (описательной) статистики с представлением дискретных данных (например, «есть» или «нет» признак) в виде абсолютного числа и доли от общего числа) и непрерывных данных (например, показатель систолического артериального давления или уровня креатинина в сыворотке крови) в виде среднего значения со стандартным отклонением или медианы с интерквартильным размахом.
Таблица 1. Примеры различных дизайнов исследований в опубликованных статьях (полные тексты всех статей были в открытом доступе на момент подачи рукописи)
Table 1. Examples of different study designs in the published articles (free full text was available for all articles at the time of manuscript submission)
Дизайн исследования |
Публикация |
Результаты |
Фундаментальное |
Krieger N.S. et al. [6] |
У растущих мышей c отсутствием протон-чувствительных рецепторов рака яичников OGR1 наблюдалось более быстрое формирование и резорбция костной ткани, чем у мышей с диким типом OGR1. Результаты работы свидетельствуют о роли OGR1 в костеобразовании в условиях ацидоза |
Описание клинического случая |
Shaigany S. et al. [9] |
Авторы представили первый клинический случай Кавасаки-подобного мультисистемного воспалительного синдрома, ассоциированного с COVID-19, у взрослого пациента мужского пола, который ранее был описан только у детей |
Описание серии клинических случаев |
Centers for Disease Control and Prevention [10] |
Опубликована серия случаев пневмоцистной пневмонии у прежде здоровых гомосексуальных мужчин. В этой работе содержится первое официальное упоминании о заболевании, получившем позже название ВИЧ-инфекция/СПИД |
Поперечное |
Mokdad A.H. et al. [12] |
В данном поперечном исследовании, проведенном с помощью телефонного интервьюирования, была продемонстрирована высокая распространенность ожирения и сахарного диабета среди взрослых людей, проживающих в США. Была обнаружена устойчивая связь между ожирением и наличием сахарного диабета, артериальной гипертензии, гиперлипидемии и другими значимыми факторами риска |
Экологическое |
Shaposhnikov D. et al. [16] |
Авторы продемонстрировали влияние высокой температуры воздуха и его загрязнения на повышение уровня смертности, не обусловленной несчастными случаями, во время аномальной жары и лесных пожаров в Москве в 2010 году |
Случай-контроль |
D’Souza G. et al. [17] |
Сравнение 100 пациентов с впервые диагностированным раком ротоглотки с 200 пациентами без рака показало устойчивую связь между наличием вируса папилломы человека и развитием рака ротоглотки, независимо от других известных факторов риска |
Проспективное когортное |
Rico-Campà A. et al. [19] |
В исследовании с участием 19 899 человек, которые обследовались каждые два года в период с 1999 по 2014 г., было показано, что употребление ультраобработанных продуктов повышает риск смерти от всех причин |
Ретроспективное когортное |
De Blok C.J.M. et al. [20] |
В данном исследовании было показано, что риск развития рака молочной железы у трансгендерных женщин выше, |
Пред- и постэкспериментальное |
Chauhan K. et al. [21] |
В результате проведенного исследования наблюдалось повышение приверженности к гигиене рук студентов-медиков и улучшение их знаний по этой проблеме |
Нерандомизированное контролируемое |
Agusti A. et al. [22] |
По результатам исследования не получено данных об эффективности гидроксихлорохина в отношении элиминации вируса и регресса клинических симптомов у медицинских работников со среднетяжелой формой COVID-19 |
Рандомизированное контролируемое |
Wiviott S.D. et al. [23] |
У пациентов с сахарным диабетом 2-го типа, получавших ингибитор SGLT2 дапаглифлозин, частота серьезных побочных явлений со стороны сердечно-сосудистой системы была такой же, как и в контрольной группе, однако частота госпитализаций по поводу сердечной недостаточности – ниже |
Систематический обзор |
Coughlin S.S. et al. [25] |
Важное влияние на риск развития острого инфаркта миокарда и выживаемость оказывают такие социальные факторы, как материальное неблагополучие, статус иммигранта, отсутствие социальной поддержки и социальная изоляция |
Систематический обзор и метаанализ |
Wang B. et al. [26] |
По данным 42 исследований, наличие у пациентов с COVID-19 хронической болезни почек и развитие острого почечного повреждения статистически значимо повышает риск тяжелого течения инфекции и смерти |
Цель данных исследований – сформулировать гипотезу для планирования испытаний с более сложным дизайном, а также информировать профессиональное сообщество о новых заболеваниях. Данные исследования отличаются простотой, дешевизной и доступностью для выполнения в медицинских учреждениях, а также возможностью использовать ретроспективные данные. Их недостатком является отсутствие группы сравнения и систематическая ошибка отбора случаев, которые наиболее часто представляют собой наиболее типичные или наиболее атипичные примеры заболевания, что приводит к плохой обобщаемости результатов на общую популяцию (низкая внешняя валидность).
Для повышения точности, открытости (транспарентности) и практической значимости описаний клинических случаев и серии случаев разработано руководство CARE2 (CAse REports, описание случаев) [11].
Поперечные (одномоментные) исследования
Поперечные исследования (одномоментные, исследования распространенности) применяются для оценки распространенности заболеваний, факторов риска, исходов и других показателей в конкретной популяции в определенный момент времени (см. пример [12] в табл. 1). Распространенность интересующего события в данных исследованиях оценивается как отношение количества людей с данным событием (например, с хронической болезнью почек) в определенный момент времени к общему количеству людей в группе риска. Для проведения одномоментных исследований определяют исследуемую популяцию, создают из нее выборку и исследуют наличие или отсутствие в ней интересующего события. Выборка должна быть репрезентативной, то есть каждая комбинация лиц в общей популяции должна иметь равную вероятность быть выбранной для достижения адекватного представительства в исследуемой выборке. Для этого применяется рандомизация. Однако в некоторых случаях допускается создание «удобных выборок» из пациентов, с которыми легко связаться или вызвать на осмотр. Еще одно важное требование для одномоментных исследований заключается в необходимости точного и ясного определения исследуемого заболевания и методов его диагностики. Все пациенты должны быть обследованы по единому алгоритму с помощью опроса, изучения архивной электронной документации, инструментальной диагностики и т. д. Распространенность события в одномоментных исследованиях представляют в виде процента или числа выявленных случаев к общему числу человек (например, к 1000 или 100 000 человек) с 95% доверительным интервалом (ДИ).
Во многих случаях в поперечных исследованиях (опросах) также собираются данные о распространенности воздействия факторов, которые могут быть ассоциированы с исходом заболевания [13]. Например, путем обследования каждого участника можно изучить распространенность в выборке курения (фактор риска) и сердечно-сосудистых заболеваний (исход). В результате каждый человек из выборки попадет в одну из четырех групп: а) лица с фактором риска и исходом; б) лица с фактором риска, но без исхода; в) лица без фактора риска, но с исходом; г) лица без фактора риска и исхода. Распределение участников можно представить в четырехпольной таблице, в строках которой будет указано наличие или отсутствие фактора риска, а в столбцах – заболевания (или другого исхода) (табл. 2).
Таблица 2. Четырехпольная таблица
Table 2. 2×2 contingency table
Заболевание есть |
Заболевания нет |
Всего |
|
Фактор риска есть |
a |
b |
a + b |
Фактора риска нет |
c |
d |
c + d |
Всего |
a + c |
b + d |
N |
С помощью этих четырех переменных можно рассчитать значения следующих параметров:
- общее количество лиц с наличием фактора риска: a + b;
- общее количество лиц без фактора риска: c + d;
- общее количество лиц с заболеванием (исходом): a + c;
- общее количество лиц без заболевания (исхода): b + d;
- общее количество лиц в исследовании (N): a + b + c + d;
- распространенность заболевания среди лиц с фактором риска и без него: a/(a+b) и c/(c+d) соответственно;
- распространенность фактора риска среди лиц с заболеванием и без него: a/(a+c) и b/(b+b) соответственно.
Для того чтобы оценить влияние факторов риска на развитие заболевания (исхода) с помощью логистической регрессии, можно рассчитать отношение шансов (ОШ) или относительный риск (ОР) и 95% ДИ. Для вычисления ОШ и ОР используются статистические программы (R, SPSS и другие) и онлайн-калькуляторы3 4. Особенностям расчета этих показателей будет посвящен отдельный обзор.
Поперечные исследования широко применяются для планирования общественного здравоохранения, при анализе факторов риска распространенных заболеваний, а также разработке гипотез для последующих исследований. Однако они не предоставляют данных о причинно-следственных связях, а только описывают ассоциации. Поперечные исследования менее подвержены систематической ошибке по сравнению с описанием серии случаев. Кроме того, поперечные исследования проводятся на репрезентативных выборках, так как они отбираются из генеральной совокупности или другой изучаемой популяции (например, работники тяжелой промышленности). Однако в результате этого генерализация ограничивается выбранной популяцией, что приводит к систематической ошибке отбора.
Одним из важных недостатков таких исследований является невозможность определить последовательность событий (что появилось сначала – действие фактора риска или наблюдаемый исход) и сделать однозначный вывод о причинно-следственной связи между ними. Однако можно попробовать устранить этот недостаток, применяя опросник для сбора данных, в котором используется временнáя шкала для оценки фактора риска и исхода. К преимуществам данных исследований относятся сохранение исходного количества участников на протяжении всего наблюдения (что нехарактерно для продольных исследований), быстрота выполнения и относительно низкие затраты. Однако все это актуально только в отношении распространенных заболеваний.
Поперечные исследования не подходят для изучения редких заболеваний (их определение варьирует, по мировым данным составляя в среднем 40–50 случаев на 100 000 населения [14], по данным в России – 10 случаев на 100 000 населения5), поскольку это требует создания очень большой выборки, для таких заболеваний проводятся исследования «случай-контроль». Не подходят они и для изучения распространенных, но коротких по продолжительности заболеваний (например, инфекционных заболеваний дыхательных путей), так как их лучше всего характеризует показатель заболеваемости. Заболеваемость в поперечных случаях оценить невозможно, потому что они основаны на данных о существующих случаях и не включают данные о новых случаях заболеваний.
Более подробно с рекомендациями по проведению поперечных исследований можно ознакомиться в руководстве STROBE (The Strengthening the Reporting of Observational Studies in Epidemiology, укрепление отчетности в наблюдательных исследованиях в эпидемиологии)6 [15].
Экологические исследования
Экологические (корреляционные) исследования исследуют ассоциации между возникновением заболевания и воздействием потенциального фактора риска. Однако показатели заболеваемости и воздействия измеряются не у отдельных пациентов, а в нескольких популяциях или сообществах (см. пример [16] в таблице 1). Для анализа используются вторичные данные, полученные в популяционных исследованиях и статистических отчетах, поэтому экологические исследования характеризуются быстротой и простотой выполнения и возможностью включения больших выборок. Однако результаты таких исследований не предоставляют данных о воздействии фактора риска и исходе для отдельного человека. Это может привести к ошибке интерпретации, когда выводы, полученные на уровне совокупности людей, переносятся на индивидуальный уровень (экологическая ошибка). Кроме того, в экологических исследованиях практически невозможно контролировать действие конфаундеров и без дополнительных исследований доказать причинно-следственные связи между явлениями.
Исследования «случай-контроль»
Исследования «случай-контроль» проводятся для ретроспективного анализа пациентов с наличием или отсутствием определенного исхода (см. пример [17] в таблице 1). Лица с исходом образуют основную группу, а лица без исхода – контрольную (рис. 3). Основной принцип данных исследований заключается в сравнении двух групп и выявлении статистически значимых различий по частоте или выраженности потенциальных факторов риска. Для исключения влияния конфаундеров обе группы должны быть максимально сопоставимы по как можно большему количеству параметров за исключением исследуемых.
FIG. 3. Schematic diagram of a case-control study design.
РИС. 3. Схема исследования «случай-контроль».
Note: data analysis in case-control studies is usually performed in a similar way to cross-sectional surveys, where all subjects are divided into four groups depending on the presence of diseases (outcomes) and potential risk factors (see cross-sectional studies section). The association between risk factors and outcomes is represented by the odds ratio or relative risk with 95% confidence interval.
Примечание: в исследованиях «случай-контроль» (как и в одномоментных исследованиях) все участники распределяются по четырем группам в зависимости от наличия заболевания (исхода) и потенциального фактора риска (см. раздел «Одномоментные исследования»). Взаимосвязь между фактором риска и исходом выражается в виде ОШ или ОР с 95% ДИ.
Одна из проблем появления систематических ошибок в исследованиях «случай-контроль» – нерепрезентативность случаев. Такое происходит, например, когда в исследование включают госпитализированных пациентов, течение заболевания у которых отличается от проходящих лечение с аналогичным заболеванием в амбулаторных условиях. Другая проблема заключается в нерепрезентативности группы контроля, характеристики которой должны соответствовать характеристикам лиц без изучаемого исхода. В теории систематическую ошибку, связанную с данной проблемой, можно устранить с помощью рандомизации, однако на практике рандомизация не всегда осуществима. В некоторых случаях решить проблему нерепрезентативности можно путем включения участников, находящихся в одних и тех же условиях, в основную и контрольную группы. Например, если случаи выбираются среди пациентов, госпитализированных в больницу, контроли могут быть выбраны из пациентов, госпитализированных в ту же больницу по причинам, отличным от исследуемого исхода. Наконец, для обеих групп методы сбора данных должны быть идентичными, а определения понятий «исхода» и «факторов риска» ясными и точными.
Исследования «случай-контроль» не требуют большого числа наблюдений в отличие от других видов исследований, поэтому наиболее эффективны для изучения факторов риска редких заболеваний. Другой особенностью данных исследований является возможность оценить влияние на исход сразу нескольких факторов риска. Соблюдая основные правила проведения исследований «случай-контроль», можно избежать воздействия конфаундеров. Однако в реальной практике зачастую трудно получить полную и достоверную информацию о факторах риска за длительный период времени. Поэтому в данных исследованиях нередко возникают систематические ошибки памяти, выборки и другие, что может приводить к конфаундингу. Тем не менее хорошо спланированные исследования «случай-контроль» могут служить доказательством ассоциации между фактором риска и исходом. Кроме того, в исследованиях «случай-контроль» нельзя оценить распространенность заболевания, в отличие от одномоментных исследований. Рекомендации по проведению исследований «случай-контроль» приведены в руководстве STROBE [15].
Отдельным вариантом исследования «случай-контроль» является исследование методом вложенной выборки (nested case–control study, гнездовое исследование «случай-контроль»). Этот вид исследования проводится в рамках уже имеющегося когортного исследования (см. раздел «Когортные исследования»), что позволяет экономить время и материальные ресурсы, используя ранее собранные данные.
Другой вид исследований с дизайном, подобным «случай-контроль», – изучение диагностической точности, в котором эффективность нового метода диагностики сравнивается с общепризнанным «золотым стандартом». Рекомендации по проведению и описанию исследований по оценке диагностической точности приведены в руководстве STARD7 (STAndards for Reporting Diagnostic Accuracy, стандарты отчетности о точности диагностики) [18].
Когортные исследования
Когорта представляет собой группу лиц, объединенных некоторыми общими признаками, факторами риска или исходами. В когортных исследованиях отбирают участников на основе статуса воздействия на них фактора риска в настоящий момент и наблюдают за развитием в ней исходов в течение определенного времени (проспективное исследование) либо используют данные, созданные до развития исхода (ретроспективное исследование) (см. примеры [19, 20] в таблице 1). Таким образом, когортные исследования позволяют проследить влияние потенциального фактора риска на развитие заболевания или другого исхода. В отличие от исследований «случай-контроль», в когортных исследованиях распределение участников по группам происходит в зависимости от наличия воздействующего фактора, а не исхода (рис. 4).
FIG. 4. Schematic diagram of a prospective cohort study design.
РИС. 4. Схема проспективного когортного исследования.
Проспективное когортное исследование является золотым стандартом наблюдательных исследований. Как и в других типах исследований, в нем необходимо ясно и точно обозначить факторы риска и исходы и однотипно изучить их наличие у всех испытуемых. Кроме того, отобранная когорта должна быть репрезентативной. Одним из недостатков когортных исследований является их продолжительность: изучаемые заболевания могут развиваться годами и десятилетиями, а критерии для их диагностики со временем могут измениться. Другой недостаток, который может привести к систематической ошибке, заключается в не изменяющемся воздействии фактора риска в исследовании, что противоречит реальной действительности. Например, уровень холестерина в крови, артериального давления, статус курения являются динамическими показателями и требуют поправки, чтобы не допустить систематической ошибки.
Ретроспективные (исторические) когортные исследования могут быть выполнены, если имеется доступ к подробной и надежной медицинской документации больших групп людей. В этом случае течение заболевания от воздействия фактора риска до исхода может быть изучено в одно и то же время. Однако при проведении таких исследований есть высокий риск систематической ошибки информации, связанной с неточностями в архивных данных.
Взаимосвязь между фактором риска и исходом можно оценить с помощью построения четырехпольной таблицы и расчета ОШ или ОР. В когортных исследованиях известно точное время возникновения исхода в каждом конкретном наблюдении, что позволяет рассчитать не только распространенность заболевания, но и заболеваемость и отношение рисков (hazard ratio) с 95% ДИ. Последние два показателя в исследованиях «случай-контроль» не рассчитываются. Преимуществами когортных исследований является то, что они менее подвержены систематическим ошибкам, а также дают возможность за одно исследование проследить взаимосвязь множества факторов риска и исходов. Однако проспективные когортные исследования являются дорогостоящими и трудоемкими. Такие исследования не подходят для изучения редких заболеваний, но могут применяться для анализа воздействия на исход нечастых факторов. Рекомендации по описанию когортных исследований приведены в руководстве STROBE [15].
Экспериментальные исследования
В экспериментальных (интервенционных) исследованиях проводится сравнение экспериментальной группы, участникам которой назначают определенное лечение (или иное вмешательство) с контролем, получающим другое лечение или плацебо. Данные исследования применяются для выявления причинно-следственной связи между явлениями. Иногда при описании таких исследований используют термин «испытание». Среди экспериментальных исследований выделяют пред- и постэкспериментальные, нерандомизированные контролируемые и рандомизированные контролируемые исследования. Рекомендации по дизайну, проведению, анализу и оценке клинических (интервенционных) исследований приведены в руководстве ICH (The International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use, Международный совет по гармонизации технических требований к фармацевтическим препаратам для человека)8.
Пред- и постэкспериментальные исследования (исследования с самоконтролем, исследования до и после)
В пред- и постэкспериментальных исследованиях изучается развитие исхода до и после вмешательства (см. пример [21] в таблице 1). Такие исследования включают всего одну группу пациентов, в которой исход оценивается до и после вмешательства. Таким образом, исследуемая группа является одновременно и экспериментальной, и контрольной. Целью пред- и постэкспериментальных исследований является сравнить качественные и количественные признаки в группе до и после вмешательства и сделать вывод о причинно-следственной связи между вмешательством и исходом. Однако в таких исследованиях невозможно контролировать другие факторы, которые могут влиять на результат и в то же время непредсказуемо изменяться.
Нерандомизированные контролируемые исследования (НКИ)
В НКИ сравнивают исходы пациентов экспериментальной группы, которые получали изучаемое вмешательство, с исходами контролей, которым вмешательство не проводилось (см. пример [22] в таблице 1). При этом распределение участников по группам происходит по воле исследователя или самого участника, то есть без рандомизации. НКИ достаточно просты в проведении и позволяют выявить причинно-следственную связь между вмешательством и исходом. Однако в связи с отсутствием рандомизации такие исследования подвержены различным систематическим ошибкам.
Рандомизированные контролируемые исследования (РКИ)
При проведении РКИ однородную группу участников распределяют по двум отдельным группам случайным образом (рандомно). Участникам одной группы проводится исследуемое вмешательство, после чего исходы обеих групп сравниваются между собой (см. пример [23] в таблице 1). Одним из важных условий для получения достоверных результатов является качественная рандомизация. Теоретически сравниваемые группы должны быть максимально сопоставимы по всем потенциальным конфаундерам (возраст, пол, сопутствующая терапия, тяжесть и длительность заболевания и т. д.) за исключением изучаемого вмешательства. Однако на практике обеспечить такую сопоставимость довольно сложно.
К другим методам, позволяющим наряду с рандомизацией повысить качество РКИ, относятся следующие: сокрытие распределения, процедура маскирования («ослепление»), анализ «по намерению лечить» (проводится из допущения, что все пациенты получили лечение в соответствии с распределением в группы), одновременное обследование обеих групп и т. д. РКИ являются довольно затратными по финансовым, временным ресурсам и требуют значительного количества квалифицированных исследователей. Однако именно РКИ (при надлежащем проведении) имеют наивысшую доказательную способность и являются «золотым стандартом» клинических исследований, направленных на выявление причинно-следственной связи. С рекомендациями по проведению РКИ можно ознакомиться в руководствах CONSORT9 (CONsolidated Standards of Reporting Trials, сводные стандарты отчетности об испытаниях) и SPIRIT10 (Standard Protocol Items: Recommendations for Interventional Trials, стандартные элементы протокола: Рекомендации по интервенционным испытаниям) [24].
Систематический обзор и метаанализ
Как правило, с течением времени проводится несколько когортных исследований и РКИ, посвященных одной и той же проблеме, но в разных условиях и с разными результатами. Систематические обзоры направлены на оценку и анализ результатов всех опубликованных исследований по определенной проблеме (см. пример [25] в таблице 1). В отличие от традиционного обзора литературы, в который авторы могут выборочно, на свое усмотрение отбирать публикации, систематический обзор должен включать все опубликованные по данной теме исследования надлежащего качества. В некоторых случаях результаты отдельных исследований объединяют с помощью статистических методов и проводят метаанализ (см. пример [26] в таблице 1). В настоящее время систематический обзор и метаанализ занимают самый высокий уровень доказательств в иерархии клинических исследований. Методология проведения систематического обзора и метаанализа приведена в руководстве PRISMA11 (Preferred Reporting Items for Systematic reviews and Meta-Analysis, Предпочтительные пункты отчетности для систематических обзоров и метаанализов) [27].
ОПИСАНИЕ РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКОГО АНАЛИЗА
Результаты исследований в зависимости от дизайна могут быть представлены непрерывными двоичными данными, частотой наступления событий, выживаемостью. статистические методы анализа, которые используют для описания и сравнения результатов исследований [28], будут обсуждаться в следующих обзорах.
ВЫБОР ДИЗАЙНА ИССЛЕДОВАНИЯ
Для выбора подходящего дизайна исследования необходимо определить цель и задачи исследования, сформулировать гипотезу, проанализировать опубликованные данные в выбранной научной области, оценить ресурсы, доступные исследовательской группе, а также их собственный опыт и знания. лучше провести простое, но качественное исследование, тщательно спланировав его дизайн, чем взяться за сложное и, не уделив достаточно усилий для его планирования и проведения, получить недостоверные результаты. в таблице 3 представлены основные характеристики разных видов исследований в зависимости от их целей и задач.
Таблица 3. Выбор дизайна исследования в зависимости от цели и задач
Table 3. Preferred types of study design for different objectives
Экологическое |
Поперечное |
«Случай-контроль» |
Когортное |
Экспериментальное |
|
Исследование редких заболеваний |
+ |
− |
+ |
− |
− |
Исследование редких факторов риска |
+/− |
− |
+/− |
+ |
− |
Исследование множественных эффектов воздействия |
+/− |
+/− |
− |
+ |
− |
Исследование нескольких воздействий |
+/− |
+/− |
+ |
+ |
− |
Оценка распространенности |
− |
+ |
− |
+ |
− |
Оценка заболеваемости |
− |
− |
+/− |
+ |
− |
Исследование изменений показателей во времени |
− |
− |
+/− |
+ |
− |
Исследование результатов вмешательства |
− |
− |
− |
− |
+ |
Note: + preferred, +/- possible, but less suitable, – unsuitable.
Для каждого вида исследования характерны свои недостатки и варианты систематических ошибок, которые нужно учитывать при планировании исследования (табл. 4) [29]. Одним из основных этапов планирования исследования является расчет размера выборки, который помогает избежать систематических ошибок, получить статистически и клинически значимые результаты и оптимизировать использование ресурсов. слишком маленький размер выборки может стать причиной статистически незначимых результатов (при наличии таких различий в действительности). Слишком большой размер выборки может повлечь значительные финансовые расходы, нецелесообразное проведение вмешательства некоторым участникам и получение статистически значимых, но не имеющих клинического значения результатов. существуют различные подходы к расчету размера выборки в зависимости от типа исхода. Для этого используются различные пакеты статистических программ (например, r) или онлайн-калькуляторы12 13.
Таблица 4. Частота систематических ошибок и прочих затруднений при проведении различных видов исследований
Table 4. Probability of bias and limitations in different types of studies
Экологические |
Поперечные |
«Случай-контроль» |
Когортные |
|
Систематическая ошибка отбора |
n/a |
M |
H |
L |
Систематическая ошибка памяти |
n/a |
H |
H |
L |
Выбывание из исследования |
n/a |
n/a |
L |
H |
Конфаундинг |
H |
M |
M |
M |
Временные затраты |
L |
M |
M |
H |
Финансовые затраты |
L |
M |
M |
H |
Note: H – High, L – Low, М – Medium, n/a – not available.
Необходимо заранее составить план исследования, так называемый «протокол исследования» с подробным описанием цели и задач, этических аспектов и дизайна исследования, критериев включения и исключения, изучаемых исходов, методов статистической обработки результатов. протоколы клинических исследований с участием людей должны быть зарегистрированы до получения результатов в реестре клинических испытаний, таких как clinicaltrials.gov14 или международной платформе реестров клинических испытаний воз (who international clinical trials registry platform)15. С помощью данных реестров каждый может получить всю интересующую информацию об исследованиях. такой подход способствует прозрачности клинических исследований, и многие медицинские журналы настоятельно рекомендуют указывать регистрационный номер исследования в рукописи.
ЗАКЛЮЧЕНИЕ
Выбор дизайна является важным этапом и требует тщательного подхода, так как от него зависит качество исследования и достоверность его результатов. Разные виды наблюдательных и экспериментальных исследований преследуют разные цели и задачи, поэтому перед проведением исследования необходимо дать точное определение изучаемым факторам риска и исходам. Для того чтобы избежать систематических ошибок исследуемые выборки должны обладать репрезентативностью и надлежащим размером. С целью повышения качества исследований в медицине и уменьшения вероятности систематических ошибок разработаны различные руководства по их проведению и описанию.
1. https://arriveguidelines.org/
2. https://www.care-statement.org/
3. https://www.medcalc.org/calc/odds_ratio.php
4. https://medstatistic.ru/calculators/calcrisk.html
5. https://minzdrav.gov.ru/documents/7025-federalnyy-zakon-323-fz-ot-21-noyabrya-2011-g
6. https://www.strobe-statement.org/
7. https://www.equator-network.org/reporting-guidelines/stard/
8. https://www.ema.europa.eu/en/ich-e9-statistical-principles-clinical-trials
9. https://www.equator-network.org/reporting-guidelines/consort/
10. https://www.spirit-statement.org/
11. https://www.equator-network.org/reporting-guidelines/prisma/
12. https://www.stat.ubc.ca/~rollin/stats/ssize/index.html
13. https://medstatistic.ru/calculators/calcsize.html
14. https://www.clinicaltrials.gov/
Список литературы
1. Süt N. How can we improve the quality of scientific research and publications? Guidelines for authors, editors, and reviewers. Balkan Med J. 2013; 30(2): 134–135. https://doi.org/10.5152/balkanmedj.2013.009 PMID: 25207088
2. Dhammi I.K., Rehan-Ul-Haq. Rejection of manuscripts: Problems and solutions. Indian J Orthop. 2018; 52(2): 97–99. https://doi.org/10.4103/ortho.IJOrtho_68_18 PMID: 29576635
3. Farrugia P., Petrisor B.A., Farrokhyar F., Bhandari M. Research questions, hypotheses and objectives. Can J Surg. 2010; 53(4): 278–281. PMID: 20646403
4. Smith J., Noble H. Bias in research. Evid Based Nurs. 2014; 17(4): 100–101. https://doi.org/10.1136/eb-2014-101946 PMID: 25097234
5. Schulz K.F., Grimes D.A. Sample size slippages in randomised trials: Exclusions and the lost and wayward. Lancet. 2002; 359(9308): 781–785. https://doi.org/10.1016/S0140-6736(02)07882-0 PMID: 11888606
6. Krieger N.S., Yao Z., Kyker-Snowman K., et al. Increased bone density in mice lacking the proton receptor OGR1. Kidney Int. 2016; 89(3): 565–573. https://doi.org/10.1016/j.kint.2015.12.020 PMID: 26880453
7. Röhrig B., Du Prel J.B., Wachtlin D., Blettner M. Types of study in medical research – Part 3 of a Series on Evaluation of Scientific Publications. Dtsch Arztebl Int. 2009; 106(15): 262–268. https://doi.org/10.3238/arztebl.2009.0262 PMID: 19547627
8. Du Sert N.P., Ahluwalia A., Alam S., et al. Reporting animal research: Explanation and elaboration for the arrive guidelines 2.0. PLoS Biol. 2020; 18(7): e3000411. https://doi.org/10.1371/journal.pbio.3000411 PMID: 32663221
9. Shaigany S., Gnirke M., Guttmann A., et al. An adult with Kawasaki-like multisystem inflammatory syndrome associated with COVID-19. Lancet. 2020; 396(10246): e8–10. https://doi.org/10.1016/S0140-6736(20)31526-9 PMID: 32659211
10. Centers for Disease Control. Pneumocystis Pneumonia – Los Angeles. Morb Mortal Wkly Rep. 1981; 30(21): 250–252. PMID: 6265753
11. Riley D.S., Barber M.S., Kienle G.S., et al. CARE guidelines for case reports: explanation and elaboration document. J Clin Epidemiol. 2017; 89: 218–235. https://doi.org/10.1016/j.jclinepi.2017.04.026 PMID: 28529185
12. Mokdad A.H., Ford E.S., Bowman B.A., et al. Prevalence of obesity, diabetes, and obesity-related health risk factors, 2001. JAMA. 2003; 289(1): 76–79. https://doi.org/10.1001/jama.289.1.76 PMID: 12503980
13. Setia M.S. Methodology series module 3: Cross-sectional studies. Indian J Dermatol. 2016; 61(3): 261–264. https://doi.org/10.4103/0019-5154.182410 PMID: 27293245
14. Richter T., Nestler-Parr S., Babela R., et al. Rare disease terminology and definitions-a systematic global review: report of the ISPOR rare disease special interest group. Value Heal. 2015; 18(6): 906–914. https://doi.org/10.1016/j.jval.2015.05.008 PMID: 26409619
15. Von Elm E., Altman D.G., Egger M., et al. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: Guidelines for reporting observational studies. PLoS Med. 2007; 4(10): 1623–1627. https://doi.org/10.1371/journal.pmed.0040296 PMID: 17941714
16. Shaposhnikov D., Revich B., Bellander T., et al. Mortality related to air pollution with the Moscow heat wave and wildfire of 2010. Epidemiology. 2014; 25(3): 359–364. https://doi.org/10.1097/EDE.0000000000000090 PMID: 24598414
17. D’Souza G., Kreimer A.R., Viscidi R., et al. Case–control study of human papillomavirus and oropharyngeal cancer. N Engl J Med. 2007; 356(19): 1944–1956. https://doi.org/10.1056/NEJMoa065497 PMID: 17494927
18. Bossuyt P.M., Reitsma J.B., Bruns D.E., et al. STARD 2015: An updated list of essential items for reporting diagnostic accuracy studies. BMJ. 2015; 351: h5527. https://doi.org/10.1136/bmj.h5527 PMID: 26511519
19. Rico-Campà A., Martínez-González M.A., Alvarez-Alvarez I., et al. Association between consumption of ultra-processed foods and all cause mortality: SUN prospective cohort study. BMJ. 2019; 365: l1949. https://doi.org/10.1136/bmj.l1949 PMID: 31142450
20. De Blok C.J.M., Wiepjes C.M., Nota N.M., et al. Breast cancer risk in transgender people receiving hormone treatment: Nationwide cohort study in the Netherlands. BMJ. 2019; 365: l1652. https://doi.org/10.1136/bmj.l1652 PMID: 31088823
21. Chauhan K., Pandey A., Thakuria B. Hand hygiene: An educational intervention targeting grass root level. J Infect Public Health. 2019; 12(3): 419–423. https://doi.org/10.1016/j.jiph.2018.12.014 PMID: 30679038
22. Agusti A., Guillen E., Ayora A., et al. Efficacy and safety of hydroxychloroquine in healthcare professionals with mild SARS-CoV-2 infection: Prospective, non-randomized trial. Enferm Infecc Microbiol Clin. 2020; S0213-005X(20)30413-4. https://doi.org/10.1016/j.eimc.2020.10.023 PMID: 33413989
23. Wiviott S.D., Raz I., Bonaca M.P., et al. Dapagliflozin and cardiovascular outcomes in type 2 diabetes. N Engl J Med. 2019; 380(4): 347–357. https://doi.org/10.1056/NEJMoa1812389 PMID: 30415602
24. Moher D., Hopewell S., Schulz K.F., et al. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. BMJ. 2010; 340: c869. https://doi.org/10.1136/bmj.c869 PMID: 20332511
25. Coughlin S.S., Young L. Social determinants of myocardial infarction risk and survival: A systematic review. Eur J Cardiovasc Res. 2020; 1(1): 1–12. https://doi.org/10.31487/j.ejcr.2020.01.02 PMID: 33089252
26. Wang B., Luo Q., Zhang W., et al. The involvement of chronic kidney disease and acute kidney injury in disease severity and mortality in patients with COVID-19: A meta-analysis. Kidney Blood Press Res. 2021; 46(1): 17–30. https://doi.org/10.1159/000512211 PMID: 33352576
27. Moher D., Liberati A., Tetzlaff J., et al. Preferred reporting items for systematic reviews and meta-analyses: The PRISMA statement. PLoS Med. 2009; 6(7): e1000097. https://doi.org/10.1371/journal.pmed.1000097 PMID: 19621072
28. Kirkwood B., Stern J. Essential Medical Statistics. 2nd ed. Blackwell Publishing; 2003; 512 p.
29. Gallin J., Ognibene F., Johnson L. Principles and practice of clinical research. 4th ed. Elsevier; 2017; 824 p. eBook
Об авторах
Н. М. БулановРоссия
Буланов Николай Михайлович, канд. мед. наук, доцент кафедры внутренних, профессиональных болезней и ревматологии
ул. Трубецкая, д. 8, стр. 2, г. Москва, 119991
О. Б. Блюсс
Великобритания
Блюсс Олег Борисович, канд. физ.-мат. наук, доцент кафедры педиатрии и детских инфекционных болезней; старший преподаватель
Колледж Лейн, Хатфилд, AL10 9AB
Д. Б. Мунблит
Великобритания
Мунблит Даниил Борисович, PhD, профессор кафедры педиатрии и детских инфекционных болезней; Почетный старший преподаватель, Секция воспаления, регенерации и развития, Национальный институт сердца и легких, Медицинский факультет
Эксибишн роуд, Южный Кенсингтон, Лондон, SW7 2BU
Н. А. Неклюдов
Россия
Неклюдов Никита Андреевич, студент клинического института детского здоровья им. Н.Ф. Филатова
ул. Трубецкая, д. 8, стр. 2, г. Москва, 119991
Д. В. Бутнару
Россия
Бутнару Денис Викторович, канд. мед. наук, проректор по научной работе
ул. Трубецкая, д. 8, стр. 2, г. Москва, 119991
Х. Б. Кодзоева
Россия
Кодзоева Хава Багаудиновна, аспирант кафедры пропедевтики внутренних болезней, гастроэнтерологии и гепатологии
ул. Трубецкая, д. 8, стр. 2, г. Москва, 119991
М. Ю. Надинская
Россия
Надинская Мария Юрьевна, канд. мед. наук, доцент кафедры пропедевтики внутренних болезней, гастроэнтерологии и гепатологии
ул. Трубецкая, д. 8, стр. 2, г. Москва, 119991
А. А. Заикин
Великобритания
Заикин Алексей Анатольевич, канд. физ.-мат. наук, заместитель директора Центра анализа сложных систем; профессор системной медицины, Институт женского здоровья и кафедра математики
Гоуэр стрит, Лондон, WC1E 6BT