Классификация возрастов: Классификация возрастов воз \ Акты, образцы, формы, договоры \ Консультант Плюс

Содержание

Как «взрослела» молодежь?

Молодежная политика является важной составляющей социальной политики любого государства, можно сказать, это ее лакмусовая бумажка. В 2020 году возраст молодежи в России  был поднят с 30 до 35 лет. Зачем? В вопросе разбиралась редакция «Дума ТВ». 

О молодежи замолвите слово

Принятым в конце прошлого года законом на государственном уровне определяются следующие понятия – «молодежь», «молодая семья», «молодежная политика» и соответствующие общественные объединения и так далее. К молодежи относятся все граждане России от 14 до 35 лет, которым доступны такие привилегии, как поддержка талантов, субсидии и выплаты.

 Власти взяли, и дали право еще 12,7 млн человек иметь возможность  на многие «плюшки» в целях развития потенциала молодых людей, а значит и страны в целом, ведь главное достояние России – это человек, не устает напоминать Президент РФ Владимир Путин. 

Парламентарии в ходе рассмотрения документа в Госдуме отмечали, что данный закон необходим, в первую очередь, молодым семьям. При рождении ребенка теперь родителям в возрасте до 35 лет включительно выплачивается единовременное пособие. 

 В основе закона лежит самореализация молодежи в самых разных сферах – от волонтерской деятельности и спорта до развития института наставничества и поддержки детей-сирот. 

Кроме того, данный закон наконец упорядочил трактовки на всероссийском уровне: ранее в закон о молодежной политике действовал в каждом регионе автономно. Понятное дело, что это сказывалось на самом регулировании молодежной политики в стране. 

«В каждом регионе были приняты свои региональные законы, и это очень мешало, потому что у нас молодежь не очень любит сидеть на одном месте и переезжает в другие регионы. Где-то — одна возрастная группа, где-то — другая, когда молодые ребята хотят пойти в банк и получить деньги опять же по программе «Молодая семья». Из-за этого и возникают трудности»,

отметил глава Комитета по физической культуре, спорту, туризму и делам молодежи Борис Пайкин.

Сегодня в субъектах РФ приводят местное законодательство в порядок. 

«Есть ряд регионов, где работа идет, но большинство уже перешло на эту систему и мы видим, что уже отклики положительные»,

подчеркнул Борис Пайкин. 

 

Социальная зрелость

Вообще «взросление» молодежи наблюдается на протяжении всей истории. Вспомним, к примеру, литературу «Золотого века», когда женщины-мужчины в 30 лет считались не просто взрослыми, а, скажем так, на последней стадии зрелости. А что же сегодня? А сегодня, если попробовать назвать молодую женщину 35 лет не девушкой, а именно женщиной, есть риск обидеть человека. 

Так что же это? Воспитание общества инфантильного или же следование требованиям современности? Отметим, что, к примеру, в XVIII веке средняя продолжительность жизни составляла 34 года, сегодня же, как минимум, увеличилась вдвое. 

«За счет чего она увеличилась? За счет времени старости, за счет времени молодости, за счет времени младенчества, потому что у нас есть период биологического взросления, с точки зрения физиологии и психологии, время взросления заканчивается в 23 года. То есть к этому времени человек созревает полностью до биологической единицы: мозг и нервная система заканчивают развитие»,

отметил социальный психолог Александр Шахов. 

 

Александр Шахов согласен с решением повысить возраст молодежи до 35 лет. 

«Время для молодости должно быть увеличено, и ничего страшного в этом нет. Когда мы говорим про инфантилизм, то мы говорим не про возрастные вещи, мы говорим не про возрастной момент, а про зрелость личности – насколько она готова социализироваться и принимать социальную ответственность»,

подчеркнул эксперт. 

 

Кроме того он отметил, что современная молодежь чаще всего экономически независима от родителей и стремится к саморазвитию.

«Финансовая независимость сейчас достигается намного раньше, чем в предыдущих периодах жизни. Например, в советское время способом достижения независимости был только один — это отучится и пойти работать, а сейчас у молодежи есть возможность пойти работать и 14, и в 16 лет: у геймеров на стримах, у блогерах на ведение блогов и социальных сетей»,

добавил он.

 

По мнению Александра Шахова, молодые люди сейчас наиболее осознанно подходят к созданию семьи. 

«Сейчас молодому человеку предоставляется возможность найти себя в жизни, найти ту профессию, который бы он с удовольствием занимался и реализовать свои таланты. Это позитивно как для личности, так и для общества в целом»,

уверен эксперт.

 

Надо сказать, что повышение возраста для молодежи – практика не только российская. Всемирная организация здравоохранения также обновила классификацию возрастов. Обновлённая классификация возрастов: в 18-44 человек теперь считается молодежью, в 45-59 – среднего возраста, в 60-74 – пожилым, в 75-90 – стариком, а если ему больше 90 лет, то это наступил период долголетия.

Врач гериатр — кто это и зачем к нему обращаться

Гериатрия — частный раздел геронтологии (науки, изучающей все аспекты старения человека), занимающийся изучением, профилактикой и лечением болезней старческого возраста.

Гериатр — это медицинский специалист, в сферу деятельности которого входит оказание помощи пожилым и старым людям. Она заключается в диагностике, лечении и предупреждении заболеваний с учетом особенностей преклонного возраста. Гериатрия, как медицинская специальность направлена на сохранение и укрепление здоровья пожилых людей с учетом специфики их возраста, а также на увеличение продолжительности и улучшение качества их жизни.

Любая болезнь может протекать по разному в зависимости от возраста пациента. К тому же, большинство лекарственных препаратов тестируется на людях молодого и среднего возраста и, соответственно, лучше им подходят, а у пожилых пациентов могут появляться нежелательные побочные эффекты. Гериатр способен оценить целесообразность назначения того или иного препарата и определить дозировку с учетом возрастной специфики. Кроме того, у пожилых людей может быть одновременно сразу несколько болезней, приобретенных в разные периоды жизни, в среднем от 5 до 8, иногда даже больше. Помимо этого, есть ещё и проявления самого процесса старения организма, так называемые гериатрические синдромы. Самые распространённые выражаются в снижении памяти и уменьшении мышечной массы. Из-за этого существуют особенности в назначении лекарственных препаратов и применении методов лечения. Поэтому людям в преклонном возрасте лучше обращаться к гериатру, который разработает наиболее подходящий план обследования и тактику излечения больного с учетом всех возрастных изменений.

Прежде всего гериатр должен определить стратегию лечения: какие болезни надо лечить в первую очередь, какие — во вторую, а какие не надо лечить вообще. Если их много, то назначать терапию от всех заболеваний сразу может быть даже опасно. Это способно снизить качество жизни и ухудшить прогноз. Гериатр также владеет методиками оценки общего состояния пациента — насколько он активен и самостоятелен.

Какие болезни лечит врач гериатр

Гериатр лечит любые возрастные заболевания, но прежде всего он лечит не отдельную болезнь, а решает комплекс проблем со здоровьем, связанных с возрастными изменениями организма. Самыми распространенными болезнями, связанными со старением, являются атеросклероз и сердечно-сосудистые заболевания, рак, артрит, остеопороз, диабет 2 типа, гипертония и болезнь Альцгеймера. Заболеваемость ими увеличивается экспоненциально с возрастом.

Перенесенные в течение жизни заболевания и травмы также могут повлиять на общее состояние организма, и их последствия могут проявляться в пожилом возрасте. Помимо упомянутых выше самых распространенных болезней, возможны и другие возрастные нарушения, включая нарушения обменных процессов, патологии пищеварительной системы, неврологические нарушения, эндокринные возрастные изменения, психиатрические и другие возрастные расстройства и патологии. Гериатр оказывает весть спектр медицинской помощи пациентам преклонного возраста.

Вот что говорит о специфике работы врача гериатра и об уникальности этой специальности главный внештатный гериатр Министерства здравоохранения России и директор Российского геронтологического научно-клинического центра РНИМУ им. Н. Пирогова Ольга Ткачева:

«

Самое главное — гериатр осуществляет очень тщательный подбор лекарств. Это необходимо для более эффективной и безопасной терапии. Ведь организм пожилого человека воспринимает их по-другому, печень и почки, играющие главную роль в переработке и выведении лекарств, работают уже не так, как раньше.

Это имеет особо важное значение еще и потому, что у пожилых людей обычно уже много болезней, и им назначают сразу несколько разных лекарств. Из-за этого каждый новый препарат нужно добавлять очень осторожно.

Именно в таких случаях нужна помощь врача-гериатра. Например, оценив состояние больного, он вообще может отменить некоторые препараты. И это пойдет только на пользу — не все болезни в таком возрасте нужно лечить активно, а от большого количества принимаемых лекарств может быть больше вреда, чем от некоторых заболеваний.

Задача гериатра — скорректировать лечение, спланировать его на перспективу. Гериатр — это консультант, он помогает в сложных случаях, чтобы лечение у пациентов со множественными болезнями было более эффективным и более безопасным. Но он не заменяет лечащего врача.

»

В каком возрасте обращаться к гериатру

Процесс старения организма очень индивидуален. Некоторые люди в возрасте старше 70 лет продолжают сохранять ясность ума, ведут активный образ жизни, занимаются спортом и не замечают возрастных изменений. А у других уже к 60 годам может быть букет возрастных болезней, общий упадок сил и депрессивное настроение. В каком же возрасте можно обращаться к врачу гериатру?

Официальная классификация возрастов, принятая Всемирной Организацией Здравоохранения (ВОЗ) сегодня выглядит так:

  • Молодой возраст — 18-44 года
  • Средний возраст — 45-59 лет
  • Пожилой возраст — 60-74 года
  • Старческий возраст — 75-90 лет
  • Долголетие — старше 90 лет

Соответственно пациентами врача гериатра могут быть люди от 60 лет.

В каких случаях следует обращаться к гериатру

  1. Наличие сразу нескольких болезней у пожилого человека.
  2. Ухудшение памяти.
  3. Когнитивные нарушения.
  4. Проблемы с самообслуживанием.
  5. Хроническая слабость, непереносимость обычной физической нагрузки.
  6. Плохое настроение, проявления депрессии.
  7. Снижение массы тела.

Чаще всего такие проявления старения организма возникают после 75 лет. Но иногда эти процессы могут начаться и раньше. Гериатры наблюдают у некоторых пациентов ускорение процессов старения, которое происходит после выхода на пенсию или сильного стресса. В таких случаях гериатр может назначить профилактическое лечение, чтобы отодвинуть развитие старения.

Где найти врача гериатра

С 2018 года гериатрическая помощь в России была включена в программу обязательного медицинского страхования (ОМС). Сегодня потребность во врачах-гериатрах в России удовлетворена всего на 40%. Для этого 1 тысяча врачей прошла первичную подготовку по специальности «Гериатрия». А к 2024 г. должно появиться 2 тысячи таких специалистов. Это притом что еще несколько лет назад их было всего 200.

К 2024 г. будет построена трехуровневая система гериатрической службы.

Первый уровень — это организация медицинской помощи пожилым людям в амбулаторных условиях. Для этого в поликлиниках создаются кабинеты, в которых врач-гериатр будет вести прием пожилых пациентов. Они будут создаваться из расчёта один кабинет на 20 тысяч пожилых людей.

Второй уровень — организация медицинской помощи пожилым в стационарных условиях. Для этого будут созданы специализированные комфортные отделения в региональных клиниках. Их задача — составить для пациента со множеством заболеваний индивидуальную программу действий, которая поможет ему оставаться активным и предотвратит потерю самостоятельности. Здесь будут лечить не просто пожилых людей с возрастными заболеваниями, а пациентов с явными проявлениями процесса старения: снижением памяти, слабостью из-за уменьшения мышечной массы и со многими сочетанными заболеваниями.

Третий уровень — региональные гериатрические центры. Они будут организовывать всю работу, касающуюся медицины пожилых людей и оказывать амбулаторную и стационарную медицинскую помощь. Головным учреждением такого типа является Российский геронтологический научно-клинический центр в Москве, в котором есть не только амбулаторное и стационарные отделения разной специализации, но и научные лаборатории. Здесь можно получить амбулаторную и стационарную помощь как по программе ОМС, так и платно.

Рецессия десны – что это

Рецессия представляет собой патологические изменения, убыль ткани. В результате рецессии десны оголяется шейка, части корня зуба, при этом проблема доставляет не только эстетический дискомфорт.

Кроме того, что опущение десен портит красоту улыбки, многие пациенты отмечают серьезный дискомфорт при жевании, повышенную чувствительность и некоторую болезненность в области пораженных зубов. В результате заболевание сказывается на качестве жизни. Кроме того, опущение может быть симптомом других пародонтальных заболеваний и сопутствующих недугов, невнимание к которым может быть чревато еще более серьезными последствиями.

Это заболевание может встречаться у людей всех возрастов, но больше ему подвержены зрелые и пожилые пациенты. Важно своевременно распознать рецессию и обратиться к врачу для эффективного лечения, к счастью, современные методы во многих случаях позволяют надолго забыть о патологии.

Классификация рецессии

Опущение десны классифицируется по причинам происхождения на следующие виды:

  • Травматическое — появляется в результате механического повреждения слизистых оболочек. Как правило, травма связана с жесткой зубной щеткой, неправильной техникой чистки зубов, что приводит к систематическим повреждениям. К другим распространенным причинам травмы относят некорректно установленные ортопедические конструкции — виниры, коронки и др. Иногда травмирование связано с выступающими краями пломб, элементами брекет-систем. Важно понимать, что дефекты прикуса тоже являются частой причиной рецессий: неправильное распределение жевательной нагрузки приводит к изменениям в тканях. Травмы могут быть связаны и с непосредственным давлением на десну зубов. И, наконец, к другой группе травм относят ожоги, например, связанные с неудачным домашним отбеливанием.
  • Симптоматическое — в этом случае опущение связано с каким-то патологическим процессом и служит его симптомом. Обычно речь идет о заболеваниях десен и пародонтальных тканей: гингивите, пародонтите или пародонтозе. Они поражают слизистые оболочки и мягкие ткани, нарушают их трофику. Ситуацию усугубляют зубные отложения в местах прилегания десны к зубу, в результате ткань попросту отслаивается от поверхности зуба и уровень тканей опускается. К более редким патологиям, проявляющимся рецессией десен, относят другие заболевания, например, сахарный диабет, лейкоз.
  • Физиологическое — развивается она в результате общего нарушения метаболизма, в том числе обменных нарушений в тканях пародонта. В таком случае речь идет и об естественных процессах старения. Однако иногда опущение десны развивается и в молодом возрасте в связи с индивидуальными особенностями строения зубочелюстной системы. Самым ярким примером является укороченная уздечка губы, приводящая к натяжению тканей.

По степени тяжести рецессии классифицируют ее тоже на три категории:

  • легкая: убыль ткани до 3 мм;
  • средняя: 3−5 мм;
  • тяжелая: более 6 мм.

По локализации патологического процесса рецессии делят на локализованные и генерализованные. В первом случае опущение десен связано с травмой и распространяется на один или несколько близко расположенных зубных единиц. Как правило, поражается внешняя сторона зубов, а дефект заметен при улыбке.

При генерализованной форме патология охватывает весь зубной ряд с одной или обеих сторон. Чаще она наблюдается у пожилых пациентов, а также у людей с пародонтитом и пародонтозом.

Почему появляется рецессия

Развитие рецессии может быть связано с самыми разными причинами:

  • Зубной налет и твердые отложения. В результате образования отложений смещается эпителий десны.
  • Специфическое строение альвеолярного отростка зубов. Иногда при наличии массивной корневой системы имеет место истончение слоя кортикальной костной ткани. Это приводит к недостаточному кровоснабжению тканей, образованию щелевидного дефекта между зубом и десной, опущению десны.
  • Неправильный уход за полостью рта. При чистке зубов могут происходить повреждения десен. Это возникает при выборе слишком жесткой щетины или нарушениях техники очищения зубов. При регулярном повреждении состояние ухудшается, что приводит к рецессии десны.
  • Травмы. Например, вывих зуба.
  • Ортодонтическое лечение. Предусматривает оказание давления на зубной ряд, смещение зубов, что в некоторых случаях может приводить к истончению десневой ткани. К тому же несъемные конструкции затрудняют гигиену и могут непосредственно давить на мягкие ткани.
  • Воздействие мышьяка. Применение мышьяковых паст при эндодонтическом лечении может стать причиной убыли десны, если препарат попадает на десны.
  • Гингивит или пародонтит. Воспалительные заболевания десен и пародонтальных тканей, особенно длительно протекающее.
  • Короткая уздечка губ.

Следует учесть, что есть предрасполагающие факторы, которые в сочетании с другими причинами вероятнее всего приведут к опущению пародонта. К ним относят тонкий биотип десны, а также вестибулярное расположение зубов либо аномалии их положения, близкое прикрепление уздечки губ и языка.

Сами по себе эти особенности не всегда приводят к патологии, но увеличивают вероятность рецессии, например, при воздействии бактерий и вирусов, травмах и пр.

Симптомы опущения десны

Состояние, при котором опускаются десны, может сопровождаться и другими симптомами. В зависимости от распространенности патологического процесса рецессия наблюдается на ограниченном участке, одной стороне или всей челюсти. В результате может оголяться шейка зуба, а при выраженной убыли и часть корня.

Это не может не сопровождаться повышенной чувствительностью зубов — усиливается восприимчивость к горячему и холодному, кислым, сладким блюдам и даже механическому воздействию. Такой симптом приводит к затруднениям во время приема пищи.

Важно понимать, что некоторые симптомы могут указывать на сопутствующие патологии. Так, если рецессия наблюдается на фоне белесоватости, бледности десен, речь может идти о пародонтозе. А кровоточивость, краснота десен чаще развивается при пародонтите и гингивите.

Что будет, если не лечить

Отсутствие своевременного лечения рецессии десны может быть чревато не только эстетическими проблемами. При наличии промежутка между десной и зубом в него попадают остатки пищи и зубной налет, а это может стать причиной присоединения воспалительного процесса. По мере истончения, опущения тканей могут появляться следующие последствия рецессии:

  • Гиперестезия, или повышенная чувствительность зубов, затруднения при жевании.
  • Высокие риски развития кариеса, причем на наименее защищенных и более уязвимых участках — в области оголенных шеек зубов. При этом кариозное поражение этой области протекает быстрее и быстрее осложняется пульпитом, периодонтитом за счет более тонкого слоя эмали.
  • Повышение риска развития некариозного поражения — клиновидного дефекта.
  • Высокие риски воспаления, отечности десен, формирования пародонтальных карманов.
  • Увеличение объема зубного налета у корней, что еще сильнее усугубляет состояние.

Результатом осложнений могут стать серьезные последствия в виде расшатывания и утраты зубов.

Методы диагностики

Если десна отходит от зуба, важно как можно скорее показаться врачу: на ранних стадиях рецессия быстрее и проще поддается лечению. Диагностика предусматривает сбор анамнеза, анализ симптомов и жалоб, осмотр и инструментальное исследование при необходимости. В ходе осмотра врач оценит ширину, характер повреждения десны. Для диагностики может быть использован пародонтальный зонд — его вводят в пародонтальный карман для оценки глубины поражения.

Оценка степени повреждения десен рассчитывается вычислением индекса рецессии по следующей формуле: число пораженных зубов делят на общее их количество и умножают на 100 %. Так определяется степень тяжести болезни: менее 25 % — рецессия легкой степени, 26−50 % — средней, а от 50 % — тяжелой.

Для диагностики применяется микроскоп, используются бинокулярные лупы. Тщательность диагностических мероприятий позволяет точно подобрать действенный метод лечения. Кроме того, перед началом лечения очень важно выяснить причины недуга: определить, является рецессия самостоятельным заболеванием или симптомом другой патологии.

Поэтому обязательно проводится дифференциальная диагностика с другими болезнями пародонта, при которых поднимается десна. Для этого врач может назначить прицельный или панорамный рентгенографический снимок для оценки состояния костной ткани, обнаружения скрытых сопутствующих заболеваний.

Особенности лечения рецессии десны

Выделяют консервативные и хирургические методы, с помощью которых удается сравнительно быстро справиться с проблемой. Разработка программы лечения всегда индивидуальна и учитывает степень тяжести, причины опущения, распространенность патологии и другие условия.

Первым этапом всегда служит профессиональная чистка зубов. Она необходима, чтобы удалить мягкие и твердые зубные отложения. Иногда производится удаление поддесневого зубного камня, что уже позволяет уменьшить глубину пародонтальных карманов, а в сочетании с другими методами справиться с проблемой полностью или добиться существенного улучшения.

Медикаментозное лечение позволяет решить сразу несколько задач:

  • устранить или предотвратить воспаление десен;
  • укрепить десны;
  • улучшить кровообращение;
  • ускорить восстановительные процессы;
  • активировать рост клеток слизистой оболочки и тканей десен.

Для этого могут использоваться витаминотерапия, противовоспалительные препараты и местные антибиотики, саморассасывающиеся мембраны и пр. Врач может назначить лечебные ванночки, полоскания определенными растворами или аппликации препаратов на десну, в том числе дома.

Также широко применяют препараты, активирующие процессы восстановления: средства на основе гиалуроновой кислоты, регенерирующие гели с факторами роста. Запуск естественных процессов регенерации позволяет буквально «нарастить» десну в месте ее проседания.

Еще одним консервативным методом является применение собственной плазмы крови пациента, обогащенной тромбоцитами. Этот метод носит название плазмолифтинга, или APRF-технологии. Могут быть использованы инъекции в десну, а также специальные мембраны, которые подсаживают под десну, но уже в рамках хирургического вмешательства. Это позволяет быстро восстановить ткани и улучшить питание клеток.

Что касается других хирургических методов лечения опущения десен, самыми распространенными являются:

  • Лоскутная операция — рецессия десны закрывается десневым лоскутом, который врач берет из собственных тканей пациента, расположенных рядом. Выполняется вмешательство при незначительном дефекте десны, а также наличии достаточного объема окружающих тканей, которые можно использовать.
  • Пересадка трансплантата из твердого неба/бугра верхней челюсти. В этом случае часть десны или лоскут соединительной ткани забирается с участков-доноров и подсаживается в зоне дефекта. Может использоваться для всех видов рецессии.
  • Комбинированный метод: перемещение тканей десны совмещается с забором участка тканей с твердого неба. Сочетание подходов позволяет получить высокие эстетические результаты, закрыть глубокие рецессии. Однако при убыли десны более 5 мм может потребоваться несколько вмешательств.

Закрытие рецессии десны проводится амбулаторно под местным обезболиванием. Выбор вида операции определяется состоянием тканей пародонта и результатами диагностики. Все хирургические методы часто сочетают с кюретажем — чисткой пространства под десной и удалением поддесневых отложений, а также дополняют активаторами роста.

Домашний уход и послеоперационный период

После лечения рецессии десны врач может назначить антибиотики, полоскания, гели для аппликации и другие местные средства, чтобы предотвратить осложнения и ускорить процесс заживления. Также важно предпочесть щадящую, мягкую пищу комфортной температуры, выполнять регулярную гигиену согласно рекомендациям специалиста.

Стоматолог посоветует заменить жесткую зубную щетку на мягкую, а по мере заживления вероятнее потребуется зубная щетка со щетиной средней степени жесткости. Кроме того, врач обязательно покажет правильные чистящие движения, расскажет, какой нажим будет оптимальным. Во многих случаях таких мер достаточно для устранения причин оголения шеек зубов, а также поддержания результатов лечения.

Профилактика опущения десен

Для предотвращения рецессии десен врач может порекомендовать следующие меры:

  • Своевременные, регулярные визиты к стоматологу: важно не только проходить осмотр, но и проводить профессиональную гигиену дважды в год. Это позволит предовтратить скопление зубного налета и формирование твердых отложений.
  • Своевременная коррекция прикуса, лечение воспалительных заболеваний десен, замена пломб, внимательный выбор ортопедических конструкций.
  • Индивидуальный подбор средств гигиены полости рта, особенно при наличии заболеваний тканей пародонта.
  • Использование зубной нити, ирригатора. Он не только улучшит качество гигиены и поможет убрать частички пищи из межзубных промежутков, но и послужит своеобразным массажером десен, обеспечит стимуляцию кровообращения и поддержит здоровье слизистых оболочек. Важно проконсультироваться с врачом о целесообразности применения, однако в современных ирригаторах предусмотрены мягкие режимы воздействия.
  • Избегание травм слизистой: отказ от неудобных ортопедических конструкций, применение специального воска при ношении брекетов.
  • Отказ от курения: эта вредная привычка ухудшает кровоснабжения тканей полости рта, способствует образованию большого объема налета на зубах.

Более подробно узнать о лечении и профилактике, а также получить качественную помощь при наличии рецессии десны вы можете у врачей клиник «СТОМА». Опытные пародонтологи имеют высокую квалификацию и целый арсенал современных методов лечения: мы готовы предложить комплексную помощь в диагностике и лечении. Записаться на осмотр можно по телефону или через специальную форму на сайте.

Страница не найдена |

Страница не найдена |

404. Страница не найдена

Архив за месяц

ПнВтСрЧтПтСбВс

21222324252627

28293031   

       

       

       

     12

       

     12

       

      1

3031     

     12

       

15161718192021

       

25262728293031

       

    123

45678910

       

     12

17181920212223

31      

2728293031  

       

      1

       

   1234

567891011

       

     12

       

891011121314

       

11121314151617

       

28293031   

       

   1234

       

     12

       

  12345

6789101112

       

567891011

12131415161718

19202122232425

       

3456789

17181920212223

24252627282930

       

  12345

13141516171819

20212223242526

2728293031  

       

15161718192021

22232425262728

2930     

       

Архивы

Апр

Май

Июн

Июл

Авг

Сен

Окт

Ноя

Дек

Метки

Настройки
для слабовидящих

Психологические реакции пациента на болезнь

Психологические консультации для онкологов, сохраняется анонимность
Телефон: 8-800 100-0191
(звонок по России – бесплатный, консультация круглосуточно)

Отражение болезни в переживаниях человека принято определять понятием внутренняя картина болезни (ВКБ). Оно было введено отечественным терапевтом Р.А. Лурия и в настоящее время широко используется в медицинской психологии. Это понятие, по определению ученого, объединяет в себе все то, «что чувствует и переживает больной, всю массу его ощущений, его общее самочувствие, самонаблюдение, его представления о своей болезни, о ее причинах – весь тот огромный мир больного, который состоит из весьма сложных сочетаний восприятия и ощущения, эмоций, аффектов, конфликтов, психических переживаний и травм».

Как сложное структурированное образование, внутренняя картина болезни включает в себя несколько уровней: сенситивный, эмоциональный, интеллектуальный, волевой, рациональный. ВКБ определяется не нозологической единицей, а личностью человека, она также индивидуальна и динамична, как и внутренний мир каждого из нас. При этом существует ряд исследований, обнаруживающих характерные особенности переживания больным своего состояния.

Так, в основе концепции В.Д. Менделевича («Терминологические основы феноменологической диагностики») находится представление о том, что тип реагирования на определенное заболевание определяется двумя характеристиками: объективной тяжестью болезни (определяющейся критерием летальности и вероятностью инвалидизации) и субъективной тяжестью болезни (собственной оценкой больным его состояния).

Представление о субъективной тяжести заболевания складывается из социально-конституциональных характеристик, к числу которых относятся пол, возраст и профессия индивида. Для каждой возрастной группы существует свой реестр тяжести заболевания – своеобразное распределение болезней по социально-психологической значимости и тяжести.

Так, в подростковом возрасте наиболее тяжелые психологические реакции могут быть вызваны не теми болезнями, которые являются объективно угрожающими сохранности организма с медицинской точки зрения, а теми, которые изменяют его внешний вид, делают его непривлекательным. Это обусловлено существованием в сознании подростка основной потребности – «удовлетворенности собственной внешностью».

Лица зрелого возраста более психологически тяжело будут реагировать на хронические и инвалидизирующие заболевания. «Это связано с системой ценностей и отражает устремленность человека зрелого возраста удовлетворять такие социальные потребности, как потребность в благополучии, благосостоянии, независимости, самостоятельности и пр.». В этом отношении с онкологическими заболеваниями связаны наиболее сильные переживания. Для пожилых и престарелых людей наиболее значимыми являются болезни, которые могут привести к смерти, потере трудо- и работоспособности.

К индивидуально-психологическим характеристикам, оказывающим влияние на специфику переживания заболевания, относятся особенности темперамента (в отношении следующих критериев: эмоциональность, переносимость боли, как признак эмоциональности, и ограничения движений и обездвиженности), а также особенности характера человека, его личности (мировоззренческие установки, уровень образования).

Существует типология способов реагирования на заболевание пациентом. Знание типа реагирования больного помогает подобрать адекватную стратегию взаимодействия с ним и его семьей, использовать соответствующие способы общения, мотивирования к лечению.

Типы психологического реагирования на тяжелое соматическое заболевание

Типология реагирования на заболевание А.Е.Личко и Н.Я. Иванова («Медико-психологическое обследование соматических больных») включает в себя 13 типов психологического реагирования на заболевание, выделенных на основе оценки влияния трех факторов: природы самого соматического заболевания, типа личности, в котором важнейшую составную часть определяет тип акцентуации характера и отношения к данному заболеванию в референтной (значимой) для больного группе.

В первом блоке находятся те типы отношения к болезни, при которых не происходит существенного нарушения адаптации:

  • Гармоничный: для этого типа реагирования характерна трезвая оценка своего состояния без склонности преувеличивать его тяжесть и без оснований видеть все в мрачном свете, но и без недооценки тяжести болезни. Стремление во всем активно содействовать успеху лечения. Нежелание обременять других тяготами ухода за собой. В случае неблагоприятного прогноза в смысле инвалидизации – переключение интересов на те области жизни, которые останутся доступными больному. При неблагоприятном прогнозе происходит сосредоточение внимания, забот, интересов на судьбе близких, своего дела.
  • Эргопатический: характерен “уход от болезни в работу”. Даже при тяжести болезни и страданиях стараются во что бы то ни стало работу продолжать. Трудятся с ожесточением, с еще большим рвением, чем до болезни, работе отдают все время, стараются лечиться и подвергаться исследованию так, чтобы это оставляло возможность для продолжения работы.
  • Анозогнозический: характерно активное отбрасывание мысли о болезни, о возможных ее последствиях, отрицание очевидного в проявлении болезни, приписывание их случайным обстоятельствам или другим несерьезным заболеваниям. Отказ от обследования и лечения, желание обойтись своими средствами.

Во второй блок входят типы реагирования на болезнь, характеризующиеся наличием психической дезадаптации:

  • Тревожный: для этого типа реагирования непрерывное беспокойство и мнительность в отношении неблагополучного течения болезни, возможных осложнений, неэффективности и даже опасности лечения. Поиск новых способов лечения, жажда дополнительной информации о болезни, вероятных осложнений, методах лечения, непрерывный поиск “авторитетов”. В отличие от ипохондрии более интересуют объективные данные о болезни (результат анализов, заключения специалистов), чем собственные ощущения. Поэтому предпочитают больше слушать высказывания других, чем без конца предъявлять свои жалобы. Настроение прежде всего тревожное, угнетенность – вследствие этой тревоги).
  • Ипохондрический: характерно сосредоточение на субъективных болезненных и иных неприятных ощущениях. Стремление постоянно рассказывать о них окружающим. На их основе преувеличение действительных и выискивание несуществующих болезней и страданий. Преувеличение побочного действия лекарств. Сочетание желания лечиться и неверия в успех, требований тщательного обследования и боязни вреда и болезненности процедур).
  • Неврастенический: характерно поведение по типу “раздражительной слабости”. Вспышки раздражения, особенно при болях, при неприятных ощущениях, при неудачах лечения, неблагоприятных данных обследования. Раздражение нередко изливается на первого попавшегося и завершается нередко раскаянием и слезами. Непереносимость болевых ощущений. Нетерпеливость. Неспособность ждать облегчения. В последующем – раскаяние за беспокойство и несдержанность.
  • Меланхолический: характерна удрученность болезнью, неверие в выздоровление, в возможное улучшение, в эффект лечения. Активные депрессивные высказывания вплоть до суицидальных мыслей. Пессимистический взгляд на все вокруг, неверие в успех лечения даже при благоприятных объективных данных.
  • Эйфорический: характерно необоснованно повышенное настроение, нередко наигранное. Пренебрежение, легкомысленное отношение к болезни и лечению. Надежда на то, что “само все обойдется”. Желание получать от жизни все, несмотря на болезнь. Легкость нарушения режима, хотя эти нарушения могут неблагоприятно сказываться на течении болезни.
  • Апатический: характерно полное безразличие к своей судьбе, к исходу болезни, к результатам лечения. Пассивное подчинение процедурам и лечению при настойчивом побуждении со стороны, утрата интереса ко всему, что ранее волновало.
  • Обессивно-фобический: характерна тревожная мнительность прежде всего касается опасений не реальных, а маловероятных осложнений болезни, неудач лечения, а также возможных (но малообоснованных) неудач в жизни, работе, семейной ситуации в связи с болезнью. Воображаемые опасности волнуют более, чем реальные. Защитой от тревоги становятся приметы и ритуалы.
  • Сенситивный: характерна чрезмерная озабоченность возможным неблагоприятным впечатлением, которое может произвести на окружающих сведения о своей болезни. Опасения, что окружающие станут избегать, считать неполноценным, пренебрежительно или с опаской относиться, распускать сплетни или неблагоприятные сведения о причине и природе болезни. Боязнь стать обузой для близких из-за болезни и неблагожелательность отношения с их стороны в связи с этим.
  • Эгоцентрический: характерен “Уход в болезнь”, выставление напоказ близким и окружающим своих страданий и переживаний с целью полностью завладеть их вниманием. Требование исключительной заботы – все должны забыть и бросить все и заботиться только о больном. Разговоры окружающих быстро переводятся “на себя”. В других, также требующих внимания и заботы, видят только “конкурентов” и относятся к ним неприязненно. Постоянное желание показать свое особое положение, свою исключительность в отношении болезни.
  • Паранойяльный: характерна уверенность, что болезнь – результат чьего-то злого умысла. Крайняя подозрительность к лекарствам и процедурам. Стремление приписывать возможные осложнения лечения и побочные действия лекарств халатности или злому умыслу врачей и персонала. Обвинения и требования наказаний в связи с этим.
  • Дисфорический (характерно тоскливо-озлобленное настроение).

Взаимодействие с некоторыми из таких пациентов может приносить врачу выраженный психологический дискомфорт. Но знание психологических оснований этого типа поведения пациента поможет врачу лучше понимать его потребности, ожидания, страхи и эмоциональные реакции, оптимально организовывать процесс взаимодействия с ним, использовать определенные инструменты влияния. Важно понимать, что, даже демонстрируя полное безразличие к исходу лечения, пациент больше всего хочет услышать слова надежды и нуждается в укреплении его веры в лучшее. Пациенты, непрерывно тревожащиеся о своем состоянии, нуждаются в спокойном, оптимистичном и внимательном разговоре с врачом, а пациенты, демонстрирующие реакции агрессии к окружающим и врачу – авторитетной уверенной позиции врача, которая поможет справиться со скрываемым в душе сильнейшим страхом за свою жизнь.

Таким образом, понимание типа реагирования больного на заболевание поможет сделать союз врача и пациента более эффективным, способствующим психологическому благополучию обоих участников лечебного процесса.

Рубежи старости отодвигаются / Колонка обозревателя / Независимая газета

Королева Великобритании – живой пример известной сентенции: мы молоды, пока так себя ощущаем.
Фото Reuters

Всемирный день пожилого человека, который отмечается с 1 октября 1991 года, видимо, должен напомнить, что пожилым, то есть попросту старым, станет каждый, если, конечно, доживет. А доживает все больше. И возрастная граница старости все отодвигается.

По классификации ВОЗ, старость начинается после 75 лет, пожилой возраст – после 60 лет, а с 45 до 60 – средний. В XIX веке такая градация показалась бы дикой. Пушкин в 37 лет считал себя немолодым. Да так и выглядел на последних портретах. А «гнусному старикашке Геккерну» было всего-навсего 43 года.

Теперь уже и возрастная классификация ВОЗ, похоже, устаревает. Как показало социологическое исследование, проведенное в Великобритании по заказу сайта Love to Learn, большинство жителей этой страны считают, что пожилой возраст начинается после 70, а молодость заканчивается только в 55 лет. 20% участников опроса заявили, что средний возраст наступает после 60. Еще 19% полагают, что средний возраст – это не отметка в паспорте и не биологический показатель, а состояние души.

Социологи считают, что такое изменение в отношении общества к возрасту объясняется тем, что нация стареет. Продолжительность жизни увеличивается, растет количество людей солидных лет, которые вовсе не хотят считать себя старыми или пожилыми. В настоящее время, если верить статистике, в Великобритании уже больше тех, кто старше 65, чем тех, кто младше 16. Такое наблюдается впервые за всю историю страны.

Судя по результатам опроса, британцы убеждены, что выходят на пенсию в среднем возрасте, а их старость наступает значительно позднее. В таком взгляде на возрастные рубежи жизни человека есть резон. Сегодняшние 50-летние ведут такой активный образ жизни, какой вели вчерашние 30-летние. Это касается и спорта, и секса, и путешествий, и даже построения карьеры.

Интересно, что всего 50 лет назад, по данным аналогичных опросов, жители Британии считали, что средний возраст наступает после 35 лет (а не после 55, как сейчас), однако традиционно не соглашались рассматривать себя как старых и достигнув 70.

Основания для этого у британцев есть. Можно лишний раз вспомнить про Черчилля, который стал премьер-министром (во время Второй мировой войны – и каким премьером!) в 66 лет, а потом еще раз был выбран премьер-министром уже в 77 лет. Нынешней английской королеве Елизавете 86 лет, ее мужу Филиппу 91 год – быть монархом этой страны отнюдь не синекура.

В других странах Европы приблизительно такие же, как в Британии, определения возрастной границы старости. А вот в отношении окончания молодости представления различаются. Если в Британии считают, что это 46 лет, то в Швеции, согласно аналогичному опросу, – после 35, а в Греции – после 50.

Во многих странах Европы – Германии, Швейцарии, Франции, Италии, Испании – люди старших возрастов не сидят тихо по углам и вполне наслаждаются жизнью.

А вот какие результаты дал опрос, проведенный в России в преддверии Международного дня пожилого человека Исследовательским центром портала Superjob.ru. По мнению 40%, пожилым может считаться мужчина после 70 лет, по мнению 37% – после 60 лет, по мнению 11% – после 80, а по мнению 7% – после 50 лет (понятно, что такой точки зрения придерживаются чаще всего опрошенные в возрасте до 24 лет). 1% респондентов относят к пожилым даже 40-летних. В отношении женщин сроки суровее. 42% считают, что для женщин пожилой возраст начинается в 60 лет, 30% – что после 70. Вот один из ответов: «70 лет – это возраст, когда уже хочется покоя, никуда не хочется бежать».

Ответ, характерный для нашей страны. Не европейский. К 70 годам азиатская женщина выработалась. Набегалась. Европейская или американская живет в полную силу. Занимается спортом, ездит по всему миру. А то и продолжает работать или даже меняет поле деятельности.

Рут Флауэрс, литературовед, специалист по Диккенсу, овдовев, находилась в депрессии. Как-то внук уговорил ее пойти с ним в ночной клуб. Охранник клуба удивился такой посетительнице, и на спор с ним Рут сказала, что станет диджеем. И действительно стала. В 68 лет. Конечно, училась. Конечно, нашелся продюсер, который заинтересовался таким необыкновенным проектом. И не прогадал. Сейчас 72-летняя Рут Флауэрс дает по нескольку концертов в месяц, выступает в лучших клубах мира.

Американка Хедда Болгар – известный психоаналитик. Она живет одна в своем доме в Лос-Анджелесе, принимает пациентов по 20 часов в неделю. Читает лекции, ездит на профессиональные конференции. Словом, Хедда умная, яркая, успешная калифорнийская женщина, которая живет активной и весьма независимой жизнью. И не было бы в этом ничего особенно удивительного, если бы не одна деталь. Хедде Болгар 103 года.

Это, конечно, экстраординарные истории. А ординарные – когда совершают многокилометровые поездки на велосипеде, катаются на горных лыжах, поют в хоре и ездят с хором на гастроли. Главное – самому не выносить себе приговор. Главное – деятельность.

У нас, конечно, труднее. Тем не менее и у нас такое бывает. Знаю геолога, который в 85 лет ездит в экспедиции в Сибирь. Знаю женщину 84 лет, которая проводит отпуск в экскурсии на Алтай, а года два назад ездила на экскурсию в Африку. Еще – физик, 79 лет, только что вернулся из Македонии, участвовал в Охридском хоровом фестивале – так проводил свой отпуск.

В Москве сейчас около 3 млн. людей достигли пенсионного возраста – почти четверть населения. Среди них – 31 тыс. перешагнули 90-летний рубеж, а 547 уже отметили 100-летний юбилей.

Что-то меняется в человечестве. Может быть, природным способом ослабляется угроза перенаселения: детей становится меньше, людей старшего возраста соответственно больше. Постарение населения во всем мире – видимо, закон природы. А с законом природы не поспоришь. Его никакая Дума ни по чьему приказу изменить не может. К нему волей-неволей придется приспосабливаться.

Комментарии для элемента не найдены.

Переопределение значимых возрастных групп в контексте болезни

Резюме

Возраст является важным фактором при рассмотрении фенотипических изменений в состоянии здоровья и болезни. В настоящее время использование информации о возрасте в медицине является несколько упрощенным, при этом возраст обычно группируется в небольшое количество грубых диапазонов, отражающих основные этапы развития и старения, такие как детство или юность. Здесь мы исследуем возможность переопределения возрастных групп с использованием недавно разработанной базы знаний Age-Phenome (APK), которая содержит более 35 000 литературных статей, описывающих взаимосвязь между возрастом и фенотипом.Кластеризация данных APK позволяет выделить 13 новых, частично перекрывающихся возрастных групп. Болезни, которые определяют эти группы, предполагают, что предлагаемые подразделения имеют биологический смысл. Далее мы показываем, что количество различных возрастных диапазонов, которые следует учитывать, зависит от типа оцениваемого заболевания. Этот вывод был дополнительно подтвержден аналогичными результатами, полученными из данных клинических измерений крови. Группировка заболеваний, которые имеют схожий характер отчетов о заболеваниях, в некоторых случаях прямо отражает медицинские знания о взаимосвязи болезни и возраста.В других случаях наши результаты могут быть использованы для создания новых и обоснованных гипотез о связи между заболеваниями.

Ключевые слова: Возраст, Возрастные группы, Кластеризация, Болезнь

Введение

Возраст играет важную роль в медицине и медицинских исследованиях, являясь важным фактором при рассмотрении фенотипических изменений в состоянии здоровья и болезни. Возраст пациента может влиять на течение и прогрессирование заболевания (Diamond et al., 1989; Hasenclever and Diehl, 1998) или может играть важную роль в определении правильного курса лечения (Vecht, 1993).Несмотря на это, текущее использование информации о возрасте в медицине несколько упрощенно и грубо.

Возраст обычно группируется в небольшое количество грубых возрастных диапазонов, отражающих основные этапы развития и старения (Carol and Sigelman 2005). Однако данные свидетельствуют о том, что не все биомедицинские процессы соответствуют одному и тому же шаблону возрастной группировки. Например, в то время как половое созревание обычно заканчивается к 19 годам (DeLamater and Friedrich, 2002), другие процессы развития, такие как развитие мозга, продолжаются до 20 лет (Giedd et al.1999). Кроме того, стандартные возрастные диапазоны, такие как те, которые определены в Медицинских предметных рубриках (MeSH), которые являются контролируемым словарным тезаурусом Национальной медицинской библиотеки (Медицинские предметные рубрики (Mesh), [http://www.ncbi.nlm.nih.gov/ mesh]), разобщены и неспецифичны. При рассмотрении распространенности заболеваний и лечения многих типов заболеваний важные возрастные диапазоны отличаются от допустимых диапазонов. Например, предполагается, что венерические заболевания наиболее распространены в возрасте от 16 до 35 лет (Syrjanen et al.1984 год; Вайншток и др. 2004). Упомянутый выше возрастной диапазон включает лиц, принадлежащих к трем возрастным группам в соответствии с общеупотребительной лексикой MeSH (т. е. дети, подростки и взрослые). Такие ограничения существующей модели возрастной классификации вызывают необходимость пересмотра того, как определяются возрастные диапазоны в контексте болезни и здоровья. Если бы вместо этого диапазоны могли быть определены таким образом, чтобы допускалось совпадение, это могло бы лучше соответствовать описанию возраста в контексте различных заболеваний.Кроме того, хотя многие согласны с тем, что разные возрастные диапазоны следует рассматривать в контексте разных типов заболеваний, эту возможность еще предстоит систематически оценить.

Хотя существует много данных о заболевании и возрасте, такая информация не была систематизирована и только недавно стала доступной для исследований. Недавно мы разработали базу знаний Age-Phenome (APK), в которой содержится структурированное представление знаний, полученных из научной литературы и клинических данных, относительно клинически значимых признаков и тенденций, проявляющихся в разном возрасте, таких как симптомы заболевания и предрасположенность (Geifman и Рубин 2011).База данных, лежащая в основе APK, содержит более 35 000 записей, описывающих взаимосвязь между возрастом и болезнью, и была получена из более чем 1,5 миллиона рефератов PubMed (Geifman and Rubin 2012). Доступность такой упорядоченной информации может помочь в изучении взаимосвязей между возрастом и заболеванием.

Один из подходов к изучению определения возрастных диапазонов включает группирование возрастов на основе закономерностей возникновения заболеваний. Соответственно, методы кластеризации, которые группируют гены, болезни, возраст или другие признаки, имеющие сходные закономерности, неоднократно использовались в биомедицинских исследованиях для выработки новых гипотез.Многие такие методы также использовались при изучении биологических и медицинских данных, особенно при анализе данных микрочипов и экспрессии генов (Ben-Dor et al., 1999; Sherlock, 2001; Yin et al., 2006). На самом деле, ранее мы показали, что с помощью иерархической группировки, основанной на общих закономерностях в значениях лабораторных тестов, возрасты могут быть сгруппированы в согласованные кластеры (т. е. где непрерывные возрасты сгруппированы вместе) и что эти кластеры в значительной степени перекрываются с существующими определениями возрастных диапазонов ( Флисс и др.2008).

Здесь, используя методы кластеризации, мы исследовали возможность переопределения возрастных диапазонов на основе их сходства в профилях заболеваний, как указано в APK.

Результаты

На пути к новым возрастным группам

Первоначально мы провели кластерный анализ данных ассоциации возраст-болезнь, используя простой метод кластеризации (k-средние, см. Методы). Используя этот подход, были определены девять возрастных групп со следующими диапазонами: 0–2, 3–5, 6–13, 14–18, 19–33, 34–48, 49–64, 65–78 и 79–98 лет. годы.Эти диапазоны близко соответствуют принятым диапазонам MeSH (рис. ), за исключением группы молодых людей, которая, согласно MeSH, включает лиц в возрасте 19–24 лет; здесь этот диапазон был расширен до возраста 33 лет. Кроме того, группа новорожденных (младше 1 месяца) отсутствовала в результатах анализа k-средних из-за ограничений используемых данных (т. е. использования разрешения в 1 год).

Возрастные диапазоны, предложенные несколькими методами, а именно, широко распространенными подходами MeSH, k-средних и LDA.Возрастные диапазоны, определенные кластеризацией данных APK методом k-средних, сильно напоминают диапазоны, определенные MeSH. Метод LDA предлагает несколько перекрывающихся возрастных диапазонов, которые, как было показано, имеют биомедицинское значение

Наш успех в повторении существующих знаний привел нас к поиску новых классификаций, допускающих возможность того, что несколько перекрывающихся возрастных диапазонов лучше описывают группы, относящиеся к различным заболеваниям или классам болезней. Хотя алгоритм k-средних в принципе может допускать перекрывающиеся кластеры, он лучше всего подходит для несвязанных группировок.Таким образом, мы решили принять метод кластеризации со скрытым распределением Дирихле (LDA), вероятностный метод «мягкой кластеризации», который позволяет данному возрасту принадлежать нескольким диапазонам. С помощью LDA с оптимизацией гиперпараметров было выявлено 13 возрастных кластеров (таблица и рис. ). Эти результаты были подтверждены нашими методами проверки (см. «Методы»). Двенадцать из 13 кластеров были успешно восстановлены при отбрасывании 20 или 40 % данных. Даже когда 60 % данных было удалено, девять кластеров остаются.При повторении анализа, установив максимальное количество кластеров равным 13, мы получили очень похожие результаты в пределах того, что ожидается от стохастического алгоритма (см. «Дополнительный материал»).

Таблица 1

Таблица 1

Резюме кластеризации LDA

Range Представитель 1 0-16 1 2 0- 20 12 3 7-28 16 4

16-38 21 5 18-34 22 6 20-41 35 7 32-54 47 47 8 41-63 53 9 48-69 61 10 50-73 62 11 50-72 67 12 12 62-86 74 13 13 76-98 900 50 91

Как и ожидалось, кластеризация LDA дала кластеры, сильно отличающиеся от кластеризации k-средних, а также существующих определений возрастного диапазона.Важно отметить, что кластеры, полученные методом LDA, перекрываются. Кластер 2, например, распространяется на кластер 1 (охватывающий возрастные диапазоны 1–16 и 1–20 лет соответственно), но имеет более поздний репрезентативный возраст (12 лет по сравнению с 1).

Изучение полученных возрастных групп предполагает, что многие из них могут иметь биологическое значение. Кластер 6 LDA, который охватывает возраст от 20 до 41 года, содержит большую долю случаев различных заболеваний, связанных с женской и мужской фертильностью (например, сперматоцитома, мужское бесплодие, ановуляция, женское бесплодие и т. д.).). Этот возрастной диапазон соответствует возрасту деторождения и воспитания и, вероятно, отражает тот возраст, когда пациенты пытаются зачать ребенка (Dunson et al. 2004), а не фактический возраст фертильности, который, вероятно, наступит раньше. Удивительно, но состояния, связанные со злоупотреблением психоактивными веществами, такие как хроническая алкогольная интоксикация, зависимость от героина и кокаина, также были связаны с одним и тем же кластером, возможно, отражая связанные социальные, психологические и/или биологические процессы, которые одновременно происходят в одной и той же возрастной группе. .

Кластер 12 LDA, охватывающий возраст от 62 до 86 лет, был связан с такими состояниями, как переломы бедра, амнезия и артериальный стеноз, все из которых признаны возрастными заболеваниями, которые, как правило, возникают на более поздних этапах жизни. . Другой кластер, охватывающий возраст 76–98 лет (кластер LDA 13), был тесно связан с другими возрастными заболеваниями, такими как болезнь Альцгеймера, деменция, болезнь Паркинсона, стираемость зубов, возрастная дегенерация желтого пятна, катаракта, ушибы, и фрагментации ДНК.Этот сценарий может отражать разделение болезней, связанных с пожилым возрастом, на отдельные возрастные группы (т. е. «пожилые» и «пожилые»). Кроме того, некоторые из полученных кластеров охватывают аналогичные возрастные диапазоны и имеют схожий репрезентативный возраст (кластеры 4 и 5, а также кластеры 9 и 10). Тщательное изучение кластеров показывает, что они действительно различны; очевидны различия в определяющих их заболеваниях (см. «Дополнительный материал»). Более того, когда мы искали меньшее количество кластеров в рамках процесса проверки, эти кластеры оставались отдельными.

Наконец, кластер LDA 1, который включает возраст 0–16 лет (при этом возраст 1 год является наиболее значимым возрастом в кластере), был тесно связан с заболеваниями детского и младенческого возраста, такими как средний отит, детский лейкоз, ротавирусная инфекция, синдром внезапной детской смерти и инфантильные спазмы, а также различные генетические состояния и врожденные дефекты. Этот кластер предлагает определение детства, которое пересекается с существующими определениями, но лишь частично совпадает с ними.

Связь заболевания с возрастными группами (кластерами) также соответствует известному возрасту заболеваемости.Рак носоглотки, пик которого приходится на возраст 45–64 лет (Ho 1978), был связан с кластером 7 LDA, который охватывает возраст 32–54 лет (с наиболее значимым возрастом – 47 лет), в 56 % зарегистрированных случаев. заболеваний, перечисленных в APK и с кластером 10 LDA, в возрасте от 50 до 73 лет (с наиболее значимым возрастом – 62 года), что составляет дополнительные 35 % зарегистрированных случаев. Заболеваемость вагинитом достигла пика в двух возрастных группах (Foxman et al. 2000), первая из которых приходится на возраст 18–24 лет, а вторая – на возраст 35–44 лет.Согласно нашему анализу, было обнаружено, что вагинит тесно связан с двумя кластерами LDA, а именно с кластером 4 (с наиболее значимым возрастом 21 год), на который приходится 34 % случаев заболевания, включенных в список APK, и кластером 7, на который приходится для 60 % перечисленных случаев. HTLV-I, вирус, который, как известно, вызывает несколько распространенных видов рака, имел низкую распространенность (~ 10 %) в возрасте до 39 лет, но становился более распространенным с возрастом, достигая распространенности почти 50 % к 70 годам (Mueller 1991). В нашем анализе HTLV-1 связан с пятью кластерами LDA, с низкой долей случаев, связанных с кластерами 2, 3 и 6 (5–7 %), и с высокой долей случаев, сгруппированных в кластерах 8 и 12 (36 %). –39 %).Поскольку кластеры 2, 3 и 6 включают молодых людей, а кластеры 8 и 12 включают взрослых и пожилых людей, эти ассоциации следуют за увеличением выявляемости с пожилым возрастом.

Различные типы болезней по-разному делят продолжительность жизни человека

Существование перекрывающихся возрастных диапазонов, как предполагают результаты LDA, еще раз подтверждает гипотезу о том, что разные типы болезней делят жизнь на разное количество групп. Чтобы проверить эту гипотезу, болезни были сгруппированы в классы болезней на основе онтологии болезней.Возраст в пределах каждого класса заболеваний был сгруппирован на основе алгоритма иерархической кластеризации с использованием пакета pvclust R (Suzuki and Shimodaira 2006) для определения статистически значимых делений на кластеры (значение 90 167 p 90 168 < 0,05).

Наши результаты показывают, что разные классы заболеваний делят продолжительность жизни человека на разное количество возрастных диапазонов (см. рис.  для отдельных классов заболеваний и «Дополнительные онлайн-материалы» для всех классов заболеваний). Например, «грибковая инфекция» определяет два возрастных диапазона, а именно 1–20 и 21–95 лет.Для сравнения, «бактериальные инфекции» делили жизнь на шесть сегментов, а «болезни тканей» делили жизнь на три сегмента. Однако мы отмечаем, что для многих оцениваемых классов болезней перерыв наблюдался в позднем подростковом возрасте или в возрасте около 20 лет. Это наблюдение совпадает с общепринятыми медицинскими знаниями; многие изменения происходят в позднем подростковом возрасте. Переход от подросткового возраста к взрослой жизни, возможно, выходит за возрастные рамки, связанные с конкретными классами заболеваний. Однако необходимость учитывать возраст по-разному для разных классов болезней была дополнительно продемонстрирована при рассмотрении возрастного распределения внутри каждого класса.Когда было визуализировано среднее значение для класса (рис. ), классы заболеваний четко различались с точки зрения их характерных возрастных диапазонов.

Различные классы болезней делят жизнь на разное количество возрастных кластеров. Проиллюстрированы возрастные кластеры для четырех классов заболеваний ( p значение < 0,05)

Возрастные изменения клинических параметров. a Распределение значений APK по 28 классам заболеваний. Для каждого класса болезней (90 167 столбцов 90 168) показаны медианные значения случаев по всем заболеваниям в этом классе и в этом возрасте. b Тепловая карта количества пациентов с аномальными значениями в зависимости от возраста и измерения крови (возраст от 12 до 80 лет). Эта тепловая карта была создана с использованием данных опроса NHANES (2007–2010 гг.)

. Мы дополнительно оценили группировку возрастов на основе аномальных показателей крови, полученных в ходе Национального обследования состояния здоровья и питания (NHANES) (см. «Методы»). Вкратце, в обзоре, среди прочего, представлены лабораторные измерения случайной выборки не госпитализированных жителей США.Мы рассчитали долю лиц в опросах 2007–2010 гг., у которых были аномальные значения, используя определения нормальных значений, предоставленные в опросе NHANES. Тепловая карта этих данных иллюстрирует, как разные аномальные показатели крови по-разному делят продолжительность жизни человека (рис.  ). Аномальные значения явно обогащаются в некоторых измерениях крови у пожилых людей в возрасте 67 лет и старше (I), у субъектов среднего возраста (II), а также у подростков и молодых людей (III).

Группировка болезней в соответствии с их возрастной структурой

Затем мы решили дополнительно продемонстрировать, что при старении и развитии происходят множественные процессы, обращая процесс, а именно используя иерархическую группировку болезней по возрасту.Мы предположили, что заболевания, которые регулируются сходными возрастными процессами, должны иметь схожие возрастные закономерности.

Несколько кластеров, созданных таким образом, демонстрируют тот факт, что эти кластеры, вероятно, представляют фактические биомедицинские знания, и предлагают новые ассоциации заболеваний. Подробно описаны два репрезентативных кластера (рис. ). Первый кластер (рис.  ) включает несколько заболеваний, связанных с детским возрастом (таких как краснуха, свинка, корь и хронический детский артрит), а также некоторые нейропсихологические расстройства (такие как расстройство тревоги разлуки, расстройство личности и расстройство речи). .Второй кластер (рис. ) показывает кластеризацию широкого спектра расстройств, начиная от паразитарных заболеваний, таких как шистосомоз и трихомониаз, до нервной анорексии и классической мигрени. Интересно, что ни один из кластеров не может быть хорошо описан существующими определениями возрастного диапазона. В первый кластер в основном входят люди в возрасте от 6 до 21 года, а во второй — в возрасте от 13 до 51 года.

Результаты иерархической кластеризации. a Филограмма и графическое представление группы заболеваний, пики которых, по литературным данным, приходится на детский и ранний подростковый возраст. b Филограмма и графическое представление группы заболеваний, о которых в литературе сообщается, что их пик приходится на поздний подростковый возраст и вплоть до среднего возраста. Графическое представление среднего скорректированного числа случаев по возрасту и заболеванию

Обсуждение

В этом исследовании для анализа данных, хранящихся в базе знаний Age-Phenome, использовалось несколько аналитических методов. Наша цель состояла в том, чтобы проверить две гипотезы: (1) что текущее определение возрастных диапазонов может быть уточнено путем изучения существующих знаний о связях между возрастом и заболеванием с помощью передовых методов анализа и (2) что возрастные группы зависят от контекста, так что разные биологические процесс разделить жизнь на разные диапазоны.

Чтобы проверить первую гипотезу, мы сначала показали, что с помощью простой стандартной методики данные APK отражают принятое в настоящее время медицинское определение возрастного диапазона. Это свидетельствует о том, что, несмотря на ограничения APK (Geifman and Rubin 2012), данные APK имеют достаточное качество, чтобы быть полезными. Допуская перекрывающиеся возрастные диапазоны, мы показываем, что можно определить новые, биологически значимые возрастные диапазоны. Действительно, используя метод кластеризации LDA, мы создали возрастные кластеры на основе взаимосвязей возраст-болезнь, как описано в APK.

Группировка возрастов на основе одновременного возникновения заболеваний с использованием метода мягкой кластеризации, а именно LDA, определила несколько возрастных интервалов, многие из которых имеют явное биологическое значение. Например, кластер, который включает возраст 76–98 лет, был тесно связан с такими заболеваниями, как болезнь Альцгеймера, деменция и болезнь Паркинсона, все из которых, как известно, имеют высокую распространенность на более поздних этапах жизни. С другой стороны, кластер, содержащий возраст от 0 до 16 лет, был тесно связан с известными детскими заболеваниями.Интересно, что LDA предполагает, что несколько возрастных заболеваний можно разделить на кластеры пожилых людей. Например, кластер 12 (возраст 66–86 лет) тесно связан с переломами шейки бедра, амнезией и стенозом артерий, тогда как кластер 13 LDA (возраст от 76 до 98 лет) тесно связан с нейродегенеративными заболеваниями, стираемостью зубов, возрастными изменениями. дегенерация желтого пятна, катаракта, ушибы и фрагментация ДНК. Эти результаты позволяют предположить, что в пожилом возрасте может происходить более одного процесса и что разные заболевания связаны с разными процессами.

Затем мы проверили гипотезу о том, что в основе старения и развития лежат множественные процессы и что количество различных возрастных диапазонов, которые следует учитывать, зависит от типа оцениваемого заболевания. Рассмотрев оптимальные возрастные рамки для разных классов болезней, мы показали, что разные типы болезней делят жизнь на разные промежутки времени. Более того, некоторые интервалы, определяемые кластеризацией конкретных классов заболеваний, в настоящее время, насколько нам известно, не используются для классификации возраста пациентов (например, возраст 43–51 год при рассмотрении бактериальной инфекции).Аналогичные результаты были получены путем группирования возрастов на основе аномальных показателей крови, показывая, что, как и в случае с различными классами заболеваний, различные аномальные показатели крови различаются числом возрастных диапазонов, которые они определяют. Более того, мы показываем, что кластеризация болезней на основе возрастных моделей объединяет родственные болезни. Наконец, анализ LDA позволил нам определить несколько перекрывающихся возрастных диапазонов, возможно, отражающих параллельные, но разные лежащие в основе процессы. В совокупности наши результаты позволяют предположить, что нынешнее универсальное разделение жизни (т.т. е., деление на детство, взрослость и т. д.), возможно, потребуется пересмотреть, и следует рассмотреть классификацию по конкретному заболеванию или процессу.

Иерархическая группировка болезней, в дополнение к демонстрации контекстно-зависимых возрастных закономерностей, позволила нам исследовать возможные связи между болезнями. Было обнаружено, что кластеры заболеваний полезны для создания новых гипотез о связях между заболеваниями, которые имеют сходные возрастные закономерности, полученные из литературы. Возьмем, к примеру, скопление гипофосфатемии и пульпита, показанное на рис.. Хотя между ними не обязательно существует причинно-следственная связь, есть доказательства, связывающие их через Х-сцепленную гипофосфатемию (XLH), Х-сцепленную доминантную форму рахита. Пациенты с XLH очень восприимчивы к кариесу и истиранию зубов, что приводит к бактериальной инвазии в пульпу зуба, что может привести к пульпиту (Su et al. 2007). Следует отметить, что кластеризация гипофосфатемии и пульпита не связана с тем, что оба они упоминаются в тех же рефератах PubMed, из которых были извлечены данные APK.Наоборот, схожая картина их появления с возрастом не зависит от этого.

Вторым примером, полученным на основе нашего подхода, является кластеризация переедания и двух паразитарных болезней, а именно шистосомоза и трихомониаза. Веские доказательства связывают паразитарные инфекции и недоедание. Роль иммунной системы как основного фактора ограничения и ликвидации паразитарной инвазии общеизвестна. Недоедание, которое, как известно, ослабляет иммунитет, приводит к снижению способности бороться с паразитарными инфекциями (Chandra 1984).По правде говоря, как недоедание, так и переедание могут привести к снижению иммунитета. Например, ожирение было связано с изменениями клеточного иммунитета (Самартин и Чандра, 2001). Следовательно, вполне вероятно, что переедание, которое может ослабить иммунную систему, может повысить восприимчивость к паразитарным инфекциям.

Эти два примера были выбраны, чтобы продемонстрировать, как наши результаты могут быть использованы для выдвижения гипотез относительно возможной связи различных заболеваний. Однако, учитывая огромное количество гипотез, которые можно вывести из этих кластеров, не все они равновероятны.Для нескольких заболеваний, объединенных в кластеры, нельзя было сформулировать четкой и прямой гипотезы. Например, нервная анорексия была связана с укусами человека и продолжительностью беременности (рис. ). Мы смогли найти некоторые исследования, которые связывают анорексию и продолжительность беременности: девочки, родившиеся недоношенными, более склонны к развитию анорексии в более позднем возрасте (Cnattingius et al., 1999), а женщины, страдающие анорексией, чаще рожают детей раньше срока (Ekeus). и др., 2006). Однако маловероятно, что анорексия и продолжительность беременности связаны с человеческими укусами.Таким образом, в то время как некоторые интересные гипотезы могут быть сгенерированы из наших результатов, другие могут оказаться бесценными.

Основываясь на наших результатах кластеризации, можно сделать дополнительные гипотезы о связи между заболеваниями. Например, поскольку краснуха и задержка полового созревания имеют сходную возрастную картину и, следовательно, были сгруппированы вместе, можно предположить, что между ними существует медико-биологическая связь. Такие возможные связи между заболеваниями, возникающие в результате кластеризации, должны быть дополнительно исследованы, чтобы сделать значимые выводы.

Основные недостатки этого исследования заключаются в его чувствительности к систематическим ошибкам. Поскольку наша база знаний в основном содержит данные, извлеченные из опубликованных статей, на нее может повлиять то, как клинические исследования воспринимают взаимосвязь возраста и болезни. Мы отмечаем, однако, что, поскольку эти представления оказывают сильное влияние на клиническую помощь, их улавливание само по себе является полезной целью. В то же время основная сила этой работы заключается в использовании нового подхода, основанного на данных, для создания гипотез о возрасте, что, возможно, приведет к новым направлениям исследований.Насколько нам известно, это первая попытка определения перекрывающихся возрастных диапазонов на основе методов извлечения знаний. В нашей стратегии используется новый ресурс знаний, а именно APK, вместе с передовыми методами анализа данных. Дальнейшие исследования с использованием улучшенных баз знаний и других клинических и биологических данных могут быть использованы для переопределения возрастных интервалов и обеспечения определения нескольких перекрывающихся возрастных диапазонов, которые зависят от контекста, но имеют клиническое и биологическое значение.

Методы

Количественная матрица возраст-болезнь

Для каждого заболевания, отображенного в базе данных APK, было получено количество случаев для каждого возраста. Доказательства, связанные с предполагаемыми возрастными диапазонами (например, вывод 0–50 из предложения «младше 50 лет»), были исключены. Матрица заболевания по возрасту была создана таким образом, что каждая ячейка содержала количество случаев, зарегистрированных для этого возраста (т. е. возраст 42 года имеет значение 22 в столбце атеросклероза, поскольку он связан с атеросклерозом в 22 случаях базы данных).Матрицу нормализовали путем деления клеток для каждого заболевания на общее количество случаев заболевания для контроля заболеваний, представленных в чрезмерной или недостаточной степени в литературе.

Группировка возрастов по совместному возникновению заболеваний

Для изучения возрастной кластеризации использовались три алгоритма кластеризации: алгоритм скрытого распределения Дирихле, алгоритм k-средних и алгоритм иерархической кластеризации.

LDA подробно описан Blei et al. (2003). Вкратце, LDA предполагает, что каждое наблюдение является вероятностным продуктом ряда лежащих в его основе процессов.В случае возрастов основным процессом является корреляция между возрастной группой и болезнью. Основываясь на наблюдениях (связь определенного возраста и заболевания), этот метод создает возрастные кластеры, представляющие основные процессы (возрастные группы), и учится соотносить каждое заболевание с лежащими в основе возрастными группами. Таким образом, метод присваивает вероятность того, что каждый возраст принадлежит к каждому возрастному кластеру, и другую вероятность того, что каждое заболевание связано с каждым кластером.

В этом исследовании мы использовали объединенный список всех возрастов во всех исследованиях, найденных для каждого заболевания в APK.Каждое заболевание описывается списком всех возрастов, связанных с этим заболеванием. «Рак почки», например, дважды связан с возрастом «14 лет» (т. е. возрастной диапазон в двух исследованиях включал 14-летних), «18 лет» один раз, «47 лет» трижды и т. д.

Мы обучили тематическую модель с использованием Mallet с оптимизацией гиперпараметров и числом кластеров, равным 25. Возрасты, связанные с каждым кластером, были выбраны так, чтобы включать все возрасты с вероятностью 0,01 или выше. Кластеры с низкой численностью (менее 1 %) были отброшены, как это было предложено Уоллахом и МакКаллумом (2009).Мы отметили наиболее вероятные возрасты в данном кластере как репрезентативные возрасты результирующего возрастного диапазона.

Для проверки результатов мы взяли часть данных и повторили анализ. Кластер считался надежным, если он имел эквивалентный кластер после выборки с использованием инструмента, разработанного для этой цели (Коэн и др., неопубликованные результаты; соответствующий код доступен на http://sourceforge.net/projects/topicmodelalig). /). Этот анализ был проведен с 80, 60 и 40 % данных.Более того, мы повторили анализ, установив количество кластеров равным количеству кластеров, полученных после удаления кластеров с низким содержанием.

Для кластеризации k-средних (Hartigan and Wong 1979) для изучения кластеров использовалась реализация в Matlab. Количество кластеров было выбрано эмпирически как число, дающее самый высокий средний силуэт (по расчетам с помощью Matlab).

Для иерархической группировки возрастов (Johnson 1967) использовалась реализация R (версии R 2.13.1).Онтология болезни использовалась для определения классов болезней путем выбора классов на три шага от корня и всех их дочерних элементов. Болезни были отфильтрованы таким образом, чтобы использовались только болезни, связанные как минимум с десятью возрастами, и только классы болезней, которые содержат более трех таких болезней. Полученные 28 классов болезней затем использовались для кластеризации каждого класса болезней отдельно путем извлечения подматрицы количественной матрицы возраст-болезнь, связанной с заболеваниями из этого класса, и применения иерархической кластеризации к этому подмножеству.Для выявления статистически значимых кластеров использовался пакет pvclust для R (Suzuki and Shimodaira 2006) со следующими параметрами: метод был установлен на «усреднение», альфа-переменная была установлена ​​на 0,95 (значение p  < 0,05) и количество загрузок было установлено на 1000. Из 28 классов болезней 24 имели возрастные кластеры, которые превышали статистический порог.

С помощью скрипта, реализованного в R, была создана тепловая карта медианных значений экземпляров по возрасту и классу заболевания.

Кластеризация болезней по возрастной сочетаемости

Иерархическая кластеризация (Johnson 1967) болезней была выполнена с помощью Expander 5 (Sharan et al. 2003) с использованием опции корреляции Пирсона для расчета расстояния.

Клинические данные

Получены данные исследования NHANES (2007–2010 годы). Используя данные анализа крови (химический анализ и общий анализ крови), мы создали матрицу данных следующим образом. Для каждого субъекта измерения интерпретировались как нормальные или ненормальные в соответствии с нормальными диапазонами, определенными в исследовании NHANES.Были выбраны субъекты в возрасте от 12 до 80 лет ( N  = 13493), учитывая, что большая часть измерений не проводилась для детей младше 12 лет. Матрица показателей крови по возрасту была создана таким образом, что каждая ячейка содержала долю пациентов этого возраста, у которых было аномальное значение для этого измерения.

Возрастная классификация

юниоров распределяются по возрастным группам в зависимости от их возраста на 1 сентября каждого года.

После того, как игрок участвует (включая, помимо прочего, тренировки, тренировки, посещение тренировок и/или соревнования) в клубной или университетской программе любого университета, колледжа, муниципального колледжа или младшего колледжа, он/она лишается права принимать участие в любые региональные и национальные программы, включая, помимо прочего, национальные квалификационные соревнования и чемпионаты JNC.

  • Подразделение 18 и ниже: игроки, родившиеся 1 сентября 2001 года или позже; или Игроки, родившиеся 1 сентября 2000 года или позже и учащиеся старших классов в двенадцатом (12-м) классе или младше в течение некоторой части текущего учебного года
  • .
  • Подразделение 17 и ниже: игроки, родившиеся 1 сентября 2002 г. или позже
  • Подразделение 16 и ниже: игроки, родившиеся 1 сентября 2003 года или позже
  • .
  • Категория 15 и ниже: игроки, родившиеся 1 сентября 2004 г. или позже
  • Подразделение 14 и ниже: игроки, родившиеся 1 сентября 2005 г. или позже
  • Подразделение 13 и ниже: игроки, родившиеся 1 сентября 2006 г. или позже
  • Подразделение 12 и ниже: игроки, родившиеся 1 сентября 2007 г. или позже
  • Подразделение 11 и ниже: игроки, родившиеся 1 сентября 2008 г. или позже
  • Подразделение 10 и ниже: игроки, родившиеся 1 сентября 2009 г. или позже
  • Подразделение 9 и ниже: игроки, родившиеся 1 сентября 2010 г. или позже
  • Категория 8 и ниже: игроки, родившиеся 1 сентября 2011 года или позже
  • .

Подразделение мальчиков до 14 лет: Команды мальчиков в возрастной группе до 14 лет, исключенные на региональном уровне, будут допущены к участию в национальных чемпионатах США среди юниоров, используя следующее определение возраста/класса:

  • Игроки, родившиеся 1 сентября 2005 г. или позже; или Игроки, родившиеся 1 сентября 2004 года или позже (15 лет и младше), которые не закончили и не учились в классе выше восьмого (8-го) класса в текущем учебном году.(Это исключение основано на чистой разнице в высоте от 7 футов 4 1/8 дюйма до 7 футов 11 5/8 дюймов между 14-м и младшим классом и 15-м и младшим классом.)

Примечание. Эти определения возраста используются в национальных клубных программах и НЕ совпадают с определениями возраста для международных и национальных программ High Performance.

подходят ли нынешние соревновательные возрастные группы?

Реферат:

Подбор участников юношеских видов спорта для обеспечения честности и безопасности соревнований является важной задачей спортивных федераций.В США по плаванию установлены 4 возрастные группы у мужчин и женщин в зависимости от хронологического возраста (CA): 10 лет и младше, 11–12 лет, 13–14 лет и 15 лет и старше. Из-за значительных различий в росте и статусе созревания среди подростков в пределах одной ЦА (Baxter-Jones, 1995; Malina & Beunen, 1996) объединение пловцов разного возраста в группы может не обеспечить честной конкуренции. Поскольку пловцы младшего возраста или поздно созревающие в возрастной группе физически отстают от своих более старших или не по годам развитых сверстников той же возрастной группы, действующая система возрастных групп может отбить у них желание продолжать соревновательное плавание.Кроме того, нет никакого исторического обоснования нынешней возрастной классификации США по плаванию. Цели исследования состояли в том, чтобы оценить текущую возрастную классификацию, применяемую плаванием США, и предоставить аналитическое обоснование в поддержку текущей или альтернативной возрастной группы. Время заплыва 100 лучших пловцов США среди женщин и мужчин для каждого возраста (от 5 до 20 лет) и группы от 21 года и старше (всего 17 отдельных возрастных групп для каждого пола) было получено через веб-сайт США по плаванию для 2005, 2006 и 2007 годы.Данные для каждого возраста были объединены за последние три года (2005–2007) и усреднены по семи видам плавания (50, 100 и 200 ярдов вольным стилем, 100 ярдов на спине, брассом и баттерфляем и 200 ярдов в индивидуальном плавании). попурри). ANOVA 17 × 2 × 7 (возраст × пол × событие) с апостериорным критерием Тьюки использовался для анализа различий во времени плавания между возрастами и для предложения альтернативных возрастных групп. Исследование выявило значительные возрастные различия в результативности плавания между каждым CA до 15 лет у женщин и 17 лет у мужчин для большинства видов спорта.Поскольку в текущих возрастных группах были различия в результатах плавания, стратификация пловцов на основе одного возраста может быть лучшим способом обеспечения справедливости и равенства в соревнованиях. Возрастные различия во времени плавания у мужчин проявляются позже, чем у женщин. Это может быть связано с половыми различиями во времени роста и созревания. Различия между полами усиливаются с возрастом, но в 7-летних и младше возрастных категориях значимых половых различий обнаружено не было. Таким образом, основываясь на результатах плавания, пловцам младше восьми лет нет смысла соревноваться в отдельных категориях у мужчин и женщин.

JMIR Общественное здравоохранение и надзор


Введение

Кампании общественного здравоохранения являются основным средством повышения осведомленности государственных учреждений и неправительственных организаций о важных проблемах здравоохранения, затрагивающих их сообщества. Проведение эффективных кампаний по просвещению в области общественного здравоохранения требует от организаций адаптации сообщений и обеспечения охвата, который находит отклик у их целевой аудитории. Например, Центр табачных изделий Управления по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA) разработал отдельные кампании по информированию общественности о последствиях употребления табачных изделий для здоровья подростков из групп риска []; молодые люди лесбиянки, геи, бисексуалы и трансгендеры []; мультикультурная молодежь []; сельские подростки мужского пола []; и взрослые курильщики [].С ростом потребления средств массовой информации и межличностных взаимодействий в Интернете платформы социальных сетей стали важными как для вовлечения целевой аудитории в общественные просветительские кампании, так и для понимания поведения и восприятия этих целевых аудиторий в отношении возникающих проблем общественного здравоохранения. Однако применение результатов анализа социальных сетей может быть затруднено, поскольку имеется ограниченная информация о том, кого представляют эти данные, и, следовательно, трудно получить информацию от интересующих групп населения.В области профилактики и борьбы против табака возможность сегментировать сообщения в социальных сетях по возрастным сегментам аудитории поможет исследователям и учреждениям общественного здравоохранения выявлять возникающие проблемы и изменения в поведении и отношении, чтобы облегчить надзор за общественным здравоохранением и просветительскую работу с этими группами риска. . Это позволило бы исследователям естественно наблюдать за своей целевой аудиторией и тем, как они взаимодействуют с обсуждением табачных изделий. В этом исследовании представлена ​​модель, разработанная для классификации пользователей популярного сайта социальных сетей Reddit на тех, кто с большей вероятностью будет старше или моложе 21 года.Эти возрастные категории отражают федеральный минимальный возраст для покупки табачных изделий в Соединенных Штатах, который был изменен с 18 до 21 года [].

Reddit — это публичная сеть онлайн-сообществ, организованных вокруг интересов людей. По состоянию на 2019 год примерно 11% взрослых в США используют Reddit, а платформу используют примерно 22% взрослых в США в возрасте от 18 до 29 лет []. В отличие от других платформ социальных сетей, таких как Twitter, которые ограничивают длину сообщений, Reddit был разработан для длинных записей, что позволяет пользователям предоставлять гораздо более подробные сведения в своих сообщениях.Кроме того, Reddit, как и традиционные форумы, позволяет пользователям отвечать на размещенные материалы в виде цепочек комментариев. Такое сочетание более длинного сообщения и заинтересованной пользовательской базы способствует активным и детальным дискуссиям по множеству тем, имеющих отношение к сообществу общественного здравоохранения. В последние годы исследователи использовали данные Reddit, чтобы понять возникающие проблемы общественного здравоохранения, включая употребление каннабиса [-], опиоидов [,] и алкоголя [,].

Недавние исследования использовали Reddit для изучения использования несовершеннолетними электронных систем доставки никотина.Бретт и др. [] провели контент-анализ сообщений Reddit, чтобы определить, как пользователи Reddit воспринимают использование Juul несовершеннолетними. Zhan et al [] закодировали разговоры о молодежи с помощью Juul в ныне запрещенном сабреддите UnderageJuul. Для исследований, посвященных использованию электронных систем доставки никотина несовершеннолетними, авторы использовали текстовые индикаторы в сообщениях или возраст сообщества субреддита в качестве косвенных признаков для идентификации разговоров среди молодежи. Тем не менее, не все, кто публикует сообщения в сабреддитах, таких как UnderageJuul, вероятно, являются молодежью, и вполне вероятно, что молодежь ведет разговоры о вейпинге в других сообществах Reddit за пределами конкретных сабреддитов электронных систем доставки никотина.По этим причинам необходим более широкий подход для выявления молодежи, обсуждающей электронные системы доставки никотина в сообществах Reddit.

Один из способов выявить разговоры подростков об электронных системах доставки никотина — это изучить характеристики поведения пользователей Reddit при размещении сообщений, найти закономерности, отличающие подростков от взрослых, и разработать алгоритм для прогнозирования возраста пользователей Reddit. Прогнозирование скрытой демографии пользователей в социальных сетях является популярной областью исследований, и исследователи разрабатывают модели для вывода таких категорий, как пол [-], возраст [-], раса и этническая принадлежность [-] и политическая ориентация [-].В частности, модели скрытых атрибутов, обученные на данных Reddit, становятся все более популярными, а модели для определения геолокации [], пола [] и состояния психического здоровья [,] недавно были опубликованы.

Цель этого исследования заключалась в разработке алгоритма прогнозирования возраста для классификации пользователей Reddit как подростков или взрослых на основе общедоступных данных, чтобы создать инструмент, который позволил бы проводить более детальный анализ дискуссий о табаке, происходящих на Reddit. Это позволило бы сравнивать обсуждения взрослых и подростков.Наша работа расширяет литературу, разрабатывая модель с возрастными категориями, значимыми для широкой аудитории общественного здравоохранения.


Методы

Этика

Это исследование проводилось в период с января по сентябрь 2020 года. Было установлено, что исследование не включало в себя исследования с участием людей, как это определено в 45 CFR 46 Международной экспертной комиссией RTI (STUDY00021174) и FDA. Комитет по исследованиям с участием людей (2020-CTP-129).

Выявление самоотчетов о возрасте на Reddit

Для разработки контролируемых моделей классификации требуются наземные наблюдения, помеченные интересующим результатом.Чтобы узнать возраст пользователей Reddit, мы использовали платформу данных социальных сетей (Brandwatch) для выявления общедоступных сообщений или комментариев Reddit, в которых пользователи самостоятельно сообщали о своем возрасте. Brandwatch — это безопасная платформа облачных вычислений, доступная только для зарегистрированных пользователей, и извлекаемые данные не содержат личной информации, кроме общедоступного имени пользователя. Извлеченные данные хранились на защищенных внутренних серверах, и не было предпринято никаких попыток связать имена пользователей с отдельными лицами. Мы искали сообщения Reddit на английском языке с фразой «Я <возраст>», которые были опубликованы в период с 1 по 31 декабря 2019 года.В литературе аналогичные подходы использовались для создания больших наборов данных Reddit, содержащих демографические данные, о которых сообщают сами люди [-]. Нас интересовали молодежный (13-17 лет), молодой взрослый (18-20 лет) и взрослый (21-54 года) возрастные сегменты. Для молодежного сегмента поисковым запросом был «Мне 13» ИЛИ «Мне 14» ИЛИ «Мне 15», ИЛИ «Мне 16» ИЛИ «Мне 17». Аналогичная стратегия использовалась для определения должностей для молодых взрослых (18-20 лет) и взрослых (21-54 года) возрастных категорий. Верхний возрастной диапазон был выбран в соответствии с возрастным диапазоном целевой аудитории для кампаний FDA, а возрастной диапазон для молодых и средних возрастных диапазонов был выбран для отражения предыдущего (18 лет) и текущего (21 год) минимального возраста для продажи табачных изделий. В Соединенных Штатах.Пул запросов включал как исходные материалы, так и комментарии к сообщениям, чтобы максимально увеличить вероятность идентификации пользователей, сообщающих о своем возрасте.

Мы просмотрели результаты поиска и предприняли несколько шагов по очистке данных, чтобы подготовить файл данных для ручного кодирования. Во-первых, мы вручную просмотрели извлеченные сообщения и обнаружили, что в некоторых из них использовались фразы «Я <номер>», не относящиеся к возрасту, такие как «Я готов на 50%» или «Мой рост 5 футов». Чтобы исключить эти сообщения, мы удалили все сообщения, в которых мы не смогли найти фразу «Я <номер>», за которой следует пробел или знак препинания.Во-вторых, сообщения из сабреддитов, помеченных в списке сабреддитов Reddit как «непригодные для работы» или «непригодные для жизни», были исключены, чтобы защитить кодеров от конфиденциального или вредоносного контента. Наконец, если пользователь опубликовал несколько раз в течение наблюдаемого периода времени, мы включили только самую последнюю публикацию.

Ручная маркировка возраста из сообщений Reddit

Сообщения для каждого возрастного диапазона были импортированы в приложение для аннотаций SMART [] для кодирования. Мы обучили 3 программистов методам кодирования и использованию платформы SMART.Все кодеры закодировали одну и ту же тестовую выборку из 30 постов или комментариев для всех возрастных групп. Между кодировщиками наблюдалась высокая межэтническая надежность: нескорректированное процентное согласие 82% и коэн κ = 0,867. Основываясь на уровне согласия для этой выборки из 30 постов или комментариев, полное кодирование проводилось независимо.

Кодировщики вручную проверяли и помечали в сообщениях возраст, о котором сообщали сами, пока не достигали не менее 625 случаев в каждой из целевых возрастных категорий. Мы нацелились на 625 помеченных случаев, чтобы иметь не менее 500 помеченных случаев на возрастную категорию для обучения и перекрестной проверки алгоритма (80%) и 125 помеченных случаев на возрастную категорию для окончательного набора тестов (20%).В , мы сообщаем окончательное количество сообщений, кодированных по возрасту, а также количество сообщений, исключенных из-за того, что они не были релевантными или возраст невозможно было определить.

Таблица 1. Количество постов Reddit, помеченных вручную по возрастным категориям (декабрь 2019 г.).
55

1 категория

Все возрасты

0

13-17 лет
Кодированные сообщения или комментарии
2156
683
18-20 лет 642
21-54 лет 831
Исключенные
Невозможно определить возраст 252
не применимо 154

a Мы исключали сообщения, если невозможно было определить возраст (например, предоставленное число не связано с возрастом; указано несколько возрастов; другой язык) или если сообщение не было релевантным (например, пользователь прямо заявляет, что он за пределами Соединенных Штатов; с одноразовых счетов).

Первоначально мы планировали смоделировать 3 отдельные возрастные категории (13–17 лет, 18–20 лет и 21–54 года), собрав почти сбалансированный помеченный набор данных наблюдений в трех диапазонах интереса; однако после неоднократных экспериментов с моделью трех возрастных категорий правильная категоризация участников среднего диапазона (18–20 лет) по-прежнему была затруднена, и участников часто неправильно характеризовали как принадлежащих либо к молодому, либо к старшему возрастному диапазону. Учитывая плохие показатели по этому возрастному диапазону и недавнее повышение в США федерального возрастного порога (с 18 лет до 21 года), ниже которого осуществляется продажа табачных изделий, мы обвалили молодых (13-17 лет) и средних (18-17 лет) 20 лет) категории в единую категорию (13-20 лет).Последствия этого решения включены в Обсуждение.

Сбор метаданных на уровне пользователя, отправки и комментариев для учетных записей пользователей Reddit, помеченных вручную. и метаданные уровня комментариев с использованием интерфейса прикладного программирования (API) Reddit. API — это интерфейс, который получает запросы данных или услуг от внешних программ и отправляет ответы.API Reddit позволяет зарегистрированным приложениям иметь ограниченный доступ к метаданным Reddit.

Для каждого пользователя Reddit мы собрали его метаданные на уровне пользователя, которые включали свойства их учетной записи, такие как год ее создания и их статус в Reddit. Никакая личная информация, такая как демографические данные пользователя или его местоположение, не доступна через Reddit API. Некоторые пользователи Reddit удалили свои учетные записи, так как мы впервые определили их пост, связанный с возрастом; поэтому мы не смогли собрать их информацию.Для пользователей Reddit с активными учетными записями мы собрали поля метаданных до 100 их последних материалов и до 100 их последних комментариев. В тех случаях, когда у пользователя Reddit не было 100 материалов или комментариев, мы собирали столько, сколько было доступно. Материалы и комментарии до 2019 года были исключены из анализа, чтобы предотвратить влияние значительно более старых сообщений, которые могли быть опубликованы, когда пользователь находился в более молодой возрастной категории, а 85 учетных записей были исключены из анализа, поскольку они были закрыты или удалены между первоначальный сбор сообщений о возрасте, о которых сообщают сами, и вызовы API для сбора информации о пользователях.

API Reddit предоставляет подробные поля метаданных для каждого профиля пользователя, отправки и комментария. Reddit API возвратил 50 полей метаданных для каждого профиля пользователя, 12 855 полей метаданных для каждой отправки и 322 поля метаданных для каждого комментария, всего 13 227 полей метаданных для каждой учетной записи. Хотя API Reddit возвращает множество полей данных, не все они были полезны для обучения алгоритма. Во-первых, мы исключили поля метаданных, в которых отсутствовало 95 % или более данных (n = 7888) или не содержались варианты (n = 5180).Во-вторых, мы исключили поля метаданных, связанные с внешним видом страницы, например цветом текста или шириной видео (n = 28). В-третьих, мы исключили несколько сложных типов данных с высокой кардинальностью (т. е. очень редких или уникальных), таких как изображения, HTML и URL-адреса (n = 44).

Переменные для прогнозирования возраста

Поля, которые мы исследовали для прогнозирования возраста пользователей Reddit, включали сводную статистику полей метаданных из API и другие производные переменные, которые могут помочь отличить подростков от более старших возрастных групп (например, частота субреддитов, использование смайликов, уровень чтения текста).В общей сложности мы перешли к этапу моделирования с 1523 переменными. предоставляет сводку по созданным группам переменных, а также подсчеты и примеры из каждой группы.

Таблица 2. Переменные для моделирования возраста пользователей Reddit в обучающей выборке, полученные на основе комментариев, сообщений и пользовательских данных, собранных для пользователей, чей возраст был подтвержден путем ручной маркировки.
55

0

0

0

Primeable Group Metadata используются Пример Переменные (N = 1523), N
Сводка Статистика Все Median Post Ball 189
Частоты подсобрада Сообщений и комментариев Частота Пользователь размещены в «Подростки» Subreddit 624 624
Emoji частоты Комментарии Частота «» из Emojis, используемые пользователем 101
Литературные характеристики Сообщений и комментариев Среднее значение flesch чтение легкость 28
Узоры в размещении Сообщений и комментарии Процент пользователей, которые были видео 42
Срок использования Комментарии TF-IDF a балла за термин «школа» 90 050 539 b

a TF-IDF: термин частота – обратная частота документа.

b Количество терминов TF-IDF варьировалось в разных сгибах перекрестной проверки в зависимости от словаря комментариев и представлений, присутствующего в обучающей части каждого сгиба. Представленное здесь значение представляет собой количество функций TF-IDF при расчете текста из полного обучающего набора.

Сводная статистика полей метаданных из Reddit API

Первый набор переменных, полученных для прогнозирования возраста, был создан непосредственно из числовых и категориальных полей метаданных.Поля, сообщающие об атрибутах на уровне пользователя, использовались напрямую, тогда как поля для представлений или комментариев были получены из агрегирования представлений или комментариев для каждого пользователя. Для каждого числового поля комментария или представления, такого как «ups» (количество голосов за сообщение), мы получили переменные для суммирования их среднего значения, стандартного отклонения, медианы, первого квартиля и третьего квартиля. Для бинарных полей мы рассчитали долю комментариев или представлений, для которых значение поля было равно 1. В результате получилось 189 переменных сводной статистики.

Переменные, полученные для помощи в различении возрастных групп

В дополнение к использованию полей, непосредственно доступных из Reddit API, мы получили дополнительные переменные, чтобы помочь различать возрастные группы, такие как частота субреддитов, частота смайликов, литературные характеристики, шаблоны публикации и термин использование в комментариях. В общей сложности было 624 производных частотных переменных субреддита, 101 частотная переменная эмодзи, 28 литературных характеристических переменных (14 для текста комментариев, 14 для текста отправки), 42 переменные шаблона публикации и 539 переменных использования терминов.

Учитывая важность текстовых признаков в моделировании предыдущей возрастной классификации для социальных сетей [], для этих наборов переменных предоставляется более подробная информация. В качестве первого набора мы обратились к общепризнанному исследованию постов в Facebook, проведенному Всемирным проектом благополучия (WWBP) в Пенсильванском университете. В WWBP [] ранее были определены термины, которые чаще всего использовались людьми в 1 из 4 возрастных диапазонов (13–18 лет, 19–22 года, 23–29 лет, >30 лет). Чтобы включить эту информацию, каждый комментарий Reddit был разделен на уникальные слова (униграммы), соседние слова (биграммы) и триплеты соседних слов (триграммы).Для каждого из списков терминов возрастной группы WWBP была создана переменная путем подсчета того, сколько раз термин из списка присутствовал в комментарии пользователя, разделенного на общее количество n-грамм в комментариях этого пользователя.

Во втором наборе полей использовалось текстовое представление термина «частота-обратная частота документа» (TF-IDF), которое придает больший вес терминам, часто используемым в текстовом документе, но редко используемым в других документах. Чтобы построить эти переменные, мы сначала очистили текст комментария от английских стоп-слов, включая множество предлогов, союзов и местоимений.Хотя эти термины важны для грамматики английского языка, они обычно менее важны, когда есть необходимость различать различия в использовании языка между интересующими группами. Затем мы лемматизировали каждое слово, сводя спряженные слова к их основам (например, лемма о последовательности есть последовательность ), чтобы лучше распознавать повторное использование терминов в разных спряжениях. Наконец, мы удалили все цифры из текста комментария, чтобы избежать терминов самоотчета о возрасте, которые с большей вероятностью встречаются в нашей выборке, чем в более широкой популяции Reddit.Из этого обработанного текста мы рассчитали оценку TF-IDF для каждой униграммы, биграммы или триграммы от 0,25% до 90% пользователей в своих комментариях. Значения TF-IDF были получены только из данных, используемых для обучения, либо независимо для каждой перекрестной проверки на обучающем наборе для настройки гиперпараметров и выбора модели, либо на полном обучающем наборе для окончательного сравнения с тестом. задавать. Это привело к примерно 539 переменным при применении к полной обучающей выборке.

Обучение модели

Чтобы оценить достоверность наших выводов, мы разделили данные на обучающую и тестовую выборки, используя разделение 80/20.Выборки стратифицированы по возрастным группам, чтобы обеспечить одинаковые пропорции возрастных групп в обучающей и тестовой выборках. Мы выполнили 5-кратную перекрестную проверку на обучающем наборе, чтобы выбрать соответствующие гиперпараметры и выполнить выбор модели, чтобы предотвратить переоснащение тестовых данных.

Метрики оценки модели

Для оценки производительности модели мы использовали площадь под кривой рабочих характеристик приемника (AUROC), точность, полноту и показатель F1 () для оценки различных аспектов прогнозов.Все метрики находятся в диапазоне от 0 до 1, и при прочих равных более высокое значение указывает на лучшую производительность модели.

Выбор модели

Мы оценили несколько алгоритмов классификации с различными базовыми допущениями для возраста модели. В частности, мы запускали варианты следующих методов, используя sklearn [] фреймворк машинного обучения в Python (Python 3.7): логистическая регрессия с регуляризацией [], метод опорных векторов [], k -ближайший сосед [], случайный лес [] , и деревья с градиентным усилением [].Тестирование нескольких моделей мотивировано вариантом теоремы «Нет бесплатных обедов», в которой говорится, что нет теоретических гарантий того, что какой-либо один алгоритм машинного обучения будет работать лучше всего для всех задач, неявно продвигая эмпирический подход к выбору модели для обучения с учителем.

Выбор функций

Помимо разработки модели с высокой прогностической эффективностью, мы также стремились создать интерпретируемую модель, которая упрощает диагностику ошибок. Чтобы помочь разработать удобную модель, которая смягчает влияние зашумленных функций, мы выполнили весь соответствующий выбор функций [], используя метод Boruta [] в Python.Выбор всех соответствующих признаков направлен на поиск всех признаков, связанных с решением о классификации, в отличие от задачи минимального оптимального выбора, которая направлена ​​​​на предоставление компактного набора признаков, имитирующих оптимальный классификатор. Для нашей реализации мы использовали 100 итераций и α = 0,05.

Важность признаков

Чтобы лучше понять, какие признаки способствовали предсказаниям модели, мы рассчитали показатели важности признаков перестановки [,] для каждого признака в модели. Важность функции перестановки — это увеличение ошибки прогнозирования модели после перестановки функции при сохранении всех остальных функций постоянными.Случайное перетасовывание значений функции эффективно разрушает связь между измененной функцией, другими функциями и результатом. Более высокий балл указывает на то, что модель в значительной степени полагается на эту функцию для получения точных прогнозов, поскольку изменение этой функции соответствует значительному падению производительности модели. Одно предостережение при интерпретации оценок важности перестановок заключается в том, что сообщаемый вклад отдельных признаков может быть неточным, если признаки сильно коррелированы.Мы построили матрицу корреляции признаков, чтобы проверить это условие, и не обнаружили высокой мультиколлинеарности между любыми из оставшихся признаков (рисунок S1 в). Перестановки для каждого признака повторялись 5 раз, и сообщалось о среднем значении и стандартном отклонении.

Хотя важность признаков перестановки может помочь нам понять, какие переменные вносят наибольший вклад, она не дает информации о том, как эти признаки различаются в разных возрастных группах. В качестве окончательной оценки мы рассчитали средние значения, доверительные интервалы и 2-выборочные t сравнений тестов для каждого преобразованного признака в окончательной модели.Признаки были преобразованы до расчета средних значений, интервалов и проверки гипотез, поскольку визуальный осмотр распределений показал, что предположение о нормальности для теста t с двумя выборками не будет выполнено для большинства ковариат. К каждому признаку было применено квантильное преобразование, чтобы сделать выборку более похожей на нормальное распределение Гаусса. Это одномерное преобразование сначала оценивает кумулятивную функцию распределения переменной до равномерного распределения, а затем сопоставляет значения с желаемым выходным распределением (т. е. с нормальным распределением) с использованием связанной функции квантиля.


Результаты

Выбор модели

обобщает результаты модели перекрестной проверки обучающего набора для каждого алгоритма классификации. В представленных результатах используются наиболее эффективные значения гиперпараметров каждого алгоритма, обнаруженные во время настройки гиперпараметров. Модель с наивысшим общим баллом F1 представляет собой дерево с градиентным усилением (среднее значение 0,77, стандартное отклонение 0,03), за которым следует случайный лес (среднее значение 0,75, стандартное отклонение 0,03) и машины опорных векторов (среднее значение 0,74, стандартное отклонение 0,04). Модель k -ближайшего соседа в целом имела самую низкую оценку F1 (в среднем 0.59, SD 0,04) рассматриваемых моделей. Деревья с усилением градиента были выбраны как наиболее подходящий алгоритм для этой задачи моделирования из тех, которые оценивались на основе их общего более высокого среднего значения перекрестной проверки и сопоставимого стандартного отклонения для оценок F1 для разных моделей.

Таблица 3. Производительность классификатора для прогнозирования возраста пользователей Reddit, отмеченных вручную, на основе полного набора производных переменных. 5 5

8 Age Group 1 B

0

0

K – Изрезывает соседей

0

0

0

0

0

0

0

0

0

Точность, среднее (SD) Напомним, означают (SD) F1 Оценка, среднее (SD) AUROC A , среднее (SD) Опора, n
Случайный лес
90.5 лет 90.5 90-2049 90-204975 (0,04) 0,91 (0,01) 0,82 (0,02)
202
202
21-54 (0,03) 0,79 (0,03) 0.53 (0,04) 0.63 ( 0,03) 128
(0,03) 0.83 (0,02) 331
331
13-20 лет 0.65 (0,04) 0,98 (0,01) 0,78 (0,03) 202
21-54 лет 0,84 (0,04) 0,18 (0,04) 0,29 (0,05) 128 128
(0,04) 0.75 (0,03) 0.75 (0,03) 331
331
Поддержка вектор

7
13-20 лет 0.75 (0,04) 0,89 (0,03) 0.82 (0,03) 202
202
21-54 (0,06) 0,54 (0,05) 0,63 (0,04) 128

0

0,74 (0,04) 0.83 (0,02) 331

8

0

7

7
13-20 лет 0.79 (0.04) 0,85 (0,02) 0.82 (0,02) 202
21-54 лет 0,74 (0,05) 0,64 (0,04) 0,68 (0,03) 128 128

0

0,77 (0,03) 0.84 (0,02) 331
331

A AUROC: площадь под ресивером Операционные характеристики кривой.

b Недоступно или неприменимо.

Выбор признаков

Выбор всех соответствующих признаков сократил количество признаков с 1523 до 15 (), в результате чего модель с сопоставимой прогностической эффективностью (оценка F1 0,78) была уменьшена до модели с включенными всеми переменными (оценка F1 0,79).

В качестве окончательной диагностической проверки была запущена взвешенная версия сокращенной модели для оценки влияния несбалансированных размеров выборки категорий исходов, введенных коллапсирующими возрастными группами. Версия моделей с корректировкой весов и без нее работала сопоставимо, что позволяет предположить, что дисбаланс классов не оказал существенного влияния на результаты модели (таблица S1 на ).

Таблица 4. Производительность модели на тестовом наборе для прогнозирования возрастной группы пользователей Reddit с использованием классификатора деревьев с градиентным усилением со всеми функциями по сравнению с выбранными функциями.
5 5 1 A 2

0

8 Модель со всеми функциями (1523 Особенности)

0

0

1 Снижение модели с выбранными функциями (15 особенностей)

7

8 Age Group
Precision Recall F1 Оценка AUROC AUROC
, N
13-20 лет 0.81 0.87 0.84 – 9004 254

0

21-54 лет 0,77 0.67 0.72 161
Общая 0.79 0.87 415
415

7
13-20 лет 0.79 0.89 0.84 254

0

0

0,78 0.63 0,70 161
Общая 0,78 0,86 415

a AUROC: площадь под кривой рабочих характеристик приемника.

b Недоступно или неприменимо.

Важность признаков

показывает оценки важности признаков перестановки для каждой переменной в модели. Из категорий объектов наибольшее количество (n = 7) было получено из терминов, используемых в тексте комментария (веса TF-IDF для «дома», «похоже», «нужно», «школа» и «полностью»; частота использования набора слов WWBP от 23 до 29, нормализованное количество используемого набора слов WWBP от 23 до 29). Три характеристики описывают использование сабреддита (доля комментариев и постов в r/teenagers , доля комментариев и постов в r/новости , 75-й процентиль подписчиков для сабреддитов, в которых размещены сообщения), а еще 3 характеризуют литературный стиль пользователя при комментировании ( средний индекс Коулмана-Ляу для комментариев, количество предложений на комментарий, доля комментариев пользователей, размещенных в теме, которую они начали).Только 2 функции были получены из информации об учетной записи пользователя, которая не требует сбора дополнительных сообщений или комментариев (год создания учетной записи, пожизненная карма комментариев).

Наиболее важной характеристикой модели было количество предложений в одном комментарии (оценка: среднее значение 0,100; стандартное отклонение 0,004). Наименее важной характеристикой является доля сообщений и комментариев пользователя в сабреддите r/news (оценка: среднее значение 0,017; стандартное отклонение 0,002). Хотя на текстовые функции приходится наибольшее количество релевантных переменных, функции в категориях показывают высокую важность функций.

‎Рисунок 1. Оценка важности функции перестановки для основных переменных в сокращенной модели для прогнозирования возраста пользователей Reddit. На этом рисунке

показано, как наиболее важные характеристики различались в разных возрастных группах. Средние значения для всех переменных существенно отличались, за исключением веса TF-IDF для «школы», который демонстрировал всплеск при 0, который квантильное преобразование не могло должным образом объяснить. В таблице S2 представлены дополнительные непараметрические результаты для обнаружения различий в выборочных распределениях (критерий Манна-Уитни U и тест Колмогорова-Смирнова), которые не сравнивают выборочные средние значения и на которые меньше влияет, если выборочные преобразования не соответствуют норме; результаты обоих тестов позволяют предположить, что распределения веса TF-IDF для переменной «школа» были статистически разными () между подростками и взрослыми в нашей выборке.

Для основных переменных, определенных перестановками признаков, при сравнении возрастной группы от 13 до 20 лет члены старшей возрастной группы, как правило, использовали большее количество предложений в одном комментарии (21–54 года: μ = 0,37; 13– 20 лет: μ = –0,43), более высокий средний индекс комментариев Коулмана-Ляу (21–54 года: μ = 0,08; 13–20 лет: μ = –0,25) и более высокая карма комментариев (21–54 года: μ = 0,30; 13-20 лет: μ=–0,19). Аналогичным образом, по сравнению с возрастной группой от 21 до 54 лет, члены младшей возрастной группы от 13 до 20 лет, как правило, создали учетную запись позже (21–54 года: μ=1.35; 13–20 лет: μ=2,96), имеют более высокую долю материалов и комментариев в сабреддите r/teenagers (21–54 года: μ=–5,11; 13–20 лет: μ=–3,49) и больше в сабреддитах с большим количеством подписчиков (21–54 года: μ = 0,33; 13–20 лет: μ = –0,14).

Таблица 5. Сравнение возрастных групп для наиболее эффективных переменных (по важности признаков перестановки). 5 5

0

0

4 R / подростки .02

9003

0

0

0

, -2.71)

0

Переменная Тип Тип Возраст 13-20 лет (N = 1014), средний A (95% CI) Возраст 21-54 лет (n = 643) A (95% CI)

4 T statistic ( DF )

P Значение
Предложения на комментарии Литературные характеристики -0.43 (-0.52, -0.35) 0,37 (0,27, 0,46) -12.12.31 (1489.89) <.001
лет Счета создана Сводка Статистика 2.96 (2.79, 3.14) 1.35 (1.10, 1.59) 10.65 (1272.76) <.001 <.001
Доля Пользовательских постов или комментариев Частоты подчинения -3.49 (-3.67, -3.31) – 5,11 (-5,17, -5,05) 16.69 (1208.10) . (1276.15) .02
Средний комментарий Колман Ляу индекс Литературные характеристики -0.25 (-0,34, -0,16) 0,08 (-0,01, 0,17) -5.06 (1571.31) .001
Комментарий карма Сводная статистика −0.19 (-0.25, -0.13) 0,30 (0,22, 0,38) -9.85 (1309.14) <.001
TF-IDF B Вес для «Школа» Срок использования – 2,46 (-2.65, -2.27) -2.63 (-2.86, -2.40) 1.14 (1406.18) .25 .25
.25
Частота WWBP C 23-29 Сломок Word Используется Срок использования -1,23 (-1,39, -1,08) -0,05 (-0,20, 0,10) -10,97 (1592.33) <.001
TF-IDF Вес для «Нужен» Срок использования -1.58 (-1.75, -1.41) -0.31 (-0,48, -0,15) -10.48 ( 1577.27) . 1569.17) <.001
Доля комментариев, размещенных в теме, начатой ​​пользователем Сводная статистика −0.74 (-0.90, -0.57) -1.41 (-1.62, -1.20) 4.95 (1366.37) <.001
TF-IDF Вес для «выглядит как» срок использования – 3.04 (-3.22, -2.86) -1.84 (-2.08, -1.61) -785 (1327.70) <.001
TF-IDF Вес для «Главная» Срок использования – 3.45 (-3.62, -3.28) -1.89 (-2.14, -1.65) -10) -10.24 (1252.67) <.001
TF-IDF Вес для «Всего» Срок использования – 4.23 (-4.37, -4.09) -2.95 (-3.19, -2.71) -8.92 (1092.36) <.001
Доля пользовательских постов или комментариев в R / Новости Subreddit Частоты -5.03 (-5.10, -4.97) -4.29 (-4.48, -4.11) -7.38 (810,43) (810,43) <.001

A Кванльный трансформированные средства.

b TF-IDF: частота термина – обратная частота документа.

c World Well-Being Project


Обсуждение

Основные результаты

комментарии для определенных возрастных групп. Эту классификационную модель можно использовать для более качественного анализа проблем общественного здравоохранения в цифровом пространстве Reddit. Наши результаты показывают, что несколько разных компонентов пользовательских данных Reddit помогают различать пользователей в возрасте от 13 до 20 лет и от 21 до 54 лет.Соответствующие особенности текста предполагают, что возрастная группа подростков обычно использует в своих комментариях язык, который соответствует ожидаемым действиям, и фразы, часто ассоциируемые с младшими возрастными когортами. Например, возрастная группа подростков в среднем чаще использовала термин «школа» и реже использовала термин «дом», чем взрослая возрастная группа. Это, пожалуй, наиболее заметно в переменных набора терминов WWBP 23–29; Было обнаружено, что как необработанная частота, так и нормализованные версии этих переменных релевантны и более тесно связаны со взрослой возрастной группой.

Что касается субреддитов, подростковая возрастная группа в среднем чаще размещала сообщения в r/teenager и реже в r/news , чем старшая возрастная группа. Они также, как правило, размещают сообщения в сабреддитах с большим количеством подписчиков по сравнению со старшей возрастной группой. Это может указывать на то, что популярные сабреддиты популярны, потому что в них много пользователей-подростков, учитывая, что общая пользовательская база Reddit смещена в сторону молодежи []. Подростковая возрастная группа, как правило, давала более короткие комментарии, чем взрослая возрастная группа.Молодые пользователи также, как правило, имеют более высокую долю комментариев, размещенных в теме, которую они начали. С точки зрения характеристик учетных записей, подростковая возрастная группа, как правило, имеет учетные записи пользователей, которые были созданы совсем недавно, а также имеют более низкую карму комментариев. Эта взаимосвязь подтверждает интуицию о том, что у молодых пользователей из-за их возраста было меньше возможностей накопить долгое пребывание в Reddit и комментировать карму, чем у пользователей старшего возраста.

Во всех категориях объектов в окончательной модели была представлена ​​хотя бы одна переменная, за исключением «смайликов» и «шаблонов в публикациях».Хотя мы ожидали, что пользователи Reddit разных возрастных групп предпочтут использовать смайлики, более тесно связанные с их текущим жизненным этапом (например, более частое использование смайликов «школа» или «рюкзак» для более молодых пользователей), наши результаты не подтвердили этот вывод. . Предыдущее исследование показало, что количество эмодзи, публикуемых в общедоступных обновлениях статуса Facebook, уменьшается с возрастом пользователя [,]. Кроме того, результаты веб-опроса об использовании смайликов также подтверждают связь между использованием смайликов и возрастом: более молодые участники чаще используют как смайлики, так и смайлики, имеют более позитивное отношение и больше мотивов для их использования, чем их более старшие коллеги [].Аналогичным образом, несмотря на то, что в предыдущих исследованиях было установлено, что определенные шаблоны публикаций пользователей связаны с возрастом, ни одна из наших переменных из этой группы не оказалась релевантной. Например, Розенталь и МакКаун [] обнаружили, что наборы переменных, состоящие из лексических стилистических характеристик (например, количество URL-адресов и ссылок на изображения), позволяют предсказать возрастные группы в LiveJournal. Хотя большинство исследований, прогнозирующих возраст пользователей социальных сетей, согласны с тем, что текстовые функции являются важным сигналом, будущие исследования могут помочь оценить, какие другие типы функций имеют тенденцию быть более устойчивыми на платформах социальных сетей.

Наши результаты дополняют данные, опубликованные в литературе по предсказанию возраста в социальных сетях, и расширяют результаты исследований, доступных на Reddit. Де Прил [] проанализировал 2 сообщества субреддита, в которых пользователи регулярно сообщают о своем возрасте для советов по отношениям ( r/relationship_advice ) и для встречи с другими пользователями Redditors ( r/r4r ), и изучил модели поведения пользователей, публикующих сообщения, чтобы предсказать 2 возрастные категории ( <24 лет или >24 лет для r/r4r ; <26 лет или >26 лет для r/relationship_advice ) с использованием ансамбля многослойного персептрона и k -ближайшего соседнего классификатора с точностью 0 .77 и AUROC 0,86 для r/r4r и точность 0,72 и AUROC 0,79 для r/relationship_advice . Gjurkovic et al [] смоделировали возраст на Reddit, используя линейную регрессию с терминами TF-IDF, сообщив, что Pearson r = 0,75 между помеченным и предсказанным возрастом. Тигунова и др. [] разработали серию эталонных моделей возрастной классификации для Reddit, сообщив о модели скрытых атрибутов, состоящей из сверточной нейронной сети с лучшими показателями внимания (AUROC 0.88 в 4 возрастных категориях — 13–23 года, 24–45 лет, 46–65 лет и 66–100 лет). предсказательная эффективность важнее, чем интерпретация. Хотя наши выводы согласуются с выводами из предыдущей литературы [,,] на Reddit о том, что языковые особенности являются эффективными предикторами возраста, наше исследование предполагает, что другие важные характеристики метаданных, такие как использование субреддита, метаданные учетных записей и стилистические лингвистические особенности, также дают представление о том, как делать выводы. возраст пользователей Reddit.Кроме того, несмотря на сложность прямого сравнения данных различий в составе выборки и определениях возрастных категорий, наш тестовый набор (оценка F1 0,78) и (AUROC 0,86) работают сравнимо с предыдущими возрастными классификациями Reddit (точность 0,72–0,77; AUROC 0,79–0,88 [, ]).

Наше исследование имеет несколько ограничений, которые следует учитывать при интерпретации результатов. Во-первых, из-за плохой точности прогнозирования средней возрастной группы мы объединили диапазон с диапазоном самой младшей возрастной группы; следовательно, в молодой группе было почти в два раза больше пользователей, чем в старшей возрастной группе (21–54 года).Хотя классы не были сильно несбалансированными, несбалансированные соотношения классов могут повлиять на производительность модели, если они обеспечивают слишком сильный стимул отдавать предпочтение классу большинства. Мы запустили взвешенную версию окончательной модели дерева с уменьшенным градиентом, чтобы понять, повлияет ли коррекция взвешивания на производительность. Результаты (таблица S1 на ) подтверждают, что производительность почти одинакова с учетом или без взвешивания дисбаланса. Во-вторых, пользователи, сообщающие о своем возрасте, могут систематически отличаться от тех, кто не сообщает о возрасте, что может ограничить возможность обобщения для всех пользователей Reddit.Предвзятость выбора, связанная с тем, что пользователи предпочитают публиковать или раскрывать в социальных сетях, была задокументирована в Твиттере со значительными различиями, обнаруженными между группами пользователей, которые делают или не делают геотеги в своих твитах [,] и включают или отключают службы определения местоположения [] . В-третьих, из-за меняющегося характера использования языка и платформы в социальных сетях исследования такого рода необходимо постоянно обновлять. Предыдущие исследования показали, что языковые модели, используемые для прогнозирования возраста и пола в социальных сетях, имеют тенденцию со временем ухудшаться, если их не переобучить, с большими различиями (например, более быстрой сменой языка) для более молодых пользователей социальных сетей, чем для пожилых пользователей [].В производственных условиях построение модели на обучающих данных, которые не являются репрезентативными для новых примеров, будь то из-за предвзятости выборки или изменений в окружающей среде с течением времени, которые изменяют совместное распределение результатов и ковариатов, может серьезно подорвать качество прогнозов [] . Мониторинг различий в ковариатах между обучающими данными и новыми наблюдениями важен для определения того, когда следует переобучить или изменить существующую модель. Наконец, в нашей работе использовались сообщения о возрасте на английском языке.Многие важные функции модели, изложенные в этой работе, вероятно, не будут распространяться на неанглоязычных пользователей (например, языковые функции), и следует соблюдать осторожность при применении этой модели к учетным записям неанглоязычных пользователей.

Области будущих исследований включают обновление алгоритма для учета изменений в языковых моделях и использовании социальных сетей, изучение того, как пользователи, сообщающие о своем возрасте, могут систематически отличаться от тех, кто не сообщает о возрасте, и рассмотрение того, как алгоритмы могут применяться вне их предполагаемого варианта использования.Например, возможно, что алгоритм прогнозирования возраста может быть применен для целевой рекламы табачных изделий для подростков. Хотя мы считаем это маловероятным, учитывая, что компании социальных сетей, включая Reddit, придерживаются политики, запрещающей рекламу табачных изделий на своих платформах, которую они отслеживают и обеспечивают [,], исследователи должны учитывать компромиссы при разработке алгоритмов, в том числе то, как алгоритмы могут применяться за пределами их предполагаемого использования. вариант использования.

Заключение

Платформы социальных сетей являются важными каналами для организаций здравоохранения, чтобы общаться и узнавать о поведении и восприятии возникающих рисков для здоровья, таких как табак и электронные системы доставки никотина.В частности, возможность идентифицировать членов подгрупп в социальных сетях имеет важное значение для эффективного продвижения изменения поведения через эту среду, а также для изучения проблем, однозначно влияющих на каждую целевую аудиторию. В этом исследовании представлена ​​модель возрастной классификации пользователей Reddit, важной, но недостаточно изученной платформы социальных сетей в литературе по моделированию скрытых атрибутов пользователей. Эта модель поддается интерпретации и имеет конкурентоспособную прогностическую эффективность по сравнению с предыдущими результатами возрастной классификации Reddit в литературе.Учитывая постоянное использование социальных сетей, особенно подростками и молодыми людьми, любые средства, помогающие охватить эту аудиторию, полезны для улучшения цифровых кампаний общественного здравоохранения и формирующих исследований о поведении и восприятии подростков в отношении вейпинга.

Авторы благодарят Дженнифер Шоден, Эшли Эндрюс и Микаэлу Фогарти за помощь в ручной маркировке сообщений Reddit. Мы также благодарим Майкла Венгера за его помощь в модификации платформы SMART для наших нужд в маркировке.

Эта работа финансировалась по контракту с Центром табачных изделий, Управлением по контролю за продуктами и лекарствами США, Министерством здравоохранения и социальных служб США (№ HHSF223201510002B-Заказ № 75F40119F19020). Эта публикация представляет точку зрения автора (авторов) и не представляет позицию или политику Центра FDA по табачным изделиям.

Не объявлено.

Под редакцией Т. Санчеса, Г. Айзенбаха; подан 17.11.20; рецензировано К. Харригианом; комментарии к автору 10.12.20; исправленная версия получила 04.21.02; принят 09.02.21; опубликовано 16.03.21

©Robert Chew, Caroline Kery, Laura Baum, Thomas Bukowski, Annice Kim, Mario Navarro. Первоначально опубликовано в JMIR Public Health and Surveillance (http://publichealth.jmir.org), 16 марта 2021 г.

Это статья с открытым доступом, распространяемая в соответствии с лицензией Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0/), которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии оригинальная работа, впервые опубликованная в JMIR Public Health and Surveillance, цитируется надлежащим образом.Должны быть включены полная библиографическая информация, ссылка на оригинальную публикацию на http://publichealth.jmir.org, а также информация об авторских правах и лицензии.

Границы | Байесовская оптимизация для предварительной обработки нейровизуализации в классификации и прогнозировании возраста мозга

Введение

Процесс старения влияет на структуру и функции человеческого мозга характерным образом, который можно измерить с помощью нейровизуализации. Эта количественная взаимосвязь была ключевой для ранних демонстраций морфометрии на основе вокселей (VBM) (Good et al., 2001) и по сей день представляет собой одну из самых устойчивых взаимосвязей между измеримым явлением (например, старением) и структурой мозга. Это делает старение идеальной целью для оценки новых инструментов анализа нейровизуализации. Совсем недавно исследователи использовали эту взаимосвязь для разработки инструментов на основе нейровизуализации для прогнозирования хронологического возраста здоровых людей с использованием машинного обучения (Franke et al., 2010; Cole et al., 2017b). «Предсказываемый мозгом возраст», определенный с помощью магнитно-резонансной томографии (МРТ), представляет собой интуитивную сводную меру естественного ухудшения, связанного с воздействием процесса старения на мозг, и может служить биомаркером возрастного здоровья. (Коул, 2017).

Степень, в которой прогнозируемый мозгом возраст превышает хронологический возраст человека, связана с выраженным возрастным снижением физических и когнитивных функций (Cole et al., 2017c). В частности, «пожилой» мозг был связан со снижением подвижного интеллекта, снижением функции легких, меньшей силой хвата, меньшей скоростью ходьбы и повышенной вероятностью смертности у пожилых людей (Cole et al., 2017c). Факторы, которые могут способствовать увеличению предполагаемого возраста мозга, включают генетические эффекты, неврологические или психические заболевания или плохое физическое здоровье (Koutsouleris et al., 2013; Лёве и др., 2016; Штеффенер и др., 2016; Коул и др., 2017c,d; Пардо и др., 2017). Потенциально, люди с повышенным риском испытать негативные последствия старения мозга, такие как снижение когнитивных функций и нейродегенеративные заболевания, могут быть идентифицированы путем измерения прогнозируемого мозга возраста в клинических группах или даже скрининга населения в целом.

Несмотря на многообещающие результаты, полученные на сегодняшний день, модели для расчета возраста, предсказанного мозгом, по-прежнему содержат ошибку измерения, и усилия по повышению точности и, в частности, возможности обобщения данных, полученных с различных МРТ-сканеров, оправданы.Обучение на больших когортах здоровых взрослых является одним из подходов к уменьшению ошибок, при этом самые низкие показатели средней абсолютной ошибки (MAE) составляют от 4 до 5 лет (Konukoglu et al., 2013; Irimia et al., 2014; Steffener et al., 2016). ; Коул и др., 2017b). Примечательно, что индивидуальные ошибки в популяции варьируются от идеального прогноза до расхождений, достигающих 25 лет. Несмотря на то, что возраст, предсказанный мозгом, имеет высокую надежность повторных тестов (Cole et al., 2017b), и часть этой вариации, вероятно, отражает лежащую в основе изменчивость населения, безусловно, остается значительное количество шума.Это означает, что модель с MAE = 0 маловероятна, однако нижняя граница точности прогнозирования еще не достигнута, о чем свидетельствует постепенное улучшение производительности, наблюдаемое в более поздних методах. Это означает, что усилия по уменьшению шума, повышению точности прогнозирования и, в частности, возможности обобщения новых данных необходимы, если такие подходы будут применяться к людям в клинических условиях, что является конечной целью любого предполагаемого биомаркера, связанного со здоровьем.

Ключевым вопросом прогнозирования возраста мозга, наряду со многими другими подходами нейровизуализации, является выбор методов извлечения признаков или сводных показателей из необработанных данных для дальнейшего анализа (Jones et al., 2005; Кляйн и др., 2009 г.; Франке и др., 2010; Андронахе и др., 2013; Шен и Стерр, 2013). Например, в большинстве конвейеров прогнозирования возраста мозга использовались данные Т1-взвешенной МРТ и либо генерировались воксельные карты объема мозга (например, Cole et al., 2015), либо сводные измерения толщины коры и подкорковых объемов (например, Liem et al. др., 2017). Параметры, установленные во время предварительной обработки изображения, обычно являются значениями по умолчанию, предоставленными разработчиком программного обеспечения, или основаны на предыдущих исследованиях. Тем не менее, выбор параметров предварительной обработки может сильно повлиять на результат любого последующего моделирования данных, и в идеале его следует оптимизировать в каждом конкретном случае.Такая оптимизация проводится редко, поскольку подходы, основанные на методе проб и ошибок, отнимают много времени и часто являются неверными. Важно отметить, что использование неоптимальной предварительной обработки может снизить точность эксперимента, что увеличивает вероятность ложных положительных или ложных отрицательных результатов, а также снижает воспроизводимость. В худшем случае может произойти p-взлом, при котором предварительная обработка оптимизируется вручную на основе минимизации результирующих p-значений последующей проверки гипотезы в той же выборке. Здесь мы обрисовываем принципиальную байесовскую стратегию оптимизации для определения оптимальных значений параметров предварительной обработки в анализе нейровизуализации, реализуя подвыборку, чтобы избежать систематической ошибки.Затем мы демонстрируем доказательство принципа, примененное к проблеме прогнозирования возраста с использованием машинного обучения.

Байесовская оптимизация — это эффективный и беспристрастный подход к выбору параметров, позволяющий избежать как невозможности адекватного поиска в большом пространстве параметров, так и недостатков исчерпывающего поиска. Вместо этого он использует стратегию управляемой выборки, оценивая подгруппу точек из возможного пространства параметров и проверяя эти значения на подмножествах общей выборки (Brochu et al., 2010; Снук и др., 2012). Эта стратегия разделения данных гарантирует, что тесты производительности отражают прогнозы вне выборки и всегда оценивают различные условия для отдельных данных, снижая вероятность переобучения. Этот интеллектуальный выбор небольшого количества точек для оценки позволяет характеризовать пространство параметров и решать задачу оптимизации за меньшее количество шагов, что делает этот подход эффективным с точки зрения вычислений (Pelikan et al., 2002).

В текущей работе использовалась байесовская оптимизация, чтобы попытаться оптимизировать параметры предварительной обработки изображений для: (i) различения мозга молодых и пожилых людей (классификация), (ii) прогнозирования хронологического возраста (регрессия) и (iii) оценки обобщаемости. полученных оптимумов для задачи регрессии к независимому набору данных.Задача классификации была включена, чтобы позволить оценить гиперпараметры байесовской оптимизации и показать применимость байесовской оптимизации к различным контекстам. Мы предположили, что с помощью байесовской оптимизации мы повысим точность модели по сравнению с ранее использовавшимися «неоптимизированными» значениями. Исследование было разработано, чтобы продемонстрировать доказательство применимости байесовской оптимизации, чтобы помочь улучшить предварительную обработку нейровизуализации принципиальным и беспристрастным образом.

Материалы и методы

Наборы данных нейровизуализации

В этом исследовании использовались данные, собранные из 14 общедоступных источников (см. Таблицу 1), и согласно нашему предыдущему исследованию (например,g., Cole et al., 2015), именуемый здесь набором данных здорового контроля возраста мозга (BAHC). Данные включали Т1-взвешенную МРТ 2003 здоровых людей в возрасте 16–90 лет (мужчины/женщины = 1016/987, средний возраст = 36,50 ± 18,52). Все участники BAHC либо изначально были включены в исследования здоровых людей, либо в качестве здоровых людей из контрольной группы из исследований случай-контроль. Таким образом, все они были проверены в соответствии с протоколами местных исследований, чтобы убедиться, что у них не было в анамнезе неврологических, психиатрических или серьезных заболеваний.Изображения были получены при 1,5 Тл или 3 Тл со стандартными последовательностями МРТ, взвешенными по Т1 (см. Таблицу 1). Этическое одобрение и информированное согласие были получены на местном уровне для каждого исследования, охватывающего как участие, так и последующий обмен данными.

ТАБЛИЦА 1. Источники данных для обучающей выборки здорового возраста мозга.

Кроме того, когорта нейровизуализации Кембриджского центра нейробиологии старения (CamCAN) использовалась в качестве независимого набора данных для проверки (Shafto et al., 2014; Taylor et al., 2017). Эти данные были получены из репозитория CamCAN. Когорта CamCAN состояла из T1-взвешенных изображений (полученных в 3T с использованием последовательности 3D MPRAGE: время повторения = 2250 мс, время эха = 2,99 мс, время инверсии = 900 мс; угол поворота = 9°; поле зрения = 256 × 240 × 192 мм; изотропные воксели 1 мм) от 648 участников в возрасте 18–88 лет (мужчины/женщины = 324/324, средний возраст 54,28 ± 18,56). В этом исследовании использовались аналогичные критерии исключения, включая только здоровых людей. Этическое одобрение CamCAN было получено на местном уровне, включая разрешение на последующее обнародование анонимных версий данных.

Схема конвейера анализа для исследования приведена на рисунке 1. Детали каждого этапа приведены ниже.

РИСУНОК 1. Экспериментальный обзор использования байесовской оптимизации в предварительной обработке изображений. На рисунке показан этап передискретизации экспериментального конвейера как элемент, подлежащий байесовской оптимизации. После оптимизации на основе 12 итераций с использованием подвыборок на n = 80 и оценки с использованием 10-кратной перекрестной проверки определенная целевая функция соответствующего пространства параметров может использоваться для определения оптимальных значений размера вокселя и размера ядра сглаживания.Этот процесс проводился в зависимости от задачи (т. Е. Один раз для классификации молодых и старых и один раз для регрессии прогнозирования возраста), в результате чего для каждой задачи были получены отдельные оптимумы. После определения точности модели для каждой задачи модель классификации использовалась для определения стабильности функций байесовской оптимизации, а модель регрессии использовалась для определения возможности обобщения модели на полностью независимый набор данных.

Предварительная обработка для предсказания

Карты нормализованного объема мозга были созданы в соответствии со стандартным протоколом VBM, описанным ранее (Cole et al., 2015). Это включало сегментацию необработанных T1-взвешенных изображений на карты серого вещества с использованием SPM12 (Университетский колледж Лондона, Лондон, Соединенное Королевство). Изображения были нормализованы к специальному шаблону исследования в пространстве MNI152 с использованием DARTEL для нелинейной регистрации (Ashburner, 2007). Этот шаг включал передискретизацию до общего размера вокселя, модуляцию для сохранения объемной информации и пространственное сглаживание; конкретный размер вокселя и параметры размера ядра сглаживания были выбраны байесовским протоколом оптимизации, как подробно описано ниже.

После предварительной обработки объемные изображения серого вещества были преобразованы в векторы значений интенсивности в формате ASCII. Они использовались в качестве входных признаков для последующей классификации или регрессионного анализа. Это было выполнено в MATLAB с использованием программы машины опорных векторов (SVM). Для задачи бинарной классификации различения молодых и старых участников использовались SVM. Для прогнозирования возраста как непрерывной переменной использовалась регрессия SVM (SVR). И SVM, и SVR-процедуры использовали линейное ядро ​​для преобразования входных данных в вычислительно эффективное пространство признаков.

Байесовская оптимизация предварительной обработки

Байесовская оптимизация использовалась для определения оптимальных параметров предварительной обработки на основе точности последующих прогнозов модели (либо классификации, либо регрессии). Следовательно, процедуру байесовской оптимизации можно рассматривать как дополнительный внешний уровень анализа, который окружает стандартный конвейер (от предварительной обработки до оценки точности модели). Процесс байесовской оптимизации запускает несколько итераций этого внутреннего конвейера с использованием различных подвыборок набора данных, исследуя пространство параметров для выбора различных вариантов предварительной обработки изображения на основе их влияния на целевую функцию (т.е., точность классификации или регрессии).

Ключевое преимущество байесовской оптимизации заключается в ее «суррогатной» модели, которая представляет взаимосвязь между алгоритмом и изначально неизвестной целевой функцией. Эта суррогатная модель постепенно уточняется в замкнутом цикле путем автоматического выбора точек в пространстве параметров. Это обеспечивает информированное покрытие этого пространства на основе характеристик ранее выбранных точек. Этот аспект делает байесовскую оптимизацию высокоэффективной, уменьшая количество итераций, необходимых для определения оптимумов сложных целевых функций (Brochu et al., 2010; Лоренц и др., 2017). Мы использовали реализацию байесовского алгоритма оптимизации MATLAB, которая внутренне определяет ряд параметров оптимизации, включая выбор ядра ковариации и настройку гиперпараметров процесса.

В этом исследовании мы стремились оптимизировать окончательный нормализованный размер воксела и полумаксимальную ширину (FWHM) ядра пространственного сглаживания, используемого во время окончательной повторной выборки. Обычно они устанавливаются между 1 и 2 мм 3 и 4 или 8 мм на полуширине соответственно для исследований VBM, проводимых с использованием СЗМ.В нашей предыдущей работе по прогнозированию возраста мозга мы использовали размеры 1,5 3 вокселей 1,5 мм и ядро ​​сглаживания 4 мм (Cole et al., 2015, 2017a,b,c,d; Pardoe et al., 2017), которые мы впоследствии называются «неоптимизированными» параметрами предварительной обработки. Сравнение точности классификации и регрессии сравнивалось между оптимизированными и неоптимизированными моделями с использованием теста Стайгера z для зависимых корреляций и критерия хи-квадрат Макнемара для парных номинальных данных соответственно. С помощью байесовской оптимизации рассматривался более широкий диапазон значений; от 1 до 30 мм изотропно было разрешено для размера вокселя и 1–20 мм FWHM для сглаживания размера ядра для задачи классификации, в то время как диапазоны 1–15 мм и 1–10 мм использовались для задачи регрессии (последнее меньшее пространство параметров был использован для сокращения времени вычислений для более интенсивной задачи).Время, затрачиваемое на процедуру оптимизации, составляло примерно 30 с на изображение для шага передискретизации на настольном компьютере с 16 ГБ ОЗУ. Таким образом, полный цикл оптимизации занял примерно 8 часов, чтобы выполнить 12 итераций (см. ниже).

Классификация молодых и пожилых людей

Мы разделили 500 пожилых людей (в возрасте 51–90 лет) и 500 самых молодых (в возрасте 16–22 лет) на «старые» и «молодые» группы для классификации. В каждой итерации байесовской оптимизации использовалась подвыборка всего набора данных ( N = 1000) для проверки комбинации значений параметров предварительной обработки.Участники были разделены на подмножества размером 90 304 n 90 305, стратифицированные по возрасту, так что каждое подмножество содержало примерно репрезентативное распределение участников по всему возрастному диапазону, в результате чего было выполнено 90 304 N 90 305 / 90 304 n 90 305 итераций. Мы использовали n = 80 всего (40 участников из каждой группы) в качестве выборки для каждой итерации, что дало 1000/80 = 12 итераций байесовской оптимизации. Это включало фазу приработки (т. е. предварительную фазу необработанных выборок для инициализации процесса) 5 точек, выбранных случайным образом из диапазонов параметров, чтобы начать характеристику пространства поиска, за которыми следовали 7 итераций «управляемой» активной выборки.В каждой итерации выбиралась комбинация размера вокселя и размера ядра сглаживания, которая использовалась для передискретизации во время нормализации DARTEL изображений каждого субъекта. Затем нормализованные изображения были преобразованы в векторы признаков, а бинарный классификатор SVM был обучен и оценен с использованием 10-кратной перекрестной проверки. Гиперпараметры SVM были оставлены со значениями по умолчанию. Ошибка классификатора была целевой функцией, которую необходимо было минимизировать. При байесовской оптимизации использовалась функция сбора ожидаемого улучшения плюс (EI+) с коэффициентом разведки-эксплуатации по умолчанию, равным 0.5.

Регрессионное предсказание хронологического возраста

Затем мы использовали байесовскую оптимизацию в контексте регрессионных моделей, которые предсказывают хронологический возраст здоровых людей с использованием изображений объема мозга. Это было сделано путем определения оптимальных параметров предварительной обработки с помощью байесовской оптимизации, затем их применения к полному набору обучающих данных и сравнения полученной точности прогнозирования с точностью, достигнутой при использовании «неоптимизированных» значений. В регрессионном анализе использовалось n = 80 участников на итерацию, при этом возрастные значения охватывают весь диапазон (16–90 лет) и те же гиперпараметры байесовской оптимизации, что и выше.MAE в прогнозировании возраста при 10-кратной перекрестной проверке с использованием регрессии SVM (т. е. SVR) была целевой функцией, которую необходимо было минимизировать. Гиперпараметры SVR были оставлены со значениями по умолчанию. Чтобы включить как оптимизационный поиск, так и использовать полный размер выборки, доступный для обучения модели регрессии, набор данных был разделен на обучающий набор и тестовый набор. Байесовская оптимизация была впервые проведена с использованием 1803 участников из 2003 для определения оптимального размера вокселя и значений размера ядра сглаживания (всего 22 итерации оптимизации).Затем на этих 1803 изображениях, предварительно обработанных с использованием определенных оптимальных значений, была обучена регрессионная модель, и она была протестирована на 200 участниках тестовой выборки (предварительно обработанных с использованием тех же оптимизированных параметров), чтобы получить объективное отклонение от нормы. выборочная мера эффективности предсказания возраста.

Окончательная регрессионная модель была обучена для всех участников 2003 года (полная модель ). Это позволило нам оценить, насколько хорошо оптимизированные параметры предварительной обработки обобщаются на независимый набор данных CamCAN.Мы сравнили три возможных подхода для этого этапа независимой проверки: (1) применение полной модели, полученной из BAHC, для прогнозирования возраста на основе данных CamCAN, (2) применение всей байесовской системы оптимизации к набору данных CamCAN с последующим регрессионным обучением, (3 ) с использованием параметров предварительной обработки, полученных из BAHC, для обработки набора данных CamCAN, но с обучением новой регрессионной модели для прогнозирования возраста. В случае № 1 оптимизированный размер вокселя и размер ядра сглаживания из набора данных BAHC были применены к набору данных CamCAN.В случае № 2 параметры предварительной обработки были оптимизированы заново с использованием только набора данных CamCAN. Случай № 3 — это что-то вроде промежуточной итерации, обобщающей оптимизированные параметры предварительной обработки, но не обученную модель регрессии.

Стабильность производительности

Наконец, мы провели несколько экспериментов для оценки воспроизводимости и изменчивости различных решений задачи классификации (т. е. молодых и старых). Это было сделано для того, чтобы сделать вывод о том, какие параметры предварительной обработки изображения оказали наибольшее влияние на точность прогноза, и установить надежность модели.Мы проверили согласованность модельных решений для повторений и наборов участников, используя разные случайные начальные числа для создания перемешанных групп и точек выгорания. Мы также изменили функцию сбора данных байесовского подхода. Это включало сравнение результатов с использованием шести различных функций сбора данных: ожидаемое улучшение (EI), EI в секунду, EI+, EI в секунду +, нижняя доверительная граница и вероятность улучшения. Наконец, модельные решения сравнивались при различных значениях коэффициента разведки и эксплуатации, в диапазоне от 10 до 90% разведки.Эти тесты проводились в контексте размера вокселя и размера ядра сглаживания с использованием диапазонов 1–15 мм 3 и 1–10 мм FWHM соответственно. Функция приобретения «Ожидаемое улучшение +» имеет свойство, позволяющее выйти за пределы локального оптимума и вернуться к исследовательскому поведению, когда считается, что регион чрезмерно эксплуатируется. Добавление плюса к функции EI позволяет это избежать и относится к дополнительному требованию, согласно которому стандартное отклонение апостериорной функции должно быть меньше, чем стандартное отклонение включенного шума, умноженное на коэффициент исследования.

Результаты

Классификационные анализы

Точность работы модели

после десятикратной перекрестной проверки составила 88,1% для правильной классификации данных нейровизуализации как молодых или старых (см. Таблицу 2). Оптимизированный размер вокселя составил 11,5 мм 3 , а размер ядра сглаживания — 2,3 мм. Производительность с использованием неоптимизированных значений (1,5 мм 3 вокселя и ядро ​​сглаживания 4 мм) составила 80,3%. Производительность оптимизированной модели была значительно лучше, чем в неоптимизированном случае (критерий Макнемара, χ 2 = 18.76, p < 0,001). Пространство параметров, исследующее расширенный диапазон значений размера воксела и размера ядра сглаживания, полученных с помощью модели, показано на рисунке 2.

ТАБЛИЦА 2. Характеристики классификации для различения молодого и старого мозга.

РИСУНОК 2. Модель целевой функции для классификации молодых и старых. Модель целевой функции, показывающая пространство размера вокселя и значения ядра сглаживания с точки зрения производительности старой и молодой классификации с линейным ядром SVM.Красная поверхность представляет собой функциональную модель и представляет производительность в каждом месте. Точки, в которых производилась выборка пространства параметров, показаны (синим цветом).

Классификация модели Стабильность

В задаче классификации исследована устойчивость и воспроизводимость модельных решений. Корреляция моделей в различных сценариях показана на рисунке 3. Это были; (a) через 10 повторений протокола окончательной классификации, (b) получено с использованием каждой из шести различных функций сбора данных, и (c) с использованием 5 различных соотношений разведки-эксплуатации в диапазоне от 90% разведки до 90% эксплуатации.Во всех трех случаях модельные решения показали высокую взаимную корреляцию между репликациями, а также при различных настройках процесса оптимизации. Выбор функции сбора для байесовской выборки и выбор соотношения разведки и эксплуатации этой функции мало повлияли на окончательную производительность модели. Подобные модели воспроизводились при повторениях и в случайно перемешанных подмножествах участников. Такое поведение означало, что в очерченном пространстве параметров существует устойчивая модель.Эти наблюдения подтвердили наше использование параметров функции сбора данных по умолчанию для классификационного анализа: ожидаемое улучшение плюс (EI+) с коэффициентом исследования 0,5. Таким образом, мы приняли эти параметры для задачи регрессии.

РИСУНОК 3. Стабильность модели классификации при изменении параметров байесовской оптимизации. Корреляционные тепловые карты, иллюстрирующие взаимосвязь между решениями целевой функции модели для (A) повторов протокола, (B) шести различных функций сбора данных и (C) диапазона соотношений разведки-эксплуатации от 0.1 и 0.9 (где эксплуатация 1-разведка).

Регрессия предсказания возраста

На рис. 4 показана модель целевой функции, созданная во время регрессии, при варьировании ядра сглаживания и размера вокселя (1–10, 1–15) и минимизации MAE при прогнозировании возраста SVR. Наименьший MAE, наблюдаемый для отдельной выборки ( N = 80), составлял 7,17 лет, а минимальная ошибка целевой функции модели оценивалась в 8,52 года (самая низкая точка на поверхности, показанная на рисунке 4). Расчетные значения оптимального размера воксела и размера ядра сглаживания составили 3.73 мм 3 и 3,68 мм соответственно. После оптимизации эти значения использовались для предварительной обработки всего набора данных и обучения регрессионной модели для последующего применения к другим наборам данных.

РИСУНОК 4. Модель целевой функции для предсказания возраста. Модель целевой функции, полученная в результате оптимизации во время регрессии для точного прогнозирования возраста. Красная поверхность представляет собой функциональную модель и представляет производительность в каждом месте. Точки, в которых производилась выборка пространства параметров, показаны (синим цветом).

Окончательная результирующая модель была применена для прогнозирования возраста оставшихся 200 несогласных и достигла MAE 5,08 года (рис. 5A). Это сравнивалось с MAE = 5,48 года при использовании неоптимизированных значений предварительной обработки, хотя это значение существенно не отличалось от оптимизированного случая (критерий Штейгера p > 0,1). Наблюдаемая абсолютная ошибка находилась в диапазоне от 0 до 22,78 лет. В контрольной выборке корреляция Пирсона между предсказанным и истинным возрастом составила r = 0.941, с R 2 = 0,89 с использованием оптимизированной предварительной обработки. Используя неоптимизированные параметры предварительной обработки, мы нашли r = 0,927, R 2 = 0,86.

РИСУНОК 5. Взаимосвязь между хронологическим возрастом и возрастом, предсказанным мозгом. Хронологический возраст (ось x ), нанесенный на график в зависимости от прогнозируемого возраста мозга (ось y ) при тестировании модели, обученной BAHC, на (A) задержке N = 200 тестовом наборе из BAHC (MAE = 5.08 лет, r = 0,941, R 2 = 0,89) и (B) для участников из набора данных CamCAN с использованием значений предварительной обработки, оптимизированных для набора данных BAHC (MAE = 6,08 лет, ). r = 0,929, R 2 = 0,86).

Актуальность этого подхода для независимого набора данных (например, CamCAN) рассматривалась тремя различными способами. (1) Модель, обученная BAHC, была применена к данным CamCAN, предварительно обработанным с учетом оптимального размера воксела с учетом BAHC и значений размера ядра сглаживания.Здесь участники CamCAN были включены только в тестовую выборку. Таким образом, MAE составил 6,08 года, r = 0,929, при этом R 2 = 0,86 (рис. 5B). Это было улучшением по сравнению с производительностью при использовании неоптимизированных значений предварительной обработки (размер вокселя = 1,5 мм 3 , размер ядра сглаживания = 4 мм), что привело к MAE = 6,76 года. (2) данные CamCAN были проанализированы полностью независимо; вместо этого к данным CamCAN была применена полная байесовская структура оптимизации, чтобы обнаружить новые, специфичные для CamCAN оптимумы предварительной обработки, а новая регрессионная модель была обучена с участием 588 участников и протестирована на 60 участниках (что дало соотношение обучения и тестирования, аналогичное используемому в набор данных BAHC).Это привело к оптимальным значениям 8,41 мм 3 для размера вокселя и 3,54 мм для размера ядра сглаживания и дало MAE = 5,46 года, r = 0,91, R 2 = 0,83. (3) Когорта CamCAN была предварительно обработана с использованием оптимальных значений, полученных с помощью BAHC, но новая регрессионная модель была обучена и протестирована среди участников CamCAN. В результате этой модели MAE = 6,21 года, r = 0,89, R 2 = 0,79. Модель из случая №2 оказалась значительно точнее модели из случая №3 (критерий Штейгера, t = 1.67, р = 0,05).

Обсуждение

Используя байесовскую оптимизацию, мы представляем концептуальное усовершенствование традиционных конвейеров для различения молодого и старого мозга или прогнозирования возраста с использованием данных нейровизуализации. Полученные с помощью байесовской оптимизации оптимумы для размера вокселя и размера ядра сглаживания показали улучшенную производительность по сравнению с «неоптимизированными» значениями по умолчанию для классификации молодого и старого мозга, хотя производительность в прогнозировании возраста мозга была аналогична неоптимизированным значениям.Потенциально ранее использовавшиеся значения относительно близки к оптимальным благодаря испытаниям и опыту исследователей. На самом деле полученное оптимальное ядро ​​сглаживания было очень близко к неоптимизированному значению (3,68 мм против 4 мм). Также важно отметить, что оптимумы, полученные в процессе байесовской оптимизации, не следует рассматривать как окончательные, поскольку полностью исчерпывающий поиск в пространстве параметров не проводится (что нежелательно из-за временных ограничений). Наши результаты важны, поскольку они предполагают, что одни и те же параметры предварительной обработки не оптимальны для разных задач прогнозирования (т.т. е. классификация против регрессии) или для разных наборов данных (BAHC против CamCAN). Часто исследователи применяют параметры, используемые в одном контексте, к другому. Возможно, это не обязательно лучшая практика, и наша работа демонстрирует доказательство того, что байесовскую оптимизацию можно использовать для принципиального и беспристрастного улучшения предварительной обработки изображений.

Помимо оптимизации производительности модели, наш байесовский подход к оптимизации также позволяет проводить относительное сравнение влияния различных параметров.Это потенциально предоставляет новую информацию относительно рассматриваемой проблемы прогнозирования. Например, здесь мы обнаружили, что изменение размера вокселя оказывает гораздо большее влияние на общую производительность, чем сглаживание размера ядра. Это наблюдалось во всех экспериментах; изменение производительности во всем диапазоне значений было намного меньше для размера ядра сглаживания, чем для размера вокселя, и это хорошо видно на графиках поверхности (рис. 1, 2). Это говорит о том, что в будущем при проектировании конвейера предварительной обработки нейровизуализации можно получить больше от оптимизации размера вокселя, а не от сглаживания размера ядра.Размер целевого вокселя для нормализации часто не учитывается, хотя он оказывает важное влияние на степень эффектов парциального объема, количество одновременных статистических тестов, пространственное разрешение и последующие выводы об анатомической специфичности. Наши результаты показывают, что этому важному параметру необходимо уделять больше внимания при сопоставлении данных объемной МРТ с возрастом.

Важно отметить, что выводы относительно конкретных оптимальных значений относятся к конкретному приложению, в котором они тестировались.В этом исследовании мы наблюдали заметную разницу в оптимальном размере вокселя для классификации (11,5 мм 3 ) по сравнению с регрессией (3,73 мм 3 ). Потенциально, более грубое различие между молодым и старым мозгом выигрывает от более грубого разрешения, которое увеличивает отношение сигнал/шум, в то время как более тонкие закономерности, лежащие в основе постепенных возрастных изменений в структуре мозга, требуют более мелкозернистого представления. В качестве альтернативы, указанный здесь гораздо больший размер вокселя может привести к лучшей классификации за счет уменьшения размерности данных, при этом этот размер представляет собой оптимальный компромисс между представлением информации и упрощением многомерного пространства признаков для более эффективной классификации.В любом случае, несоответствие оптимального размера воксела между классификацией и регрессией подтверждает мнение о том, что систематическая оценка спецификаций параметров должна проводиться в каждом конкретном случае. Обычно «один размер подходит всем» является преобладающей эвристикой для установки параметров предварительной обработки в анализе нейровизуализации, где значения по умолчанию считаются адекватными. Наши результаты показывают, что это не обязательно так, что поддерживает использование методов оптимизации для повышения точности эксперимента.

Точность прогнозирования возраста, достигнутая в наборе данных BAHC (MAE = 5,08 года), сопоставима с текущими показателями, наблюдаемыми в аналогичных исследованиях (Konukoglu et al., 2013; Mwangi et al., 2013; Irimia et al., 2014; Cole). et al., 2015, 2017b,c; Steffener et al., 2016). В этих исследованиях параметры предварительной обработки задаются несколько произвольно (ср. Franke et al., 2010). Здесь байесовский метод оптимизации предложил более принципиальный подход. Используемые здесь инструменты прогнозирования были обычными методами, выбранными для вычислительной эффективности (т.e., SVM), в отличие от некоторых исследований, основанных на современных методах и расширенном моделировании, таких как глубокое обучение или регрессия гауссовского процесса (Cole et al., 2017b,c). Одним из ограничений байесовской оптимизации является время вычислений, необходимое для получения оптимума, что может замедлить ее внедрение с помощью новых алгоритмов с интенсивными вычислениями. Продолжительность оптимизации также зависит от процесса, который необходимо оптимизировать. Здесь мы выбрали параметры передискретизации изображения, так как их можно быстро вычислить.Одной из важных целей оптимизации должна быть регистрация изображений, однако скорость большинства алгоритмов нелинейной регистрации в настоящее время делает эту задачу трудоемкой.

Мы исследовали обобщаемость модели и общей структуры. Полученный в результате MAE в наборе данных CamCAN, равный 6,08 года (модель и параметры, определенные BAHC), 5,18 лет (модель и параметры, определенные CamCAN) и 6,38 года (параметры, определенные BAHC, модель CamCAN), дает некоторые интересные сведения. Хотя модель, полученная на основе BAHC, показала приемлемую производительность, наивысшая точность была достигнута при повторной оптимизации и повторном обучении в независимой когорте с использованием полной байесовской структуры оптимизации.Интересно, что оптимальный размер ядра сглаживания был одинаковым для двух наборов данных (3,68 мм против 3,54 мм), в то время как была заметная разница в оптимальном размере вокселя (3,73 мм 3 против 8,41 мм 3 ). Предположительно, это может быть связано с конкретными параметрами сбора данных на этом участке или в результате скрытых характеристик выборки, поскольку трудно добиться действительно случайной выборки. Это говорит о том, что маловероятно, что для данного параметра существует наземный оптимум, что подчеркивает важность определения таких оптимумов в данном контексте.Это относится к другому потенциальному ограничению подхода; для эффективной работы оптимизации необходимы достаточно большие наборы данных. Хотя это становится все более возможным из-за стремления делиться данными и наличия больших общедоступных когорт (например, Инициатива нейровизуализации болезни Альцгеймера, Проект коннектома человека, Британский биобанк), это может быть невозможно в определенных клинических контекстах, особенно в отношении более редких болезни. Тем не менее, «обобщенная» производительность модели в этом случае все еще была разумной, что предполагает, что исследователи должны решить, что составляет достаточную точность прогноза в каждом контексте.

Байесовская оптимизация — это надежный и элегантный способ эффективной и автоматизированной настройки конвейеров предварительной обработки. В дополнение к оптимальному параметру генерируется дополнительная строгая, непредвзятая оценка производительности и обобщаемости. Созданная модель целевой функции предоставляет подробную информацию о производительности модели, а новое понимание может быть получено путем отображения всего пространства параметров за счет визуализации взаимосвязей между ключевыми компонентами анализа и производительностью.Это может позволить принимать обоснованные решения при планировании эксперимента, например, проводить анализ затрат и выгод в случае, когда оптимальные параметры приводят лишь к незначительному улучшению производительности по сравнению с другими значениями, которые проще, быстрее или дешевле реализовать. Это может иметь решающее значение в приложениях, где различные входные данные представляют собой дорогостоящие или инвазивные процедуры, такие как сканирование МРТ или получение образцов спинномозговой жидкости при люмбальных пункциях.

Хотя наш анализ был сосредоточен на предварительной обработке нейровизуализации, чтобы проиллюстрировать сильные стороны байесовских методов оптимизации, потенциальные приложения имеют далеко идущие последствия.Оптимизация может применяться в любом месте экспериментального конвейера: в вопросах планирования эксперимента, выбора стимулов, сбора данных, выбора статистического метода или алгоритма, методов прогнозирования или окончательного выбора модели. Текущая литература по темам байесовской оптимизации в основном относится к настройке алгоритмов машинного обучения (Snoek et al., 2012), и, хотя машинное обучение широко используется в нейронауках, немногие исследования использовали эту стратегию для улучшения анализа нейровизуализации или прогнозирования на основе нейровизуализации. Лоренц и др., 2016, 2017). В контексте машинного обучения и особенно в прикладных междисциплинарных областях, таких как неврология, где исследователи могут не обязательно иметь опыт в отношении каждого соответствующего экспериментального параметра, более широкое использование априорной несмещенной оптимизации параметров может быть очень полезным.

Наше исследование показывает потенциал байесовской оптимизации для улучшения предварительной обработки нейровизуализации за счет уменьшения предварительных предположений в контексте классификации и регрессии в контексте старения мозга.Будущие исследования старения мозга и других нейробиологических областей могут выиграть от применения принципиальных подходов к оптимизации для повышения чувствительности исследований и уменьшения систематической ошибки.

Заявление об этике

Все данные исследования были получены из репозиториев общедоступных данных. Эти данные изначально были получены с письменного информированного согласия всех участников исследования.

Вклад авторов

RLe и JC задумали и разработали исследование. RLo, RLe и JC разработали методы.JL, RLe и JC проанализировали и интерпретировали данные. JL, RLo, RLe и JC подготовили и отредактировали рукопись.

Финансирование

JC финансировался исследовательским советом UK/UK Research and Innovation/Medical Research Council Rutherford Fund Fellowship. RLo был поддержан грантом исследовательского проекта Leverhulme Trust, предоставленным Имперскому колледжу Лондона.

Заявление о конфликте интересов

Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

Обрабатывающий редактор в настоящее время совместно организует тему исследования с одним из авторов JC и подтверждает отсутствие какого-либо другого сотрудничества.

Благодарности

Авторы хотели бы выразить признательность главным исследователям, сделавшим свои данные открытыми для исследований. Сбор и обмен данными для одного из наборов данных, используемых в этом проекте, был предоставлен Кембриджским центром старения и неврологии (CamCAN). Финансирование CamCAN было предоставлено Исследовательским советом по биотехнологии и биологическим наукам Великобритании (грант No.BB/H008217/1) при поддержке Совета медицинских исследований Великобритании и Кембриджского университета, Великобритания.

Сноски

  1. http://www.mrc-cbu.cam.ac.uk/datasets/camcan/
  2. https://uk.mathworks.com/help/stats/bayesian-optimization-algorithm.html

Каталожные номера

Адельштейн, Дж. С., Шехзад, З., Меннес, М., ДеЯнг, К.Г., Цзо, X.-Н., Келли, К., и другие. (2011). Личность отражается во внутренней функциональной архитектуре мозга. ПЛОС ОДИН 6:e27633. doi: 10.1371/journal.pone.0027633

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Андронахе, А., Розацца, К., Саттин, Д., Леонарди, М., Д’Инсерти, Л., Минати, Л., и др. (2013). Влияние функционального конвейера предварительной обработки данных МРТ на выявляемость сети в режиме по умолчанию у пациентов с расстройствами сознания. Фронт. Нейроинформ. 7:16. doi: 10.3389/fnif.2013.00016

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Брошу, Э., Кора, В.М., и де Фрейтас, Н. (2010). Учебное пособие по байесовской оптимизации дорогостоящих функций затрат с применением к моделированию активных пользователей и иерархическому обучению с подкреплением. архив: 1012.2599

Академия Google

Cole, J.H., Annus, T., Wilson, L.R., Remtulla, R., Hong, Y.T., Fryer, T.D., et al. (2017а). Предсказанный мозгом возраст при синдроме Дауна связан с отложением β-амилоида и снижением когнитивных функций. Нейробиол. Старение 56, 41–49. doi: 10.1016/j.нейробиология.2017.04.006

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Коул, Дж. Х., Лич, Р., Шарп, Д. Дж., и Инициатива нейровизуализации болезни Альцгеймера (2015). Прогнозирование возраста мозга предполагает ускоренную атрофию после черепно-мозговой травмы. Энн. Нейрол. 77, 571–581. doi: 10.1002/ana.24367

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Коул, Дж. Х., Пудель, Р. П. К., Цагкрасулис, Д., Каан, М. В. А., Стивс, К., Spector, T.D., et al. (2017б). Прогнозирование возраста мозга с помощью глубокого обучения на основе необработанных данных визуализации дает надежный и наследуемый биомаркер. Нейроизображение 163C, 115–124. doi: 10.1016/j.neuroimage.2017.07.059

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Коул, Дж. Х., Ричи, С. Дж., Бастин, М. Е., Вальдес Эрнандес, М. К., Муньос Маньега, С., Ройл, Н., и соавт. (2017с). Возраст мозга предсказывает смертность. Мол. Психиатрия doi: 10.1038/mp.2017.62 [Epub перед печатью].

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Cole, J.H., Underwood, J., Caan, M.W.A., De Francesco, D., van Zoest, R.A., Leech, R., et al. (2017г). Предсказанное повышенное старение мозга при лечении ВИЧ-инфекции. Неврология 88, 1349–1357. doi: 10.1212/wnl.0000000000003790

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Франке, К., Циглер, Г., Клёппель, С., и Газер, К. (2010). Оценка возраста здоровых людей по Т1-взвешенным МРТ с использованием ядерных методов: изучение влияния различных параметров. Нейроизображение 50, 883–892. doi: 10.1016/j.neuroimage.2010.01.005

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Гуд, К.Д., Джонсруд, И.С., Эшбернер, Дж., Хенсон, Р.Н., Фристон, К.Дж., и Фраковяк, Р.С. (2001). Морфометрическое исследование старения 465 здоровых взрослых людей на основе вокселей. Нейроизображение 14 (1 часть 1), 21–36. doi: 10.1006/nimg.2001.0786

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Иримия, А., Торгерсон С.М., Гох С.-Ю. М. и Хорн, Дж. Д. (2014). Статистическая оценка физиологического возраста мозга как дескриптора скорости старения во взрослом возрасте. Поведение при визуализации мозга. 9, 678–689. doi: 10.1007/s11682-014-9321-0

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Джонс, Д.К., Симмс, М.Р., Серчиньяни, М., и Ховард, Р.Дж. (2005). Влияние размера фильтра на VBM-анализ данных DT-MRI. Нейроизображение 26, 546–554. doi: 10.1016/j.нейроизображение.2005.02.013

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Кляйн, А., Андерссон, Дж., Ардекани, Б.А., Эшбернер, Дж., Авантс, Б., Чианг, М.С., и соавт. (2009). Оценка 14 алгоритмов нелинейной деформации применительно к регистрации МРТ головного мозга человека. Нейроизображение 46, 786–802. doi: 10.1016/j.neuroimage.2008.12.037

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Конукоглу Э., Глокер Б., Зикич Д. и Криминиси А.(2013). Аппроксимация окрестностей с использованием рандомизированных лесов. Мед. Анальный образ. 17, 790–804. doi: 10.1016/j.media.2013.04.013

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Koutsouleris, N., Davatzikos, C., Borgwardt, S., Gaser, C., Bottlender, R., Frodl, T., et al. (2013). Ускоренное старение мозга при шизофрении и за ее пределами: нейроанатомический маркер психических расстройств. Шизофр. Бык. 40, 1140–1153. doi: 10.1093/schbul/sbt142

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Лием, Ф., Varoquaux, G., Kynast, J., Beyer, F., Kharabian Masouleh, S., Huntenburg, J.M., et al. (2017). Прогнозирование возраста мозга по данным мультимодальной визуализации фиксирует когнитивные нарушения. Нейроизображение 148, 179–188. doi: 10.1016/j.neuroimage.2016.11.005

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Лоренц, Р., Монти, Р. П., Виоланте, И. Р., Анагностопулос, К., Фейсал, А. А., Монтана, Г., и соавт. (2016). Автоматический нейробиолог: основа для оптимизации экспериментального дизайна с фМРТ в реальном времени с обратной связью. Нейроизображение 129, 320–334. doi: 10.1016/j.neuroimage.2016.01.032

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Лёве, Л. К., Газер, К., и Франке, К. (2016). Влияние генотипа APOE на индивидуальный BrainAGE при нормальном старении, легких когнитивных нарушениях и болезни Альцгеймера. PLOS ONE 11:e0157514. doi: 10.1371/journal.pone.0157514

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Мванги, Б., Хасан, К.М. и Соарес, Дж. К. (2013). Прогнозирование возраста отдельного субъекта на протяжении всей жизни человека с использованием диффузионно-тензорной визуализации: подход машинного обучения. Нейроизображение 75, 58–67. doi: 10.1016/j.neuroimage.2013.02.055

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Пардо, Х. Р., Коул, Дж. Х., Блэкмон, К., Тесен, Т., и Кузнецкий, Р. (2017). Структурные изменения мозга при медикаментозно рефрактерной фокальной эпилепсии напоминают преждевременное старение мозга. Рез. эпилепсии. 133, 28–32. doi: 10.1016/j.eplepsyres.2017.03.007

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Пеликан, М., Састри, К., и Голдберг, Д.Е. (2002). Масштабируемость байесовского алгоритма оптимизации. Междунар. Дж. Прибл. Причина. 31, 221–258. doi: 10.1016/S0888-613X(02)00095-6

Полнотекстовая перекрестная ссылка | Академия Google

Пауэр, Дж. Д., Барнс, К. А., Снайдер, А. З., Шлаггар, Б. Л., и Петерсен, С. Э. (2012). Ложные, но систематические корреляции в функциональных связях сетей МРТ возникают из-за движения субъекта. Нейроизображение 59, 2142–2154. doi: 10.1016/j.neuroimage.2011.10.018

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Shafto, M.A., Tyler, L.K., Dixon, M., Taylor, J.R., Rowe, J.B., Cusack, R., et al. (2014). Протокол исследования Кембриджского центра старения и неврологии (Cam-CAN): перекрестное междисциплинарное исследование здорового когнитивного старения на протяжении всей жизни. ВМС Нейрол. 14:204. doi: 10.1186/s12883-014-0204-1

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Шен, С.и Стерр, А. (2013). Влияет ли на морфометрию на основе вокселей DARTEL ширина ядра сглаживания и размер группы? Исследование с использованием имитации атрофии. Дж. Магн. Резон. Визуализация 37, 1468–1475. doi: 10.1002/jmri.23927

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Стеффенер, Дж., Хабек, К., О’Ши, Д., Разлиги, К., Берер, Л., и Стерн, Ю. (2016). Различия между хронологическим возрастом и возрастом мозга связаны с образованием и самооценкой физической активности. Нейробиол. Старение 40, 138–144. doi: 10.1016/j.neurobiolaging.2016.01.014

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Taylor, J.R., Williams, N., Cusack, R., Auer, T., Shafto, M.A., Dixon, M., et al. (2017). Хранилище данных Кембриджского центра старения и неврологии (Cam-CAN): структурные и функциональные данные МРТ, МЭГ и когнитивные данные из образца поперечного сечения взрослой жизни. Нейроизображение 144 (Часть B), 262–269. doi: 10.1016/j.нейроизображение.2015.09.018

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Возрастная классификация | Whitetail Race Team

Ниже представлена ​​возрастная классификация от USSA на сезон 2021/2022:

Альпийский Возраст Год рождения
Общий член 0 и 17 2004 г. и старше
Спортсмен, не набравший очков 14 и 24 2005 – 1995
Конкурент U8 7 и ниже 2014 г. и старше
Участник U10  8 и 9 2012 – 2013
Спортсмен U12  10 и 11 2010 – 2011
Спортсмен U14  12 и 13 2008 – 2009
Спортсмен U16  14 и 15 2006 – 2007
Спортсмен U18  16 и 17 2004 – 2005
Спортсмен U21  18, 19 и 20 2001 – 2003
Конкурент SR 21 год и старше 2000 и младше
Мастер (взрослый участник) 18 лет и старше 2003 г. и младше
Адаптивный конкурент  Для всех возрастов 2021 и младше
Официальный 18 лет и старше 2003 г. и младше
Тренер с официальным лицом 18 лет и старше 2003 г. и младше
Младший тренер 15 – 17 2004 – 2006
Волонтер 18 лет и старше 2003 г. и младше
Краткосрочная 0 и 17 2004 г. и старше
Краткосрочные иностранные 18 лет и старше 2003 г. и младше

*Горнолыжные спортсмены 18-24 лет могут участвовать в гонках Masters, за исключением региональных и национальных чемпионатов.

Вот ссылка на документ на сайте USSA.

Изменение возрастной классификации на 2020-21 годы

Хоккейный сезон 2020-2021 годов станет первым годом с новыми датами начала возрастной классификации Миннесотского хоккея. Модификация, которая корректирует дату начала каждой возрастной классификации с 1 июля на 1 июня, была одобрена Хоккейным советом Миннесоты на его летнем собрании в 2019 году и официально вступает в силу в этом сезоне.

Это изменение призвано предоставить игрокам, родившимся в июне, возможность играть со своими одноклассниками.

«Одним из главных достоинств нашей общественной модели в Миннесоте является возможность для игроков играть с одноклассниками и друзьями на протяжении всей их юношеской хоккейной карьеры, — сказал президент хоккейной команды Миннесоты Стив Олехейзер. «Решение Миннесотского хоккейного совета об изменении предельной даты рождения подтверждает приверженность совета нашей модели и позволяет игрокам играть со своими одноклассниками и друзьями».

С момента анонса модификации прошлой осенью возник ряд вопросов о том, как она повлияет на игроков и ассоциации.Ниже приведены некоторые из наиболее распространенных вопросов и пояснений.

Кому должно помочь это изменение классификации?

Ранее игроки, родившиеся в июне и поступившие в детский сад в возрасте 6 лет, были вынуждены играть в возрастной классификации на один год выше своего уровня в классе и были вынуждены перейти в старшую школу в качестве девятиклассников, опередив своих одноклассников. Модификация совместит июньские дни рождения с июльскими и августовскими днями рождения, что обеспечит большему количеству игроков позитивный хоккейный опыт среди молодежи и обеспечит более плавный переход к хоккею в старшей школе.

Как это повлияет на остальных игроков, родившихся в июне?

Существует четыре возможных сценария того, как это изменение классификации повлияет на игроков, родившихся в июне. Обратите внимание, что, поскольку в Minnesota Hockey существует двухлетний возрастной диапазон, на игроков распространяются эти сценарии только раз в два года.

Сценарий 1: Игрок пошел в детский сад в возрасте 6 лет и хочет «оставаться внизу», чтобы кататься на коньках со своими одноклассниками. Это группа, на которую изменение влияет больше всего, поскольку эти игроки теперь связаны со своими одноклассниками.

Сценарий 2: Игрок пошел в детский сад в возрасте 6 лет и хочет «подняться». В этой ситуации на игроков распространяется политика ассоциации.

Сценарий 3: Игрок пошел в детский сад в возрасте 5 лет и хочет «подняться», чтобы кататься на коньках со своими одноклассниками. Хоккейные правила Миннесоты требуют от ассоциаций предоставлять льготы игрокам с датами рождения в июне, июле или августе, которые вовремя начинают ходить в школу и хотят подыграть, чтобы они могли участвовать со своими одноклассниками.

Сценарий 4: Игрок пошел в детский сад в возрасте 5 лет и хочет «оставаться внизу». С новыми датами классификации у игроков и родителей появилась эта возможность.

Например, давайте проанализируем тех, кто родился в июне 2009 года и находится на пороге хоккея Squirt/10U или Peewee/12U в этом году. По старым правилам значительная часть игроков, родившихся в июне, были вынуждены играть в Peewee/12U, несмотря на то, что они были в 5-м классе, и у них не было возможности играть со своими одноклассниками.Вот как новые правила повлияют на эту группу игроков.

Сценарий 1 (09 июня):  Учащийся 5-го класса, классифицируется как Squirt/10U, что теперь ставит его вместе с одноклассниками.

Сценарий 2 (09 июня): Игрок 5-го класса и классифицируется как Squirt/10U. Поскольку теперь игрок находится в той же возрастной группе, что и его одноклассники, любой запрос на повышение будет регулироваться политикой ассоциации.

Сценарий 3 (09 июня): Игрок 6-го класса и классифицируется как Squirt/10U.Одноклассники этого игрока перешли на уровень Peewee/12U, поэтому, если игрок захочет, ему/ей должно быть разрешено перейти на уровень Peewee/12U.

Сценарий 4 (09 июня):  Учащийся 6 класса относится к Squirt/10U. Этот игрок может остаться в своей классифицированной возрастной группе, даже если его/ее одноклассники сейчас находятся на уровне Peewee/12U.

Почему хоккей Миннесоты не использует отсечку 1 января, как большинство других видов спорта и других частей страны?

Хоккей Миннесоты исторически согласовывал свою возрастную классификацию с порогом школьного возраста, а не с возрастным диапазоном года рождения (янв.1 — 31 декабря) используется в других частях страны, чтобы дети могли играть в хоккей со своими школьными друзьями. Акцент на веселье, дружбе и сообществе с того момента, как дети выходят на лед, играет ключевую роль в успехе хоккейной культуры Миннесоты и нашей модели, основанной на сообществе.

Если цель состоит в том, чтобы отразить школьный возраст, почему бы не использовать 1 сентября в качестве даты?

Первоначально датой окончания классификации Миннесотского хоккея было 1 сентября, что отражало классификацию школьного возраста.

Когда в 1990-х годах USA Hockey перенесли даты своей классификации на 1 июля, Minnesota Hockey также скорректировалась на 1 июля с целью согласования с национальной классификацией. Хоккей США позже вернулся к использованию года рождения (1 января) для возрастной классификации, но Миннесота предпочла остаться с отсечением 1 июля, поскольку в нем учитывались игроки, у которых день рождения в августе и июле, которые пошли в детский сад годом позже.

Чем вызвано это изменение и зачем его внедрять сейчас?

Minnesota Hockey неоднократно рассматривал, обсуждал и исследовал эту тему за последнее десятилетие.Двумя ключевыми компонентами для реализации изменения сейчас были комбинация данных, показывающая процент дней рождения с мая по август, которые решили пойти в детский сад в возрасте пяти или шести лет, и усиление поддержки изменений со стороны руководства ассоциации по всему штату.

Опросы нынешних хоккеистов с летним днем ​​рождения показали, что более естественным переломным моментом для отсечки является 1 июня, поскольку значительный процент июньских именинников начинают ходить в детский сад в возрасте шести лет, аналогично августовским и июльским дням рождения, в то время как очень немногие майские даты рождения начинаются в шесть лет.

Добавить комментарий

Ваш адрес email не будет опубликован.