• Регистрация
AnyaKim
AnyaKim +25.08
н/д

Автоматизация анализов генотоксичности с помощью проточной цитометрии изображений и глубокого обучения

23.10.2020

Анализы генотоксичности используются для оценки повреждения генетического материала (ДНК и РНК), вызванного химическим агентом, таким как лекарство, и часто используются для проверки безопасности лекарственных препаратов-кандидатов. В прошлом высококвалифицированные лаборанты проводили анализы вручную, используя микроскоп, чтобы исследовать тысячи отдельных клеток, чтобы определить биомаркеры повреждения ДНК: образование микроядер (MN) при делении клеток (рис. 1). Помимо того, что этот подход трудоемок и требует много времени, он зависел от субъективной оценки каждого отдельного техника.

Анализы генотоксичности используются для оценки повреждения генетического материала (ДНК и РНК), вызванного химическим агентом, таким как лекарство, и часто используются для проверки безопасности лекарственных препаратов-кандидатов. В прошлом высококвалифицированные лаборанты проводили анализы вручную, используя микроскоп, чтобы исследовать тысячи отдельных клеток, чтобы определить биомаркеры повреждения ДНК: образование микроядер (MN) при делении клеток (рис. 1). Помимо того, что этот подход трудоемок и требует много времени, он зависел от субъективной оценки каждого отдельного техника.

Рисунок 1. Вверху слева: мононуклеарная клетка; вверху справа: мононуклеарная клетка с микроядром. Внизу слева: двухъядерная клетка; внизу справа: двухъядерная клетка с микроядром. Слева: изображения в светлом поле; справа: изображения ядерной флуоресценции.

Рисунок 1. Вверху слева: мононуклеарная клетка; вверху справа: мононуклеарная клетка с микроядром. Внизу слева: двухъядерная клетка; внизу справа: двухъядерная клетка с микроядром. Слева: изображения в светлом поле; справа: изображения ядерной флуоресценции. 

Моя исследовательская группа в Университете Суонси разработала автоматизированный подход к генотоксичности и аналогичным исследованиям, основанным на глубоком обучении и проточной цитометрии с визуализацией (IFC). Лаборатория моего сотрудника, доктора Джорджа Джонсона, использует IFC для сбора данных многоканального изображения из отдельных ячеек. Мы используем DeepFlow, сеть глубокого обучения, оптимизированную для использования с IFC [1], которая позволяет нам точно и автоматически классифицировать изображения как одно ядро, одно ядро ​​с MN, два ядра или два ядра с MN (рисунок 2). 

Рисунок 2. Рабочий процесс автоматической классификации изображений.

Рисунок 2. Рабочий процесс автоматической классификации изображений. 

Такой подход устраняет субъективность ручных подходов и позволяет проводить анализы с согласованными результатами в лабораториях по всему миру. Поскольку мы реализовали DeepFlow в MATLAB ® с Deep Learning Toolbox ™, мы можем отправить код в любую лабораторию, с которой мы сотрудничаем, и знать, что она будет работать надежно. Многие исследователи уже знакомы с MATLAB, а это значит, что они могут легко изменять или улучшать код и адаптировать DeepFlow к своим конкретным экспериментальным установкам.

Создание DeepFlow

Первоначально мы реализовали DeepFlow с использованием Keras TensorFlow ™, но решили повторно реализовать его в MATLAB, чтобы DeepFlow можно было использовать практически в любой лаборатории в мире. Мы хотели, чтобы наше программное обеспечение работало независимо от того, какой аппарат проточной цитометрии используется в конкретной лаборатории. Мы не хотели беспокоиться о зависимостях, и нам нужна была сеть глубокого обучения, которую было бы легко понять и изменить.

Вместо того, чтобы выполнять построчный перевод нашего кода Keras, мы использовали приложение Deep Network Designer для построения, визуализации и обучения сети DeepFlow. С кодом Keras вверху на одной стороне экрана и приложением Deep Network Designer на другой, мы просто скопировали архитектуру первоначальной реализации (рисунок 3).

Рисунок 3. Сеть DeepFlow в приложении Deep Network Designer.

Рисунок 3. Сеть DeepFlow в приложении Deep Network Designer.

Мы использовали сетевой анализатор в Deep Learning Toolbox, чтобы проверить наличие ошибок в сети и ее слоях (рисунок 4). Например, мы начали с сети, предназначенной для изображений размером 200x200 пикселей, и уменьшили ее размер для работы с изображениями размером 64x64 пикселей, которые мы получаем из IFC, используя анализатор сети для проверки размера изображения на каждом сверточном слое в сети. Наши сотрудники также используют сетевой анализатор, когда вносят изменения в сеть с помощью приложения Deep Network Designer. 

Мы использовали сетевой анализатор в Deep Learning Toolbox, чтобы проверить наличие ошибок в сети и ее слоях (рисунок 4). Например, мы начали с сети, предназначенной для изображений размером 200x200 пикселей, и уменьшили ее размер для работы с изображениями размером 64x64 пикселей, которые мы получаем из IFC, используя анализатор сети для проверки размера изображения на каждом сверточном слое в сети. Наши сотрудники также используют сетевой анализатор, когда вносят изменения в сеть с помощью приложения Deep Network Designer.

Рисунок 4. Сеть DeepFlow в приложении MATLAB Network Analyzer.

Использование DeepFlow в анализах генотоксичности

В нашей экспериментальной установке мы используем IFC, способный обрабатывать 10 000 ячеек в течение нескольких минут. Мы делаем светлопольные изображения, а также флуоресцентные изображения ядер и микроядер, окрашенных раствором, который делает ДНК более видимой (рис. 5).

Рисунок 5. CNN для классификации и визуализации данных IFC. [1] 

Мы переносим данные IFC в MATLAB как хранилище данных MATLAB. Мы предварительно обрабатываем его с помощью традиционных методов обработки изображений, чтобы перенормировать каждое изображение на основе его интенсивности и гарантировать, что каждое изображение находится в фокусе, а ячейка полностью находится в кадре. Мы используем обнаружение краев, например, для определения чистых краев, которые указывают на то, что изображение находится в фокусе, и идеально ровных краев, которые указывают на то, что камера не захватила всю ячейку.

Мы обучили DeepFlow CNN на более чем 2000 классифицированных вручную изображениях. Когда у нас есть нормализованный, чистый набор данных из IFC, мы используем обученную сеть для классификации изображений как имеющих моно-, би-, три- или тетраядерные клетки с или без MN. Наконец, используя хорошо известную формулу, которая вычисляет процент клеток, попадающих в каждую категорию, мы можем оценить токсичность агента, используемого для лечения клеток.

Мы обнаружили, что слой непосредственно над последним слоем классификации в сети DeepFlow особенно ценен для понимания того, как работает обученная CNN. Чтобы проанализировать информацию, встроенную в этот уровень, мы используем MATLAB для применения алгоритма t- распределенного стохастического встраивания соседей (tSNE) для визуализации данных большой размерности (рисунок 6). Эти визуализации могут выявить нюансы в данных изображения, которые едва заметны при проверке вручную. Например, связь между клетками, классифицируемыми как двухъядерные и одноядерные, с микроядром показывает, что размер определяет разницу между нормальным ядром и микроядром.

Рисунок 6. tSNE визуализация данных, показывающих типичные типы клеток из анализа генотоксичности.

Рисунок 6. tSNE визуализация данных, показывающих типичные типы клеток из анализа генотоксичности.

Распространение принципов DeepFlow на оценку качества крови с помощью слабого обучения с учителем

Помимо исследования генотоксичности, мы использовали глубокое обучение в различных приложениях для анализа и классификации. Например, недавно мы с коллегами использовали CNN и обучение под слабым контролем для изучения деградации эритроцитов (эритроцитов) с течением времени [2]. В эритроцитах в крови, хранящейся для переливаний, образуются накопительные повреждения, которые наблюдаются как изменения морфологии клеток, которые часто оцениваются вручную с помощью микроскопа. Ручная оценка занимает невероятно много времени, и мы заметили, что разные эксперты часто дают разные оценки.

Для первой части исследования эритроцитов мы действовали так же, как и в случае исследования генотоксичности, обучая CNN изображениями, которые были вручную помечены как принадлежащие к одной из нескольких возможных морфологий или фенотипов (рис. 7). Обученная сеть достигла более 76% согласия с экспертом в классификации морфологии, что сопоставимо с примерно 79% соглашением, наблюдаемым между экспертами.

Рисунок 7. Морфология эритроцитов.

Рисунок 7. Морфология эритроцитов.

Во второй части исследования мы устранили субъективную маркировку человека и обучили слабо контролируемую нейронную сеть ResNet50, используя только время, в течение которого кровь хранилась. Когда мы визуализировали результаты с помощью техники на основе tSNE, использованной в исследовании генотоксичности, мы обнаружили, что сеть научилась извлекать одноклеточные особенности, которые выявляют хронологическую прогрессию морфологических изменений (рис. 8). Мы поняли, что эту прогрессию можно использовать для прогнозирования качества крови и срока годности хранящейся крови без аннотации, созданной человеком, что снижает потери крови и помогает гарантировать, что неподходящая кровь не будет использоваться при переливании.

Рисунок 8. Распределение фенотипов (морфологий), выявленных при визуализации CNN.

Рисунок 8. Распределение фенотипов (морфологий), выявленных при визуализации CNN. 

Планы для DeepFlow

Наша группа в настоящее время оценивает несколько потенциальных исследовательских проектов, сочетающих IFC и глубокое обучение с MATLAB. Один проект основан на исследовании генотоксичности, но направлен на оценку реакции лейкоцитов у пациента, прошедшего химиотерапию [3]. Второй расширит DeepFlow для анализа сканирования слайдов, что потенциально может позволить компаниям повторно анализировать большие объемы данных сканирования слайдов. Мы также разрабатываем графический интерфейс для DeepFlow, который мы будем упаковывать в сеть как единое автономное приложение.

Ссылки

  1. Eulenberg, P., Köhler, N., Blasi, T.  et al.  «Реконструкция клеточного цикла и развития болезни с помощью глубокого обучения». Nature Communications  8,  463 (2017). DOI : 10.1038 / s41467-017-00623-3
  2. Доан М., Себастьян Дж . А. и др. al.  «Объективная оценка качества хранимой крови с помощью глубокого обучения». Слушания Национальной академии наук,  сентябрь 2020 г., 117 (35) 21381-21390. DOI :  10.1073 / pnas.2001227117
  3. Доан, М., Кейс, М., Масич, Д., Хенниг, Х., Маккуин, К., Кайседо, Дж., Сингх, С., Гудман, А., Волькенхауэр, О., Саммерс, HD, Джеймисон, Д., ван Делфт, Ф.В., Филби, А., Карпентер, А.Е., Рис, П. и Ирвинг, Дж. (2020). «Мониторинг лейкемии без этикеток с помощью компьютерного зрения». Cytometry , 97: 407-414. DOI :  10.1002 / cyto.a.23987

Автор Пол Рис, Университет Суонси

об авторе:
Д-р Пол Рис - профессор инженерных наук и руководитель Центра системной и технологической инженерии (SPEC) в Университете Суонси. Его исследовательские интересы включают проточную цитометрию, моделирование анализа биомедицинских изображений, моделирование тромбов и коллоидные квантовые точки.

Теги

    23.10.2020

    Комментарии