Автоматизация анализов генотоксичности с помощью проточной цитометрии изображений и глубокого обучения
Анализы генотоксичности используются для оценки повреждения генетического материала (ДНК и РНК), вызванного химическим агентом, таким как лекарство, и часто используются для проверки безопасности лекарственных препаратов-кандидатов. В прошлом высококвалифицированные лаборанты проводили анализы вручную, используя микроскоп, чтобы исследовать тысячи отдельных клеток, чтобы определить биомаркеры повреждения ДНК: образование микроядер (MN) при делении клеток (рис. 1). Помимо того, что этот подход трудоемок и требует много времени, он зависел от субъективной оценки каждого отдельного техника.
Анализы генотоксичности используются для оценки повреждения генетического материала (ДНК и РНК), вызванного химическим агентом, таким как лекарство, и часто используются для проверки безопасности лекарственных препаратов-кандидатов. В прошлом высококвалифицированные лаборанты проводили анализы вручную, используя микроскоп, чтобы исследовать тысячи отдельных клеток, чтобы определить биомаркеры повреждения ДНК: образование микроядер (MN) при делении клеток (рис. 1). Помимо того, что этот подход трудоемок и требует много времени, он зависел от субъективной оценки каждого отдельного техника.
Рисунок 1. Вверху слева: мононуклеарная клетка; вверху справа: мононуклеарная клетка с микроядром. Внизу слева: двухъядерная клетка; внизу справа: двухъядерная клетка с микроядром. Слева: изображения в светлом поле; справа: изображения ядерной флуоресценции.
Моя исследовательская группа в Университете Суонси разработала автоматизированный подход к генотоксичности и аналогичным исследованиям, основанным на глубоком обучении и проточной цитометрии с визуализацией (IFC). Лаборатория моего сотрудника, доктора Джорджа Джонсона, использует IFC для сбора данных многоканального изображения из отдельных ячеек. Мы используем DeepFlow, сеть глубокого обучения, оптимизированную для использования с IFC [1], которая позволяет нам точно и автоматически классифицировать изображения как одно ядро, одно ядро с MN, два ядра или два ядра с MN (рисунок 2).
Рисунок 2. Рабочий процесс автоматической классификации изображений.
Такой подход устраняет субъективность ручных подходов и позволяет проводить анализы с согласованными результатами в лабораториях по всему миру. Поскольку мы реализовали DeepFlow в MATLAB ® с Deep Learning Toolbox ™, мы можем отправить код в любую лабораторию, с которой мы сотрудничаем, и знать, что она будет работать надежно. Многие исследователи уже знакомы с MATLAB, а это значит, что они могут легко изменять или улучшать код и адаптировать DeepFlow к своим конкретным экспериментальным установкам.
Создание DeepFlow
Первоначально мы реализовали DeepFlow с использованием Keras TensorFlow ™, но решили повторно реализовать его в MATLAB, чтобы DeepFlow можно было использовать практически в любой лаборатории в мире. Мы хотели, чтобы наше программное обеспечение работало независимо от того, какой аппарат проточной цитометрии используется в конкретной лаборатории. Мы не хотели беспокоиться о зависимостях, и нам нужна была сеть глубокого обучения, которую было бы легко понять и изменить.
Вместо того, чтобы выполнять построчный перевод нашего кода Keras, мы использовали приложение Deep Network Designer для построения, визуализации и обучения сети DeepFlow. С кодом Keras вверху на одной стороне экрана и приложением Deep Network Designer на другой, мы просто скопировали архитектуру первоначальной реализации (рисунок 3).
Рисунок 3. Сеть DeepFlow в приложении Deep Network Designer.
Мы использовали сетевой анализатор в Deep Learning Toolbox, чтобы проверить наличие ошибок в сети и ее слоях (рисунок 4). Например, мы начали с сети, предназначенной для изображений размером 200x200 пикселей, и уменьшили ее размер для работы с изображениями размером 64x64 пикселей, которые мы получаем из IFC, используя анализатор сети для проверки размера изображения на каждом сверточном слое в сети. Наши сотрудники также используют сетевой анализатор, когда вносят изменения в сеть с помощью приложения Deep Network Designer.
Рисунок 4. Сеть DeepFlow в приложении MATLAB Network Analyzer.
Использование DeepFlow в анализах генотоксичности
В нашей экспериментальной установке мы используем IFC, способный обрабатывать 10 000 ячеек в течение нескольких минут. Мы делаем светлопольные изображения, а также флуоресцентные изображения ядер и микроядер, окрашенных раствором, который делает ДНК более видимой (рис. 5).
Рисунок 5. CNN для классификации и визуализации данных IFC. [1]
Мы переносим данные IFC в MATLAB как хранилище данных MATLAB. Мы предварительно обрабатываем его с помощью традиционных методов обработки изображений, чтобы перенормировать каждое изображение на основе его интенсивности и гарантировать, что каждое изображение находится в фокусе, а ячейка полностью находится в кадре. Мы используем обнаружение краев, например, для определения чистых краев, которые указывают на то, что изображение находится в фокусе, и идеально ровных краев, которые указывают на то, что камера не захватила всю ячейку.
Мы обучили DeepFlow CNN на более чем 2000 классифицированных вручную изображениях. Когда у нас есть нормализованный, чистый набор данных из IFC, мы используем обученную сеть для классификации изображений как имеющих моно-, би-, три- или тетраядерные клетки с или без MN. Наконец, используя хорошо известную формулу, которая вычисляет процент клеток, попадающих в каждую категорию, мы можем оценить токсичность агента, используемого для лечения клеток.
Мы обнаружили, что слой непосредственно над последним слоем классификации в сети DeepFlow особенно ценен для понимания того, как работает обученная CNN. Чтобы проанализировать информацию, встроенную в этот уровень, мы используем MATLAB для применения алгоритма t- распределенного стохастического встраивания соседей (tSNE) для визуализации данных большой размерности (рисунок 6). Эти визуализации могут выявить нюансы в данных изображения, которые едва заметны при проверке вручную. Например, связь между клетками, классифицируемыми как двухъядерные и одноядерные, с микроядром показывает, что размер определяет разницу между нормальным ядром и микроядром.
Рисунок 6. tSNE визуализация данных, показывающих типичные типы клеток из анализа генотоксичности.
Распространение принципов DeepFlow на оценку качества крови с помощью слабого обучения с учителем
Помимо исследования генотоксичности, мы использовали глубокое обучение в различных приложениях для анализа и классификации. Например, недавно мы с коллегами использовали CNN и обучение под слабым контролем для изучения деградации эритроцитов (эритроцитов) с течением времени [2]. В эритроцитах в крови, хранящейся для переливаний, образуются накопительные повреждения, которые наблюдаются как изменения морфологии клеток, которые часто оцениваются вручную с помощью микроскопа. Ручная оценка занимает невероятно много времени, и мы заметили, что разные эксперты часто дают разные оценки.
Для первой части исследования эритроцитов мы действовали так же, как и в случае исследования генотоксичности, обучая CNN изображениями, которые были вручную помечены как принадлежащие к одной из нескольких возможных морфологий или фенотипов (рис. 7). Обученная сеть достигла более 76% согласия с экспертом в классификации морфологии, что сопоставимо с примерно 79% соглашением, наблюдаемым между экспертами.
Рисунок 7. Морфология эритроцитов.
Во второй части исследования мы устранили субъективную маркировку человека и обучили слабо контролируемую нейронную сеть ResNet50, используя только время, в течение которого кровь хранилась. Когда мы визуализировали результаты с помощью техники на основе tSNE, использованной в исследовании генотоксичности, мы обнаружили, что сеть научилась извлекать одноклеточные особенности, которые выявляют хронологическую прогрессию морфологических изменений (рис. 8). Мы поняли, что эту прогрессию можно использовать для прогнозирования качества крови и срока годности хранящейся крови без аннотации, созданной человеком, что снижает потери крови и помогает гарантировать, что неподходящая кровь не будет использоваться при переливании.
Рисунок 8. Распределение фенотипов (морфологий), выявленных при визуализации CNN.
Планы для DeepFlow
Наша группа в настоящее время оценивает несколько потенциальных исследовательских проектов, сочетающих IFC и глубокое обучение с MATLAB. Один проект основан на исследовании генотоксичности, но направлен на оценку реакции лейкоцитов у пациента, прошедшего химиотерапию [3]. Второй расширит DeepFlow для анализа сканирования слайдов, что потенциально может позволить компаниям повторно анализировать большие объемы данных сканирования слайдов. Мы также разрабатываем графический интерфейс для DeepFlow, который мы будем упаковывать в сеть как единое автономное приложение.
Ссылки
- Eulenberg, P., Köhler, N., Blasi, T. et al. «Реконструкция клеточного цикла и развития болезни с помощью глубокого обучения». Nature Communications 8, 463 (2017). DOI : 10.1038 / s41467-017-00623-3
- Доан М., Себастьян Дж . А. и др. al. «Объективная оценка качества хранимой крови с помощью глубокого обучения». Слушания Национальной академии наук, сентябрь 2020 г., 117 (35) 21381-21390. DOI : 10.1073 / pnas.2001227117
- Доан, М., Кейс, М., Масич, Д., Хенниг, Х., Маккуин, К., Кайседо, Дж., Сингх, С., Гудман, А., Волькенхауэр, О., Саммерс, HD, Джеймисон, Д., ван Делфт, Ф.В., Филби, А., Карпентер, А.Е., Рис, П. и Ирвинг, Дж. (2020). «Мониторинг лейкемии без этикеток с помощью компьютерного зрения». Cytometry , 97: 407-414. DOI : 10.1002 / cyto.a.23987
Автор Пол Рис, Университет Суонси
об авторе:
Д-р Пол Рис - профессор инженерных наук и руководитель Центра системной и технологической инженерии (SPEC) в Университете Суонси. Его исследовательские интересы включают проточную цитометрию, моделирование анализа биомедицинских изображений, моделирование тромбов и коллоидные квантовые точки.
Комментарии