Мета
Визначення ступеня ступеня фіброзу (цирозу) в печінці та активності за шкалою METAVIR на основі аналізу методами штучного інтелекту результатів гістології печінки та співставлення їх з лабораторними дослідженнями пацієнта.
Анотація
Розрахунки значень ступеня активності дистрофічно-запального процесу та ступеня фіброзу (цирозу) в печінці проводяться за допомогою комп’ютерної програми «FAsTest», яка являє собою комплекс програмних засобів для навчання алгоритмів комп’ютерної діагностики розпізнаванню ступеня активності дистрофічно-запального процесу та ступеня фіброзу (цирозу) в печінці людини за шкалою METAVIR та подальшого їх розпізнавання.
На спосіб визначення ступеня активності дистрофічно-запального процесу та ступеня фіброзу (цирозу) в печінці за допомогоюкомп’ютерної програми «FAsTest» отримано свідоцтво про реєстрацію авторського права на твір № 101741 від 12/01/2021 р. (рис. 1).
Визначення ґрунтується на співставленні результатів досліджень лабораторних показників пацієнтів з даними більше ніж 750 зразків пато-гістологічних досліджень печінки.
Вхідні дані для визначення ступеня активності дистрофічно-запального процесуаналізуються за допомогою 11 методів комп’ютерного розпізнавання, для визначення ступеня фіброзу (цирозу) в печінці використовується 9 методів розпізнавання. Остаточне рішення приймається на підставі результатів роботи колективу методів розпізнавання з використанням теореми Байеса.
Детальніше алгоритм роботи комп’ютерної програми «FAsTest» див. у файлі «Настанова щодо використання комп’ютерної програми FAsTest.docx»
Вхідні дані
Вхідними даними для комп’ютерної програми «FAsTest» є значення наступних показників пацієнта:
- Анамнестичних: вік пацієнта;
- Біохімічних:аланінамінотрансфераза, аспартатамінотрансфераза, білірубін загальний, загальний білок, глюкоза, креатинін, сечовина, лактатдегідрогеназа, лужна фосфатаза, γ‑глутамілтрансфераза;
- Коагулолограма: протромбіновий індекс;
- Гематологічних: лейкоцити, еритроцити, тромбоцити, швидкість осідання еритроцитів.
Результат
Результатом роботи комп’ютерної програми «FAsTest» є розрахункові значення ступеня активності дистрофічно-запального процесу та ступеняфіброзу (цирозу)в печінці за шкалою METAVIR, які подано на бланку результату (рис. 2) у вигляді розподілів ймовірностей різних станів. Висновок формується згідно даних наведених у таблицях (табл. 1 та 2).
Таблиця 1 – Активність дистрофічно-запального
процесу за шкалою METAVIR
Група
|
Висновок
|
A0
|
Відсутня.
|
A0-1
|
Відсутня. / Мінімальна.
|
A1
|
Мінімальна.
|
A1-2
|
Мінімальна. / Помірна.
|
A2
|
Помірна.
|
A2-3
|
Помірна. / Виражена.
|
A3
|
Виражена.
|
Таблиця 2 – Ступені фіброзу за шкалою METAVIR
Група
|
Висновок
|
F0
|
Фіброз відсутній.
|
F0-1
|
Фіброз відсутній. / Зірчасте розширення портальних трактів без утворення септ.
|
F1
|
Зірчасте розширення портальних трактів без утворення септ.
|
F1-2
|
Зірчасте розширення портальних трактів без утворення септ. / Розширення портальних трактів з поодинокими портопортальнимисептами.
|
F2
|
Розширення портальних трактів з поодинокими портопортальнимисептами.
|
F2-3
|
Розширення портальних трактів з поодинокими портоцентральнимисептами. / Численні портоцентральнісепти без цирозу.
|
F3
|
Численні портоцентральнісепти без цирозу.
|
F3-4
|
Численні портоцентральнісепти без цирозу. / Цироз.
|
F4
|
Цироз.
|
Попередження по застосуванню тесту
- Вік пацієнта до 10 років.
- Підпечінковийхолестаз.
- Хронічна або гостра ниркова недостатність.
- Прийом непрямих антикоагулянтів.
- Хвороби органів кровотворення.
Настанова
щодо використання комп’ютерної програми
«Визначення ступеню активності дистрофічно-запального процесу та ступеню фіброзу (цирозу) в печінці «FAsTest»»
автори: І.О. Швадчин, В.І.Янченко
Зміст. 1
1. Призначення комп’ютерної програми. 1
2. Структура комп’ютерної програми. 1
2.1 Методика роботи користувача з комп’ютерною програмою «A.learning.R». 2
2.2 Методика роботи користувача з комп’ютерною програмою «A.testing.R». 3
2.3 Методика роботи користувача з комп’ютерною програмою «F.learning.R». 4
2.4 Методика роботи користувача з комп’ютерною програмою «F.testing.R». 5
2.5 Методика роботи користувача з комп’ютерною програмою «recognition.R». 6
Комп’ютерна програма «Визначення ступеню активності дистрофічно-запального процесу та ступеню фіброзу (цирозу) в печінці «FAsTest»» (далі комп’ютерна програма «FAsTest») - це сукупність програмних засобів, які призначені для навчання алгоритмів комп’ютерної діагностики розпізнаваннюступеню активності дистрофічно-запального процесу та ступеню фіброзу (цирозу) в печінці людини за шкалою METAVIR.
Визначення ґрунтується на співставленні результатів досліджень лабораторних показників (біохімічних, гематологічних та коагулологічних) пацієнтів з даними більше ніж 750пато-гістологічних досліджень зразків печінки.
Використання комп’ютерної програмизабезпечує потребу лікарів в систематичній інформації для прийняття рішень, які поліпшують стан хворих з патологією печінки та підвищують якість їх лікування.
Комп’ютерна програма «FAsTest»складається з п’яти окремих комп’ютерних програм(скриптів): «A.learning.R», «A.testing.R», «F.learning.R», «F.testing.R» та «recognition.R».
Програми (скрипти) створені за допомогою мови програмуванняR в програмному середовищі RStudio (Version 1.1.463 – © 2009-2018 RStudio, Inc.).
Під час виконання програм (скриптів) використовуються бібліотеки програм які знаходяться за посиланням: https://cran.r-project.org/web/packages/available_packages_by_name.html.
Комп’ютерна програма «A.learning.R» призначена для навчання алгоритмів комп’ютерної діагностики розпізнаванню ступеню активності дистрофічно-запального процесу в печінці за шкалою METAVIR.
Програмний скрипт«A.learning.R» запускається на виконання в середовищі RStudio. Після запуску здійснюється підключення необхідних бібліотек та загрузка файлу вхідних даних. З вхідних даних у випадковий спосіб формується навчальна вибірка даних, яка включає чотири групи по 70 спостережень у кожній.
На наступному етапі до навчальної вибірки застосовується процес вінзоризації (vinsorisation) а потім перетворення Бокса – Кокса (Box-Coxtransformation), центрування та нормалізація.
Далі здійснюється навчання методів розпізнавання з використанням ресемплінгу та перехресної перевірки. З навчальної вибірки даних формується 21 блок даних, в кожному блоці дані поділяються на навчальну та повірочну вибірки, проводиться навчання методу, та оцінка якості розпізнавання за критеріями точності (accuracy) та індексу Каппа (kappa).Дана процедура проводиться для кожного з 11 методів відібраних у колектив.
До колективу методів розпізнавання відібрані методи наведені в таблиці 1.
Таблиця 1 – Колектив методів розпізнавання ступеню активності дистрофічно-запального процесу в печінці людини за шкалою METAVIR
№
|
Метод розпізнавання
|
Позначення
|
Назва українською
|
Назва англійською
|
1
|
Простий Байес
|
Naive Bayes
|
nb
|
2
|
Випадковий ліс
|
Random Forest
|
rf
|
3
|
Метод найближчого сусіда
|
k-Nearest Neighbors
|
knn
|
4
|
Метод найближчого сусіда з апроксимацією щільності розподілу
|
k-Nearest Neighbors
|
kknn
|
5
|
Лінійний дискримінантний аналіз
|
Linear Discriminant Analysis
|
lda
|
6
|
Регуляризованийдискримінантний аналіз
|
Regularized Discriminant Analysis
|
rda
|
7
|
Машина опорних векторів з лінійним ядром
|
Support Vector Machine with Linear Kernel
|
svmLinear
|
8
|
Машина опорних векторів з поліноміальним ядром
|
Support Vector Machine with Polynomial Kernel
|
svmPoly
|
9
|
Машина опорних векторів з ядром радіальна базисна функція
|
Support Vector Machine with Radial Basis Function Kernel
|
svmRadial
|
10
|
Модель сусідніх категорій для порядкових даних
|
Adjacent Categories Probability Model for Ordinal Data
|
vglmAdjCat
|
11
|
Модель співвідношення для порядкових даних
|
Continuation Ratio Model for Ordinal Data
|
vglmContRatio
|
Після проходження навчання всіх методів розпізнавання здійснюється оцінка статистичних характеристик ресемплінгу (рис. 1)за критеріями точності (accuracy) та індексу каппа (kappa).
Отримані дані, а саме: назви предікторів, матриця підготовки даних та список навчених методів розпізнавання (колектив методів) зберігаються для подальшого використання у файлі «A.learning.data.Rda».
Рисунок 1 – Точність (accuracy) та індекс каппа (kappa) для методів розпізнавання ступеню активності дистрофічно-запального процесу в печінці людини за шкалою METAVIR.
Комп’ютерна програма «A.testing.R» призначена для оцінки якостінавчання алгоритмів комп’ютерної діагностики розпізнаванню ступеню активності дистрофічно-запального процесу в печінці за шкалою METAVIR.
Програмний скрипт«A.testing.R» запускається на виконання в середовищі RStudio. Після запуску здійснюється підключення необхідних бібліотек, загрузка файлу вхідних даних та файлів допоміжних функцій.
Оцінка якості розпізнавання здійснюється за допомогою розрахунку матриці помилок класифікації та наступних критеріїв: точність (accuracy), індекс каппа (kappa), чутливість(sensitivity), специфічність (specificity), прогностичність позитивного та негативного результатів, преваленс (prevalence) та інш.
На першому етапі виконання скрипта проводиться оцінка якості розпізнавання за вищенаведеними критеріями для навчальної вибірки даних.
Наступним етапом є оцінка якості розпізнавання для тестової вибірки, спостереження якої не приймали участі в навчанні методів розпізнавання. Здійснюється загрузка файлу тестових даних, їх попередня підготовка (видалення спостережень у яких відсутня більшість даних, заміна відсутніх даних їх середніми значеннями, вінзоризація, перетворення Бокса – Кокса, центрування та нормалізація). Після підготовки даних проводиться їх розпізнавання та оцінка якості.
За результатами оцінки якості розпізнавання навчальної та тестової вибірки даних робиться висновок про придатність колективу методіврозпізнавання для діагностики ступеню активності дистрофічно-запального процесу в печінці за шкалою METAVIR.
Комп’ютерна програма «F.learning.R» призначена для навчання алгоритмів комп’ютерної діагностики розпізнаванню ступенюфіброзу (цирозу) в печінці за шкалою METAVIR.
Програмний скрипт«F.learning.R» запускається на виконання в середовищі RStudio. Після запуску здійснюється підключення необхідних бібліотек та загрузка файлу вхідних даних. З вхідних даних у випадковий спосіб формується навчальна вибірка даних, яка включає п’ять груп по 93 спостережень у кожній.
На наступному етапі до навчальної вибірки застосовується процес вінзоризації (vinsorisation) а потім перетворення Бокса – Кокса (Box-Coxtransformation), центрування та нормалізація.
Далі здійснюється навчання методів розпізнавання з використанням ресемплінгу та перехресної перевірки. З навчальної вибірки даних формується 21 блок даних, в кожному блоці дані поділяються на навчальну та повірочну вибірки, проводиться навчання методу, та оцінка якості розпізнавання за критеріями точності (accuracy) та індексу Каппа (kappa). Дана процедура проводиться для кожного з 9 методів відібраних у колектив.
До колективу методів розпізнавання відібрані методи наведені в таблиці 2.
Таблиця 2 – Колектив методів розпізнавання ступенюфіброзу (цирозу) в печінці людини за шкалою METAVIR.
№
|
Метод розпізнавання
|
Позначення
|
Назва українською
|
Назва англійською
|
1
|
Випадковий ліс
|
Random Forest
|
rf
|
2
|
Регуляризованийдискримінантний аналіз
|
Regularized Discriminant Analysis
|
rda
|
3
|
Машина опорних векторів з лінійним ядром
|
Support Vector Machine with Linear Kernel
|
svmLinear
|
4
|
Машина опорних векторів з поліноміальним ядром
|
Support Vector Machine with Polynomial Kernel
|
svmPoly
|
5
|
Машина опорних векторів з ядром радіальна базисна функція
|
Support Vector Machine with Radial Basis Function Kernel
|
svmRadial
|
6
|
Модель кумулятивної ймовірності для порядкових даних
|
Cumulative Probability Model for Ordinal Data
|
vglmCumulative
|
7
|
Модель мультіноміальної регресії зі штрафами
|
PenalizedMultinomialRegression
|
multinom
|
8
|
Порядкова логістична регресія
|
Ordered Logistic Regression
|
polr
|
9
|
Модель порядкового випадкового лісу
|
Ordinalforests
|
ordinalRF
|
Після проходження навчання всіх методів розпізнавання здійснюється оцінка статистичних характеристик ресемплінгу (рис. 2) за критеріями точності (accuracy) та індексу каппа (kappa).
Отримані дані, а саме: назви предікторів, матриця підготовки даних та список навчених методів розпізнавання (колектив методів) зберігаються для подальшого використання у файлі «F.learning.data.Rda».
Рисунок 2 – Точність (accuracy) та індекс каппа (kappa) для методів розпізнавання ступенюфіброзу (цирозу) в печінці людини за шкалою METAVIR.
Комп’ютерна програма «F.testing.R» призначена для оцінки якостінавчання алгоритмів комп’ютерної діагностики розпізнаванню ступенюфіброзу (цирозу) в печінці за шкалою METAVIR.
Програмний скрипт«F.testing.R» запускається на виконання в середовищі RStudio. Після запуску здійснюється підключення необхідних бібліотек, загрузка файлу вхідних даних та файлів допоміжних функцій.
Оцінка якості розпізнавання здійснюється за допомогою розрахунку матриці помилок класифікації та наступних критеріїв: точність (accuracy), індекс каппа (kappa), чутливість(sensitivity), специфічність (specificity), прогностичність позитивного та негативного результатів, преваленс (prevalence) та інш.
На першому етапі виконання скрипта проводиться оцінка якості розпізнавання за вищенаведеними критеріями для навчальної вибірки даних.
Наступним етапом є оцінка якості розпізнавання для тестової вибірки, спостереження якої не приймали участі в навчанні методів розпізнавання. Здійснюється загрузка файлу тестових даних, їх попередня підготовка (видалення спостережень у яких відсутня більшість даних, заміна відсутніх даних їх середніми значеннями, вінзоризація, перетворення Бокса – Кокса, центрування та нормалізація). Після підготовки даних проводиться їх розпізнавання та оцінка якості.
За результатами оцінки якості розпізнавання навчальної та тестової вибірки даних робиться висновок про придатність колективу методів розпізнавання для діагностики ступенюфіброзу (цирозу) в печінці за шкалою METAVIR.
Комп’ютерна програма «recognition.R» призначена длярозпізнавання за допомогою навчених алгоритмів комп’ютерної діагностикиступеню активності дистрофічно-запального процесу та ступеню фіброзу (цирозу) в печінці за шкалою METAVIR.
Програмний скрипт«recognition.R» запускається на виконання в середовищі RStudio. Після запуску здійснюється підключення необхідних бібліотек, загрузка файлів які містять назви предікторів, матриці підготовки вхідних даних, колективи навчених методів розпізнавання та файлів допоміжних функцій.
З основної бази даних яка міститься у файлі програми Excel«FAsTest.xlsm»лабораторні показники пацієнта у вигляді текстової строки переносяться в файл «recognition.R» (рис. 3)
Рисунок 3 – Місце в файлі «recognition.R» для вставки результатів лабораторних досліджень.
Результатом виконання скрипта є розподіли ймовірностей ступенів активності дистрофічно-запального процесу та ступенів фіброзу (цирозу) в печінці за шкалою METAVIR для досліджуваних лабораторних показників.
Результати розпізнавання за допомогою буферу обміну Windowsпереносяться в файл основної бази даних «FAsTest.xlsm» (рис. 4) та роздруковуються на бланку (рис. 5).
Рисунок 4 – Місце вставки результатів розпізнавання в файл основної бази даних «FAsTest.xlsm».
Рисунок 5 – Бланк результатів визначення ступеню активності дистрофічно-запального процесу та ступеню фіброзу (цирозу) в печінці за шкалою METAVIR. |