Estimação de Parâmetros do Modelo do Circuito Equivalente do Sistema Cardiovascular Humano Usando Deep Learning

Aluno: Jorge Santos Leandro Orientador: Prof. Dr. Thiago Damasceno Cordeiro

Arquivo
Dissertac807a771o_JorgeLeandro.pdf
Documento PDF (3.6MB)
                    UNIVERSIDADE FEDERAL DE ALAGOAS
INSTITUTO DE COMPUTAÇÃO
PROGRAMA DE PÓS GRADUAÇÃO EM INFORMÁTICA

JORGE SANTOS LEANDRO

Estimação de Parâmetros do Modelo do Circuito Equivalente do Sistema Cardiovascular
Humano Usando Deep Learning

Maceió-AL
Agosto de 2021

JORGE SANTOS LEANDRO

Estimação de Parâmetros do Modelo do Circuito Equivalente do Sistema Cardiovascular
Humano Usando Deep Learning

Dissertação apresentada como requisito parcial
para obtenção do grau de Mestre pelo Programa
de Pós-Graduação em Informática do Instituto
de Computação da Universidade Federal de Alagoas.
Orientador: Thiago Damasceno Cordeiro

Maceió-AL
Agosto de 2021

Catalogação na Fonte
Universidade Federal de Alagoas
Biblioteca Central
Divisão de Tratamento Técnico
Bibliotecário: Marcelino de Carvalho Freitas Neto – CRB-4 - 1767
L437e

Leandro, Jorge Santos.
Estimação de parâmetros do modelo do circuito equivalente do
sistema cardiovascular humano usando deep learning / Jorge Santos
Leandro. – 2021.
44 f. : il.
Orientador: Thiago Damasceno Cordeiro.
Dissertação (mestrado em Informática) - Universidade Federal de
Alagoas. Instituto de Computação. Maceió, 2021.
Bibliografia: f. 43-44.
1. Estimação paramétrica. 2. Variáveis hemodinâmicas - Simulação
(Computadores). 3. Modelagem computacional específica para o paciente. 4.
Aprendizagem profunda. 5. Redes neurais. I. Título.
CDU: 004.414.23

AGRADECIMENTOS

Ao professor Thiago Cordeiro, que nunca mediu esforços para difundir conhecimento e
contribuiu ativamente na estrutura de formação que eu adquiri nesta etapa.
À minha família, Yasmim e Lara, que simplesmente são meu motivo.
Aos meus pais, Gilberto e Mary, pois sempre se doaram ao máximo e também fazem
parte de cada conquista.
A todos os meus amigos, que me ajudaram consideravelmente no pré-projeto para
ingresso neste programa de mestrado.
A Deus, meu sustento.

RESUMO
Pacientes portadores de doenças cardíacas graves ainda encontram no transplante cardíaco a
melhor opção de tratamento. Entretanto, os chamados Dispositivos de Assistência Ventricular
(DAVs) vêm sendo utilizados com sucesso no suporte ao bombeamento do músculo cardíaco
na tentativa de suprir as necessidades do sistema cardiovascular humano (SCH). Os chamados
modelos a parâmetros concentrados possuem grande importância para a realização de simulações
computacionais de variáveis hemodinâmicas (VHs), seja utilizando modelos do SCH ou modelos
do DAV, o que viabiliza a análise de desempenho de diferentes modos de operação antes mesmo
de implantar o dispositivo no paciente. Além disso, modelos específicos para um determinado
paciente permitem que a sintonia de sistemas de controle seja realizada de acordo com a
situação clínica deste paciente. Sabe-se que processo de estimação paramétrica de tais modelos
necessita dados do paciente e nem sempre as VHs de interesse encontram-se disponíveis e
de maneira não invasiva. Em face ao exposto, deve-se buscar a utilização de VHs que sejam
preferencialmente obtidas por meio de técnicas não invasivas. Neste trabalho, investiga-se a
viabilidade de implementação de um processo de estimação paramétrica de um modelo do
sistema cardiovascular. Para este propósito, são utilizadas técnicas de aprendizagem profunda,
tendo como sinal de entrada apenas o sinal de pressão arterial sistêmica em forma de onda, uma
vez que esta VH pode ser obtida utilizando-se métodos não invasivos. Com base no modelo,
uma base de dados sintética foi gerada e subdividida em 3 partes: treinamento, validação e
teste. Estas subdivisões foram utilizadas para treinar os modelos das redes neurais. Um estudo
de sensibilidade paramétrica analisa a influência da variação de cada um dos parâmetros deste
modelo em todas as VHs, uma vez que esta correlação está diretamente relacionada à precisão dos
valores estimados dos parâmetros. Os resultados destacam baixíssima sensibilidade da pressão
sistêmica com relação a determinados parâmetros, o que prejudica a estimação destes e confirma
a necessidade da adição de mais VHs como entrada para o estimador. O estudo de sensibilidade
também destaca que a variação de alguns parâmetros não têm influência significativa em nenhuma
das VH, prejudicando todo o processo de estimação para um paciente específico.

Palavras-chaves: Estimação paramétrica, Variáveis Hemodinâmicas, Modelos 0D, Paciente
Específico, Aprendizagem Profunda.

ABSTRACT
For patients with severe heart diseases, heart transplantation is still the best treatment option.
However, the so-called Ventricular Assist Devices (VADs) have been used successfully to
support the pumping of the cardiac muscle to meet the needs of the human cardiovascular system
(CVS). The so-called lumped parameter (0D) models are of great importance for computational
simulations of hemodynamic variables (HVs), either using CVS models or VAD models, making
it possible to analyze the performance of different operation modes even before implanting
the device in the patient. Furthermore, specific models for a given patient allow the tuning of
control systems to be carried out according to the clinical situation of that patient. It is known
that the parametric estimation process of such models requires patient data and the HVs of
interest are not always. Thus, using HVs preferably obtained through non-invasive techniques
and those considered common in the medical-hospital environment should be sought. This work
investigates the feasibility of implementing a parametric estimation process of a 0D model of the
human CVS for specific patients. For this purpose, deep learning techniques are used, having
only the arterial systemic blood pressure signal as input signal since it is can be obtained using
non-invasive methods. The synthetic database was generated and divided in 3 subsets: training,
validation and test. This subsets was used for training the neural network models.The sensitivity
function is calculated to investigate the influence of the CVS parameter variation on all HVs
since this correlation is directly related to the accuracy of the estimated parameter values. The
results highlight the very low sensitivity of systemic pressure for certain parameters. This fact
impairs their estimation and confirms the need to add more HVs as inputs to the estimator. The
sensitivity study also highlights that some parameters’ variation does not significantly influence
any of the HVs, impairing the entire estimation process for a specific patient.

Keywords: Parametric Estimation, Hemodynamic Variables, 0D Models, Patient Specific, Deep
Learning.

LISTA DE ILUSTRAÇÕES
Figura 1 – Coração humano. Editado de: <https://freesvg.org/human-heart-image> . . 14
Figura 2 – Circuito elétrico utilizado para representar o modelo 0D do sistema cardiovascular (adaptado de (SIMAAN et al., 2008)). . . . . . . . . . . . . . . . . 15
Figura 3 – Função elastância do ventrículo esquerdo . . . . . . . . . . . . . . . . . . . 16
Figura 4 – Resultados de simulação com os parâmetros do modelo 0D desenvolvido
listados por Simaan et al. (SIMAAN et al., 2008), descrevendo um paciente
adulto e saudável. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Figura 5 – Exemplo básico de um neurônio artificial com n entradas. . . . . . . . . . . 18
Figura 6 – Funções de ativação: (a) Sigmóide; (b) Tangente hiperbólica (Tanh); (c) linear
retificada (ReLU - Retified Linear Unit) e; (d) linear. . . . . . . . . . . . . . 19
Figura 7 – Exemplo simplificado da operação de convolução . . . . . . . . . . . . . . 21
Figura 8 – Exemplo da aplicação de agrupamento (pooling) com stride 2 . . . . . . . . 22
Figura 9 – Aplicação de convolução em um sinal, adaptado de (FAWAZ et al., 2019) . . 22
Figura 10 – Comparação de 4 (quatro) curvas da pressão arterial sistêmica Ps (t), com 3
ciclos cardíacos e mesma frequência de batimentos, observadas a partir de
alterações proporcionais no valor de base da resistência sistêmica, Rs = 1
mmHg.s/ml. Percebe-se que a variação deste parâmetro tem forte influência
na dinâmica da curva de Ps (t). . . . . . . . . . . . . . . . . . . . . . . . . 24
Figura 11 – Processo de treinamento dos algoritmos de estimação paramétrica baseados
em aprendizagem de máquina. A comparação entre os dados reais (✓i ) e
os dados estimados (✓i est ) é dada pelo cálculo do erro mais adequado ao
problema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Figura 12 – Representação do valor máximo das funções de sensibilidade de todas as
variáveis hemodinâmicas representadas pelo modelo em relação a todos os
parâmetros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Figura 13 – Sinal da pressão arterial sistêmica observado a partir de alterações nas resistências do circuito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Figura 14 – a) Sinal Ps ger ; b) com alteração aleatória das resistências Rs , Rm , Ra e Rc ,
criado pelo autor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Figura 15 – Representação de curva periódica da pressão arterial sistêmica (azul) gerada
pelo modelo 0D do SCH atingindo o regime permanente em comparação a
uma curva de referência teórica (vermelha) da mesma variável hemodinâmica. 29
Figura 16 – Comparação entre os valores reais utilizados no modelo (azul) e os valores
estimados (laranja) para cada parâmetro de ✓ utilizando redes MLP. . . . . . 30
Figura 17 – Comparação entre os valores reais utilizados no modelo (azul) e os valores
estimados (laranja) para cada ✓ utilizando redes MLP. . . . . . . . . . . . . 31

Figura 18 – Comparativo entre Ps (t) (azul) e Ps est (t) (laranja) gerados pelo modelo
usando os vetores entre ✓1 e ✓9 . . . . . . . . . . . . . . . . . . . . . . . .
Figura 19 – Gráfico representativo da taxa de acerto de uma rede MLP (laranja) para cada
parâmetro de ✓ considerando uma tolerância de ± 10%. . . . . . . . . . . .
Figura 20 – Comparação entre os valores reais utilizados no modelo (azul) e os valores
estimados (marrom) para cada parâmetro de ✓ utilizando redes LSTM. . . .
Figura 21 – Comparação entre os valores reais utilizados no modelo (azul) e os valores
estimados (marrom) para cada ✓ utilizando redes LSTM. . . . . . . . . . .
Figura 22 – Comparativo entre Ps (t) (azul) e Ps est (t) (marrom) gerados pelo modelo
usando os vetores entre ✓1 e ✓9 . . . . . . . . . . . . . . . . . . . . . . . .
Figura 23 – Gráfico representativo da taxa de acerto das rede MLP (laranja) e LSTM
(marron) para cada parâmetro de ✓ considerando uma tolerância de ± 10%. .
Figura 24 – Comparação entre os valores reais utilizados no modelo (azul) e os valores
estimados (verde) para cada parâmetros de ✓ utilizando redes CNN. . . . . .
Figura 25 – Comparação entre os valores reais utilizados no modelo (azul) e os valores
estimados (verde) para cada ✓ utilizando redes CNN. . . . . . . . . . . . . .
Figura 26 – Comparativo entre Ps (t) (azul) e Ps est (t) (verde) gerados pelo modelo
usando os vetores entre ✓1 e ✓9 . . . . . . . . . . . . . . . . . . . . . . . .
Figura 27 – Gráfico representativo da taxa de acerto das rede MLP (laranja), LSTM (marron) e CNN (verde) para cada parâmetro de ✓ considerando uma tolerância
de ± 10%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Figura 28 – Taxa de acerto para cada parâmetro de ✓, considerando uma tolerância de ±
10% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Figura 29 – Taxa de acerto para cada parâmetro de ✓, considerando uma tolerância de ±
10% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Figura 30 – Taxa de acerto para cada parâmetro de ✓, considerando uma tolerância de ±
10% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31
32
33
34
34
35
36
37
37

38
39
40
41

LISTA DE TABELAS
Tabela 1 – Valores de referência utilizados em (SIMAAN et al., 2008) . . . . . . . . .
Tabela 2 – Condição inicial das variáveis hemodinâmicas do modelo do sistema cardiovascular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15
17

LISTA DE ABREVIATURAS E SIGLAS

CNN

Convolutional Neural Network

DAV

Dispositivo de Assistência Ventricular

ECG

Eletrocardiograma

LSTM

Long Short-Term Memory

MLP

Multilayer Perceptron

SCH

Sistema Cardiovascular Humano

SUMÁRIO

1
1.1
1.2
1.3

INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Objetivo Geral e Específico . . . . . . . . . . . . . . . . . . . . . . . . .
Estrutura do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10
10
11
12

2
2.1
2.2
2.3
2.3.1
2.3.2
2.3.3
2.4

FUNDAMENTAÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sistema Cardiovascular Humano . . . . . . . . . . . . . . . . . . . . . .
Modelo 0D do Sistema Cardiovascular . . . . . . . . . . . . . . . . . . .
Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . .
Redes Neurais Multicamadas . . . . . . . . . . . . . . . . . . . . . . . .
Redes Neurais Recorrentes . . . . . . . . . . . . . . . . . . . . . . . . .
Redes Neurais Convolucionais . . . . . . . . . . . . . . . . . . . . . . . .
Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13
13
14
17
17
19
20
22

3
3.1
3.2
3.3

METODOLOGIA PROPOSTA . . . . . . . . . . . . . . . . . . . . . . .
Estimação Paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sensibilidade paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . .
Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23
23
25
26

4
4.1
4.2
4.3
4.4
4.5

27
27
29
32
35

4.6

RESULTADOS E DISCUSSÕES . . . . . . . . . . . . . . . . . . . . . .
Geração dos sinais sintéticos da pressão arterial . . . . . . . . . . . . . .
Estimação utilizando o topologia MLP . . . . . . . . . . . . . . . . . . .
Estimação utilizando o algoritmo LSTM . . . . . . . . . . . . . . . . . .
Estimação utilizando o algoritmo CNN . . . . . . . . . . . . . . . . . . .
Estimação utilizando o algoritmo CNN com alteração na base de treinamento e exclusão de parâmetros . . . . . . . . . . . . . . . . . . . . . . .
Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5
5.1

CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

42
42

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

39
41

10

1 INTRODUÇÃO

Pacientes portadores de doenças cardíacas graves, como a insuficiência cardíaca congestiva, encontram no transplante cardíaco a melhor opção de tratamento. Entretanto, devido
à escassez de órgãos disponíveis, este procedimento torna-se inviável na maioria dos casos
(KIM; YOUN; KOBASHIGAWA, 2018). Como tratamento alternativo de longa duração, ou
apenas como ponte para o transplante, destacam-se os chamados Dispositivos de Assistência
Ventricular (DAVs), que são bombas mecânicas implantadas cirurgicamente com o objetivo de
fornecer suporte ao mecanismo fisiológico de bombeamento de um músculo cardíaco deficiente
e suprir as necessidades do sistema cardiovascular humano (SCH). Para otimizar o desempenho
desses dispositivos, modos de operação são configurados especificamente para cada paciente,
respeitando-se os limites de operação da bomba e as condições clínicas de cada indivíduo
(CORDEIRO et al., 2020).
1.1

Motivação

Neste contexto, modelos a parâmetros concentrados, também chamados de modelos 0D,
possuem grande importância no desenvolvimento de pesquisas relacionadas ao tratamento de
pacientes com doenças cardíacas e com DAVs implantados. Este fato é resultante da capacidade
de verificar o comportamento das variáveis hemodinâmicas mediante alterações paramétricas,
tanto em modelos do SCH quanto em modelos do DAV. Além disso, é necessário enfatizar a
vantagem da utilização de simulação computacional para avaliar o desempenho do conjunto
SCH+DAV, o que permite o analisar diversos modos de operação sem a necessidade de implantar
o DAV no paciente. Outra grande vantagem em se trabalhar com modelos específicos para um
determinado paciente surfe quando é necessário sintonizar um controlador fisiológico aplicado
ao conjunto SCH+DAV, uma vez que os ganhos de cada controlador devem ser ajustados de
acordo com a situação clínica do paciente (ALOMARI et al., 2012).
Embora a utilização de modelos 0D para o SCH auxilie na obtenção de melhores
condições de operação de determinados DAVs, dados reais de variáveis hemodinâmicas são
necessárias para a determinação dos parâmetros desses modelos. Em situações clínicas, o
problema torna-se ainda mais complexo pois nem sempre variáveis hemodinâmicas de interesse
encontram-se disponíveis e de maneira não invasiva. Ressalta-se que medições obtidas por
métodos invasivos geralmente são agressivos ao corpo humano e não devem ser utilizados por
longos períodos de tempo, a fim de evitar quadros de infecção, e.g., exames invasivos como o
cateterismo apresentam riscos de hematomas, sangramento, danos na artéria ou no coração, além
da formação de coágulos que podem causar derrame cerebral e até mesmo o infarto agudo do
miocárdio (IAM) (ARORA et al., 2007). Por isso, é de extrema relevância considerar que quanto
menor a quantidade de intervenções invasivas em um paciente, menor será a possibilidade de
morte, o que já justifica a preferência por métodos não invasivos.

11
É fato que o avanço em tecnologias tanto de hardware como de software para análise
e processamento de variáveis hemodinâmicas vem permitindo o estudo do SCH por meio
de exames não invasivos como ecocardiografia (KESHAVARZ-MOTAMED et al., 2014) ou
ressonância magnética (CASAS et al., 2017). Entretanto, tais exames são muito caros, o que
torna o custo das medições muito elevado e não adequado. Destaca-se ainda que nem sempre
os dispositivos responsáveis pela obtenção dos dados encontram-se disponíveis em ambientes
clínicos ou ainda que é necessário mover o paciente dentro do ambiente clínico, o que nem
sempre é possível. Em face ao exposto, é fácil perceber que para a estimação do conjunto de
parâmetros de um determinado modelo, deve-se buscar a utilização de variáveis hemodinâmicas
que sejam preferencialmente obtidas por meio de técnicas não invasivas, preferencialmente
aquelas consideradas comuns no ambiente médico-hospitalar.
Neste trabalho, pretende-se investigar a possibilidade de utilização apenas de dados da
pressão sistêmica de um paciente para estimar os parâmetros de um modelo 0D do SCH a fim
de reproduzir outras variáveis hemodinâmicas do mesmo paciente. A escolha desta variável é
justificada por ser facilmente obtida com técnicas não invasivas de medição. Outras variáveis do
modelo farão parte deste processo investigativo, uma vez que os sinais harmônicos da pressão
arterial sistêmica podem não ser suficientes para a obtenção da correlação variável-parâmetros.
Consequentemente, surge a necessidade de um estudo aplicado de sensibilidade paramétrica
para compreender a influência que a alteração de um parâmetro gera nas respectivas variáveis de
saída. Uma base de dados composta por sinais sintéticos da pressão sistêmica, desenvolvida no
escopo deste trabalho, será utilizada como entrada para diferentes algoritmos de aprendizagem
profunda utilizados no processo de estimação. A utilização de diferentes técnicas permitirá a
comparação entre elas, com base em índices de desempenho, para fins de tomada de decisão
entre a técnica mais adequada.
1.2

Objetivo Geral e Específico

O objetivo geral desta proposta é desenvolver uma metodologia de estimação de parâmetros para um modelo 0D do sistema cardiovascular humano, para pacientes específicos,
usando técnicas de aprendizagem profunda e tendo como sinal de entrada apenas o sinal da
pressão arterial sistêmica em forma de onda, Ps , uma vez que esta variável é facilmente obtida
utilizando-se métodos não invasivos.
Os objetivos específicos propostos para a obtenção dos principais resultados deste
trabalho são:
• Criar base de dados com sinais sintéticos da pressão arterial sistêmica.
• Analisar a sensibilidade das variáveis do modelo aos seus parâmetros.
• Definir metodologia para estimação paramétrica utilizando aprendizagem profunda.

12
• Comparar os sinais da pressão arterial sistêmica gerados pelo modelo entre o conjunto de
parâmetros sintéticos e estimados.
1.3

Estrutura do trabalho

No capítulo 2, é apresentada a fundamentação teórica necessário para o entendimento do
problema apresentado nesta dissertação. Primeiramente, os conceitos básicos do funcionamento
do sistema cardiovascular serão apresentados, além de um modelo de 5ª ordem que será utilizado
para simular o lado esquerdo da do SCH. Uma discussão breve sobre redes neurais artificiais
é apresentada, com ênfase nas redes multicamadas, recorrentes e convolucionais, que serão as
arquiteturas testadas na metodologia.
No capítulo 3 a metodologia proposta é apresentada e discutida junto com o estudo de
sensibilidade paramétrica para avaliar o impacto da variação de cada parâmetro em cada variável
hemodinâmica representada no modelo 0D.
O capítulo 4 apresenta e discute os resultados obtidos neste trabalho e o capítulo 5
apresenta a conclusão e aponta possíveis trabalhos futuros.

13

2 FUNDAMENTAÇÃO

2.1

Sistema Cardiovascular Humano

O sistema cardiovascular humano é responsável pela distribuição de nutrientes, oxigênio
e hormônios, bem como pelo transporte de substâncias indesejadas para os órgãos excretores. É
basicamente composto por vasos sanguíneos e pelo coração, órgão central do sistema cardiovascular, que é dividido em quatro câmaras, sendo dois átrios e dois ventrículos (Figura 1). Cada
par átrio-ventrículo é localizado em um lado do coração (esquerdo ou direito) e é separado por
válvulas sensíveis ao diferencial de pressão (válvulas de retenção). A função básica do coração
é bombear sangue oxigenado para todo o corpo humano, procedimento que ocorre em dois
momentos cíclicos de relaxamento e contração: diástole e sístole, respectivamente.
O início da sístole é marcado pelo encerramento da fase de enchimento do ventrículo e
pelo início da contração do músculo cardíaco, onde o ventrículo, cheio de sangue, é submetido a
uma elevação de pressão sem que a válvula de saída do ventrículo seja aberta (fase de contração
isovolumétrica). Quando esta pressão é suficiente para abrir a válvula aórtica, o fluxo de sangue
é liberado para o resto do corpo (fase de ejeção). Durante a ejeção, a pressão continua subindo conforme o pulso contrátil do coração - e em seguida entra em uma curva de redução, ocasionando
o fechamento da válvula aórtica (fase de relaxamento isovolumétrico).
Quando o músculo cardíaco entra em relaxamento (diástole) os átrios enchem-se de
sangue e a pressão no interior dessas câmaras eleva até alcançar um valor suficiente para abrir as
válvulas átrio-ventriculares, permitindo que o sangue flua para o interior dos ventrículos. Durante
a contração (sístole) a pressão nos ventrículos aumenta consideravelmente, fechando as válvulas
de entrada do fluxo sanguíneo e abrindo as respectivas válvulas de saída dos ventrículos.
Para compreender o caminho total percorrido pelo sangue, podemos iniciar pela entrada
de sangue no átrio esquerdo do coração, que ocorre após as trocas gasosas nos alvéolos pulmonares, tornando o sangue rico em oxigênio. Após o enchimento do átrio esquerdo, o sangue flui pela
válvula mitral e chega até o ventrículo esquerdo, responsável por bombear o sangue para todas
as partes do corpo humano em bons níveis de pressão. Esta é a chamada circulação sistêmica,
que torna-se relevante para este trabalho de pesquisa pois é exatamente nesta circulação que é
possível obter a pressão arterial sistêmica.
Com o fim da circulação sistêmica, o sangue retorna de todas as partes do corpo e entra
no coração pelo átrio direito. Após passar pela válvula tricúspide, chega até o ventrículo direito,
responsável por bombear sangue através da válvula pulmonar para os pulmões a fim de que as
trocas gasosas possam ocorrer novamente. Esta é a chamada circulação pulmonar.

14

Figura 1 – Coração humano. Editado de: <https://freesvg.org/human-heart-image>
2.2

Modelo 0D do Sistema Cardiovascular

O modelo do sistema cardiovascular utilizado neste trabalho foi proposto em (SIMAAN
et al., 2008), e é representado pelo circuito elétrico apresentado na Figura 2. Trata-se de um
modelo 0D de 5ª ordem capaz de simular o comportamento de variáveis hemodinâmicas como
pressão, fluxo e volume sanguíneo. As variáveis de tensão e corrente elétrica deste circuito são
equivalentes a: pressão na aorta (Pao ); fluxo na aorta (Qao ); pressão do ventrículo esquerdo
(Pve ); pressão sistêmica – (Ps ); pressão no átrio esquerdo (Pae ). As válvulas mitral e aórtica
são representadas de modo ideal, com relação aos movimentos de abertura e fechamento, pelo
conjunto resistor-diodo Rm Dm e Ra Da , respectivamente. A complacência aórtica é
representada pelo capacitor Cao e a complacência do ventrículo esquerdo é modelada pelo
capacitor C(t) variante no tempo.
Este modelo do SCH tem como finalidade representar bem o funcionamento do lado
esquerdo do coração, com ênfase no comportamento do ventrículo esquerdo. Para representar
o bombeamento dessa câmara, foi utilizada a função elastância, que relaciona a pressão com o
volume, conforme equação a seguir (SUGA; SAGAWA, 1974):
E(t) =

Pve (t)
Vve (t) V0

(2.1)

15

Rs

Pae

Rm Dm Pve
Cae

Ra Da

C(t)

Pao Rc

L

Ps

Cao

Cs

Figura 2 – Circuito elétrico utilizado para representar o modelo 0D do sistema cardiovascular
(adaptado de (SIMAAN et al., 2008)).
Tabela 1 – Valores de referência utilizados em (SIMAAN et al., 2008)
Parâmetros Valor
Resistências (mmHg.s/ml)
Rs
1,0000
Rm
0,0050
Ra
0,0010
Rc
0,0398
Complacências (ml/mmHg)
C(t)
Variante no tempo
Cr
4,4000
Cs
1,3300
Ca
0,0800
Inertância (mmHg.s2 /ml)
Ls
0,0005

Mecanismo fisiológico
Vascular Sistêmica (RVS)
Mitral
Aórtica
Característica
Ventricular esquerda
Atrial esquerda
Sistêmica
Aórtica
Sanguinea na aorta

onde Pve (t) é a pressão no ventrículo esquerdo, Vve (t) é o volume no ventrículo esquerdo e V0
representa o volume teórico quando o ventrículo está com a pressão nula (SIMAAN et al., 2008).
Suga e Sagawa (SUGA; SAGAWA, 1974) também definiram essa função como o inverso
da complacência ventricular, que representa o comportamento de um ventrículo. A função
analítica utilizada neste trabalho para aproximar o formato da função elastância é a seguinte:
E(t) = 1/C(t) = (Emax

Emin )En (tn ) + Emin

(2.2)

sendo Emax e Emin constantes relacionadas à amplitude da função elastância, ou seja, à contratilidade do ventrículo. O termo En (tn ) é uma função normalizada no tempo e na amplitude, sendo
representada pela chamada função double hill, com valor mínimo igual a zero e valor máximo
igual a um em tn = 1, sendo representada pela seguinte expressão:

16

2 ⇣

6
En (tn ) = 1, 55. 4

1+

tn
0,7

⇣

⌘1,9 3 2

tn
0,7

7 6
⌘1,9 5 . 4

1+

⇣

1
tn
1,17

3

7
⌘21,9 5

(2.3)

onde tn = t/Tmax é o tempo normalizado para um ciclo cardíaco, Tmax = 0, 2 + 0, 15T , sendo
T o intervalo de tempo referente à duração de um ciclo cardíaco e calculado como T = 60/F C,
sendo F C igual à frequência cardíaca (SIMAAN et al., 2008). A Figura 3 mostra o formato da
função E(t).

Figura 3 – Função elastância do ventrículo esquerdo
De acordo com Ferreira et al. (FERREIRA et al., 2005), a utilização da pressão no
ventrículo esquerdo como variável de estado para o sistema pode causar instabilidade numérica durante o processo de integração numérica do modelo. Este fato é decorrente do termo
Ċ(t)/C(t) que surge no interior da matriz de estados. Essa dificuldade é superada por Cordeiro
et al. (CORDEIRO et al., 2020), que propõe a utilização do volume do ventrículo esquerdo,
Vve (t), como variável de estado no lugar da pressão do ventrículo esquerdo. Esta abordagem será
adotada nesta pesquisa.
Todas as simulações deste trabalho estão de acordo com os resultados apresentados em
(SIMAAN et al., 2008), através o método de integração de Euler, com passo fixo de 10 4 e com
as condições iniciais, conforme Tabela 2. O equipamento utilizado em todas as etapas foi um
notebook Dell 7559-A10, chipset HM170 Express, processador Intel Core i5-6300HQ 2.3 GHz,
com memória de 16GB RAM e placa de vídeo Nvidia GTX 960m 4GB. Os sinais de saída do
modelo podem ser vistos na Figura 4.

17
Variáveis
Valor inicial
Volume no ventrículo esquerdo
140 ml
Pressão no átrio esquerdo
5 mmHg
Fluxo na aorta
0 ml/s
Pressão na aorta
90 mmHg
Pressão sistêmica
90 mmHg
Tabela 2 – Condição inicial das variáveis hemodinâmicas do modelo do sistema cardiovascular.

Figura 4 – Resultados de simulação com os parâmetros do modelo 0D desenvolvido listados por
Simaan et al. (SIMAAN et al., 2008), descrevendo um paciente adulto e saudável.
2.3

Redes Neurais Artificiais

O estudo de redes neurais artificiais, também conhecidas pelo termo em inglês ANNs Artificial Neural Networks tem como objetivo fazer com que computadores possam aprender a
partir da observação de dados (NIELSEN, 2015), de forma que não seja necessário determinar
cada passo que a máquina precisa seguir para resolver um problema.
2.3.1

Redes Neurais Multicamadas

Um neurônio artificial (do termo inglês perceptron) é composto por um vetor de entradas
xi , com i = 1, 2, . . . , n; por um conjunto de pesos wi , com i = 1, 2, . . . , n; por uma função
soma e uma função de ativação (Fig. 5). Qualquer vetor de entrada recebido por um perceptron é
submetido à multiplicação de seus valores pelos respectivos pesos, gerando um novo conjunto
de pesos, !i , com i = 1, 2, . . . , n. Este novo vetor será utilizado na próxima iteração, de acordo

18
com a equação a seguir:
!=

n
X
i=1

Entradas

Pesos

(2.4)

xi ⇤ w i

Função
soma

Função
de
ativação

Figura 5 – Exemplo básico de um neurônio artificial com n entradas.
Na etapa seguinte, uma função de ativação é aplicada com objetivo de determinar a
saída do neurônio. A função Sigmóide (Fig. 6a) é classicamente usada como uma função de
probabilidade para classificação binária. Tomando como referência um exemplo simplificado,
um valor de 0,87 indica 87% de chance da resposta correta ser o valor 1 (um) e 13% de chance
de ser o valor 0 (zero). Outro tipo de função sigmoidal (formato de "S") é a tangente hiperbólica
(Fig. 6b), que apresenta como vantagem em relação à anterior sua variação entre -1 e 1, fazendo
com que entradas negativas sejam caracterizadas como fortemente negativas e entradas nulas
sejam mapeadas próximas a 0. Já a função linear retificada (Retified Linear Unit - ReLU)
6c tem como vantagem conter uma característica não-linear sendo, ao mesmo tempo, uma
função computacionalmente simples, quando comparada as demais. Sabe-se que no processo de
otimização de uma rede neural a derivada parcial da função de ativação é um dos parâmetros
usados para o cálculo do passo em direção ao máximos (mínimos) globais. Dessa forma, quando
uma função de ativação linear (Fig. 6d) é utilizada, o processo de otimização é considerado
linear, uma vez que a derivada dessa função de ativação é uma constante, diferentemente de
funções de ativação não-lineares como as mostradas anteriormente. No entanto, destaca-se o uso
dessa função em trabalhos de regressão, considerando que a rede terá como saída um valor real,
não uma probabilidade.
As redes neurais artificiais perceptron multicamadas, também conhecidas pelo termo
em inglês Multilayer Perceptron, ou ainda pelo termo totalmente conectadas, em inglês Fully
Connected, apresentam-se com a combinação de vários perceptrons organizados em camadas,
que podem ser divididas em: camada de entrada (representada mais à esquerda), onde os dados
são inseridos na rede; camada de saída (mais à direita), onde as respostas proveniente da rede
são obtidas e; camadas ocultas, localizadas entre as camadas de entrada e de saída. Como
mencionado anteriormente, cada neurônio deve possuir um peso relacionado. Dessa forma, uma
rede neural destinada a processos de estimação paramétrica é considerada treinada e validada

19

Figura 6 – Funções de ativação: (a) Sigmóide; (b) Tangente hiperbólica (Tanh); (c) linear retificada (ReLU - Retified Linear Unit) e; (d) linear.
quando uma combinação de pesos de todos os neurônios é tal que o erro entre os parâmetros
estimados e os parâmetros reais é mínimo.
2.3.2

Redes Neurais Recorrentes

A segunda técnica avaliada neste trabalho segue a abordagem de redes neurais recorrentes,
também conhecidas pelo termo em inglês RNN - Recurrent Neural Networks, as quais são
classificadas como modelos sequenciais adequados para o estudo do comportamento temporal,
uma vez que permitem a correlação entre informações passadas e informações atuais ((KONG et
al., 2017)). Vale ressaltar que a diferença entre redes neurais clássicas (MLP) e RNNs está em
suas camadas ocultas. Conforme explicado na subseção anterior, em redes MLP o sinal recebido
por uma camada oculta é processado e enviado à próxima camada. Já em uma camada oculta de
uma RNN, o resultado é salvo para ser utilizado como uma das entradas desta mesma camada,
porém na iteração seguinte. Em outras palavras, na próxima iteração, os dados de entrada desta
camada serão: o sinal recebido da camada antecedente adicionado ao resultado da iteração
anterior. Essa operação pode ser definida pelas equações seguintes, disponíveis em (PASCANU
et al., 2013):
ht =fh (xt , ht 1 )

(2.5)

yt =fo (ht )

(2.6)

sendo fh a função de transição de estado e fo a função de saída. Uma rede neural recorrente
tradicional é construída usando como base as equações anteriores com a adição de matrizes de

20
transição (W), de entrada (U) e de saída (V), conforme equações seguintes:
W> ht 1 + U> xt

ht =fh (xt , ht 1 ) =

h

yt =fo (ht , xt ) =

V> ht

o

(2.7)
(2.8)

Para que uma RNN aprenda dependências de "longo prazo", ou seja, para que valores
muito anteriores no tempo possam colaborar com o aprendizado da rede, é necessário uma
camada oculta maior que leve em consideração esses valores passados. Uma função é aplicada
de forma recorrente até a observação desejada e quanto maior a camada oculta, maior o número
de recorrências.
Por exemplo, para obter a observação de um sinal discreto x[n] no instante x[t 2],
partindo do instante x[t 3], multiplica-se o valor x[t 3] pelo peso recorrente. Do mesmo modo,
para obter o valor x[t 1] partindo do valor do sinal no instante x[t 2], multiplica-se novamente
x[t 2] pelo peso recorrente. Em suma, é preciso multiplicar o mesmo peso várias vezes,
tantas quantas seja necessário, incorrendo no problema conhecido como dissipação do gradiente,
ou do termo em inglês gradient vanishing. Esse problema ocorre devido à multiplicação de
um determinado valor do referido sinal (x[n]) por um peso recorrente com valor próximo a 0
(zero), fazendo com que o resultado das multiplicações sucessivas diminua exponencialmente,
inviabilizando o processo de otimização, e.g., minimização do erro entre vetores de parâmetros
em problema de estimação paramétrica.
Uma solução para este problema é a utilização de células de memória nas chamadas
redes LSTM (Long Short-Term memory), inicialmente apresentadas por (HOCHREITER; SCHMIDHUBER, 1997) e amplamente utilizadas na literatura como solução para muitas pesquisas
em séries temporais nos mais variados ramos, como por exemplo: setor financeiro (CAO; LI;
LI, 2019); eletrocardiografia (YILDIRIM, 2018) e; processos industriais (SAGHEER; KOTB,
2019). Tais células de memória têm a capacidade de guardar eventos passados de longo prazo e
são sensíveis a nuances. Ainda que essa sensibilidade possa transferir a variância/dinâmica do
sinal de entrada para os sinais de saída, acredita-se que essa particularidade possa ser contornada
por outras camadas subsequentes (ABDEL-NASSER; MAHMOUD, 2019).
A arquitetura usada aqui será a DLSTM (Deep Long Short-term memory), a qual consiste
em empilhar sequencialmente camadas LSTM (SAK; SENIOR; BEAUFAYS, 2014). Levando em
consideração que, fazendo uso dos mesmos métodos, a topologia utilizada pode gerar resultados
diferentes, destaca-se a necessidade de verificar qual é a arquitetura mais adequada para o
problema proposto, bem como seus hiperparâmetros.
2.3.3

Redes Neurais Convolucionais

Redes neurais convolucionais (CNN - Convolutional Neural Networks) foram utilizadas
inicialmente na área de visão computacional com o objetivo de destacar regiões mais relevantes
em imagens, ou seja, aplicar filtros que permitem gerar novas imagens trazendo mais relevância

21
a uma determinada característica. Dessa forma, a técnica de convolução consiste em aplicar esses
filtros (kernels) aos dados de entrada, gerando um mapa de características.
A operação convolucional ocorre a partir da segmentação dos dados de entrada e posterior
multiplicação dos dados segmentados pelos chamados kernels. Como pode ser visto na Figura
7, uma imagem representada por uma matriz com dimensão 6x6 pode ser segmentada em160
submatrizes com dimensão 3x3, que é a mesma dimensão do kernel. Isto é possível com a
aplicação de um deslocamento (em inglês chamado de stride) do kernel igual a 1. Dessa forma,
cada elemento de uma determinada submatriz é multiplicado pelo elemento respectivo do kernel
e, como resultado final, tem-se a soma de todas essas multiplicações, gerando uma nova matriz
com dimensão 4x4 que destaca características da imagem inicial nos índices que apresentam
maior valor.

Figura 7 – Exemplo simplificado da operação de convolução
Toda operação convolucional é seguida de uma camada de agrupamento, também conhecida pelo termo em inglês pooling, que tem como objetivo simplificar os mapas de características
gerados pela operação convolucional. Dentre as técnicas de agrupamento podemos citar as
seguintes: Max Pooling, a qual retorna o valor máximo de cada região e; Average Pooling, a
qual retorna o valor médio de cada região. Um exemplo pode ser visto na Figura 8, onde as duas
técnicas citadas são aplicadas ao mapa de características gerado pela operação convolucional
ilustrada na Figura 7 com stride 2 (dois).
Considerando que essa arquitetura possui a capacidade de destacar características em
sinais diferentes, fato atribuído aos filtros convolucionais, justifica-se o uso de CNNs para este
trabalho, uma vez que os sinais distintos de Ps (t) apresentam diferenças em regiões discriminativas (FAWAZ et al., 2019). Esse fenômeno pode ser visualizado na Figura 9, onde um mesmo
kernel é aplicado tanto na curva 1 (em azul) quanto na curva 2 (em vermelho). Neste exemplo, o
resultado da convolução entre o kernel e as duas curvas destacam a diferença de características

22

Figura 8 – Exemplo da aplicação de agrupamento (pooling) com stride 2
entre elas salientando a região discriminativa. Em (IGNATOV, 2018) CNNs são utilizadas para
lidar com séries temporais.

Figura 9 – Aplicação de convolução em um sinal, adaptado de (FAWAZ et al., 2019)
2.4

Considerações finais

Neste capítulo foi apresentada a fundamentação teórica para o desenvolvimento desta
pesquisa com ênfase na modelagem 0D do sistema cardiovascular e nas arquiteturas de redes
neurais utilizadas. Em seguida, será apresentada a metodologia utilizada para a geração dos
resultados deste trabalho.

23

3 METODOLOGIA PROPOSTA

Neste capítulo serão mostradas a metodologia de estimação paramétrica utilizada neste
trabalho bem como uma análise de sensibilidade paramétrica realizada para avaliar o impacto da
variação paramétrica na curva da pressão sistêmica.
3.1

Estimação Paramétrica

De acordo com Simaan et al. (SIMAAN et al., 2008), a variação dos parâmetros do
modelo 0D do SCH permite a representação de pacientes com diferentes condições clínicas
(saudáveis ou portadores de doenças cardíacas) como por exemplo a insuficiência cardíaca,
que pode ser representada com aumento da frequência cardíaca e diminuição da complacência
ventricular, representada pelo parâmetro Emax na Equação 2.2. O vetor de parâmetros a ser
estimado neste trabalho será o seguinte:
✓ = {Rs , Rm , Ra , Rc , Cae , Cs , Cao , L, Emax , Emin .}

(3.1)

(YU et al., 1998) realizaram um procedimento de estimação paramétrica de um vetor
semelhante a este utilizando um filtro de Kalman extendido durante as fases de ejeção e de
enchimento do ventrículo esquerdo. Entretanto, os sinais de entrada para o estimador proposto
por estes autores foram dados reais de um paciente durante cirurgia de peito aberto. Claramente,
este processo dificulta a possibilidade de realizar o processo de estimação específica para cada
paciente.
O processo de estimação paramétrica proposto neste trabalho avalia apenas a utilização do
sinal de Ps (t) como entrada para algoritmos de estimação baseados em técnicas de aprendizagem
profunda. A fim de avaliar o desempenho de diferentes técnicas o sinal Ps (t), utilizado como
entrada para os algoritmos de estimação deste trabalho, será gerado pelo modelo 0D com um
vetor ✓ aleatório. O objetivo desse processo é estimar um vetor de parâmetros ✓est que ao ser
aplicado ao modelo do SCH gera o sinal Ps-est (t). O processo de estimação é dito confiável se o
erro gerado entre as duas curvas de pressão sistêmica tender a zero.
Para o processo de treinamento dos algoritmos de estimação foi criada uma base de dados
com 1000 sinais de Ps (t) obtidos com 1000 combinações aleatórias diferentes dos parâmetros do
vetor ✓. Em outras palavras, para cada ✓i aplicado ao modelo do SCH foi gerado um sinal Ps-i (t),
como pode ser visto no exemplo ilustrado na Figura 10, onde 4 (quatro) curvas de Ps (t) foram
obtidas apenas com a variação do valor da resistência sistêmica (Rs ). Durante esta etapa foram
observados dois tipos de instabilidade: transitória, ao alterar os valores de ✓ durante a simulação
e; permanente, quando algum dos parâmetros ultrapassava o limite de estabilidade do modelo,
inviabilizando a continuidade da simulação.

24
Para o processo de criação desta base de dados, foram definidas as seguintes premissas:
• Os sinais analisados serão considerados estáveis
• Passo de integração fixo de 10ˆ 4 mantêm a estabilidade do modelo
• Cada sinal representa um paciente

Figura 10 – Comparação de 4 (quatro) curvas da pressão arterial sistêmica Ps (t), com 3 ciclos
cardíacos e mesma frequência de batimentos, observadas a partir de alterações
proporcionais no valor de base da resistência sistêmica, Rs = 1 mmHg.s/ml. Percebese que a variação deste parâmetro tem forte influência na dinâmica da curva de Ps (t).
Para aplicar o processo de treinamento, toda a base de dados foi normalizada entre 0 e 1,
aplicando:
X Xmin
Z=
(3.2)
Xmax Xmin
Onde Z é o valor normalizado, X é o valor atual, e Xmin e Xmax representam o menor e
o maior valor no conjunto de dados, respectivamente.
Cada sinal Ps-i (t) é amostrado e suas amostras são a entrada para a rede neural em cada
algoritmo de estimação, tendo como saída o vetor estimado ✓i-est (Fig. 11). Os valores de ✓i são
comparados com os valores de ✓i-est e, de acordo com o erro entre esses dois sinais, o algoritmo
de treinamento ajusta os pesos da rede neural para minimizar este erro. A divisão dos dados para
as fases de treinamento, validação e teste foi configurada em 60%, 25% e 15% respectivamente.

25

-

+
Comparação

Atualização
dos pesos

Algoritmo de
treinamento

Figura 11 – Processo de treinamento dos algoritmos de estimação paramétrica baseados em
aprendizagem de máquina. A comparação entre os dados reais (✓i ) e os dados
estimados (✓i est ) é dada pelo cálculo do erro mais adequado ao problema.
3.2

Sensibilidade paramétrica

Conforme observado na Figura 10, é fácil perceber que variações no parâmetro Rs têm
influência no comportamento da curva da pressão sistêmica. A partir desta observação, surgem
as seguintes perguntas:
1. Todos os parâmetros do modelo do SCH, sob variação paramétrica, são capazes de influenciar a pressão sistêmica?
2. Qual o impacto desta influência no processo de estimação paramétrica?
A fim de confirmar se algum parâmetro, quando alterado, tem pouca influência - ou
nenhuma - no comportamento da pressão sistêmica, ou das outras variáveis do modelo, optou-se
por realizar um estudo de sensibilidade paramétrica.
A sensibilidade dos parâmetros do modelo do sistema cardiovascular pode ser obtida
observando-se o comportamento de uma variável ao estímulo de uma alteração no valor de um
determinado parâmetro (YANG et al., 2021). A curva da sensibilidade normalizada pode ser
obtida por meio da seguinte equação:
S✓Pis =

✓i @Ps
, (i = 1 . . . , N )
Ps @✓i

(3.3)

onde S✓Pias é a sensibilidade normalizada que indica a influência da variação de um determinado
parâmetro ✓i , que é o i-ésimo parâmetro do vetor ✓, na variável Pas . Para as análises dessa
dissertação as modificações em ✓i são de 5%. Além disso, foram calculadas as sensibilidades
para todas as variáveis hemodinâmicas do modelo. Este resultado, considerando o máximo de
cada uma das curvas de sensibilidade, pode ser visualizado na Figura 12.

26

Figura 12 – Representação do valor máximo das funções de sensibilidade de todas as variáveis
hemodinâmicas representadas pelo modelo em relação a todos os parâmetros.
Analisando esta imagem, pode-se perceber que a sensibilidade da variável Pve em relação
ao parâmetro Emin é muito alta, o que indica que este parâmetro pode ser estimado com facilidade
usando a curva de Pve . Por outro lado, percebe-se que os parâmetros Ra , Cao e L não terão boas
estimativas com a utilização de nenhuma variável hemodinâmica do modelo. Este resultado
precisa ser confirmado após o processo de estimação paramétrica utilizando os algoritmos de
aprendizagem profunda.
3.3

Considerações finais

No capítulo 3 foram descritas as etapas para a criação da base de dados, o treinamento
das redes neurais e a definição do processo de estimação paramétrica, utilizando como entrada
apenas os sinais da pressão arterial sistêmica. A discussão acerca da estabilidade dos sinais
gerados, com relação ao regime permanente, precisa ser aprofundada com um estudo analítico
sobre a estabilidade do modelo.

27

4 RESULTADOS E DISCUSSÕES

Neste capítulo serão apresentados os resultados deste trabalho, tanto com relação à
geração dos sinais sintéticos da pressão arterial como com relação ao processo de estimação
paramétrica utilizando as topologias de redes apresentadas.
4.1

Geração dos sinais sintéticos da pressão arterial

Foram realizadas simulações com variações nos valores das resistências Rs , Rm , Ra e Rc
com o objetivo de analisar visualmente o efeito direto no comportamento da pressão sistêmica,
Ps (t). O processo de variação de cada parâmetro foi avaliado individualmente, sendo as variações
iguais a 50, 100, 150 e 200% dos valores de referência fornecidos em Simaan et al. (SIMAAN et
al., 2008). Ou seja, as simulações foram realizadas sem modificações simultâneas nos valores
dessas resistências.
Observando a Figura 13, pode-se ver que as mudanças em Ps (t) são altamente relevantes
se tratando das variações no valor do componente Rs (Fig. 13a) e que a mudança no comportamento de Ps (t) é visualmente imperceptível às modificações realizadas no componente Ra (Fig.
13b).

Figura 13 – Sinal da pressão arterial sistêmica observado a partir de alterações nas resistências
do circuito
Com o objetivo analisar a variabilidade do modelo frente a variações de múltiplos
parâmetros, sinais distintos de Ps (t) foram aleatoriamente gerados a cada 10s e com diferentes
valores para as resistências Rs , Rm , Ra e Rc . Em outras palavras, a cada 10s foi utilizado um valor
diferente para o vetor de parâmetros ✓. Tais variações foram realizadas dentro dos limites citados
anteriormente (50 a 200%) e, mais uma vez, tomando como referência os valores utilizados em
(SIMAAN et al., 2008). Embora esses limites tenham sido sugeridos empiricamente, uma vez

28
que os limites de estabilidade desse modelo não são conhecidos e nenhum estudo de limites de
estabilidade tenha sido realizado de modo a facilitar tal escolha, tal variação foi suficiente para
gerar um conjunto de curvas para a análise proposta.
De acordo com a Figura 14.a, pode-se perceber que um intervalo de 10s é suficiente
para obter no mínimo 5 ciclos do sinal estabilizado após a fase transitória, uma vez que essa
oscilação ocorre devido às condições iniciais definidas para o modelo e não é desejada para os
experimentos que foram realizados nesta pesquisa, pois de acordo com as premissas os sinais
dos pacientes são considerados estáveis. Destaca-se que o sinal comparado apenas será avaliado
em ciclos estáveis. Na figura 14.b, visualiza-se as curvas dos parâmetros com 5 variações.

Figura 14 – a) Sinal Ps ger ; b) com alteração aleatória das resistências Rs , Rm , Ra e Rc , criado
pelo autor
Para garantir que o sinal esteja estável, foi necessário definir a partir de que instante
de tempo o sistema alcança um estado em que suas variáveis são mantidas em formas de onda
periódica, validando a premissa supracitada. Sabe-se que uma forma de onda é dita periódica se
esta obedece a equação a seguir:
f (t0 ) = f (t0 ± nT )

(4.1)

onde n é um número inteiro e T é o período. Dessa forma basta obter o instante de tempo a partir

29
do qual o erro de uma determinada variável do modelo nos pontos f (t) e f (t + nT ) se aproxima
de 0, considerando uma faixa de ±5% (Fig. 15).
Para complementar esta análise, o valor mínimo da frequência cardíaca foi usado, uma
vez que quanto menor a frequência de um sinal maior o período T , e isso implica diretamente
no tempo de regime transitório, deixando-o mais extenso. No problema em questão, para a
F C = 60 bpm (batimentos por minuto) o tempo de regime transitório foi de 2, 2335s e para
F C = 160 bpm, o tempo foi de 1, 4435s. Para garantir que apenas sinais em regime permanente
serão coletados, todos os sinais serão considerados sempre após os 3 segundos iniciais de
simulação. Por fim, para o método de análise comparativa sugerido nesta pesquisa, cada amostra
deve conter um ciclo do sinal de Ps (t), garantindo que todos os sinais possuam a mesma
quantidade de amostras.

Figura 15 – Representação de curva periódica da pressão arterial sistêmica (azul) gerada pelo
modelo 0D do SCH atingindo o regime permanente em comparação a uma curva de
referência teórica (vermelha) da mesma variável hemodinâmica.
É fato que o método de avaliação proposto nesta pesquisa não consiste em comparar os
valores dos vetores ✓ e ✓est , mas sim o sinal Ps (t) obtido a partir da utilização desses vetores. No
entanto, acredita-se que a relação de erro específica para cada parâmetro possa contribuir para
esta pesquisa.
A fim de investigar essa hipótese, 9 (nove) valores aleatórios de ✓ foram utilizados
para comparar o desempenho dos três algoritmos utilizados (MLP, LSTM e CNN). Para cada
algoritmo serão mostrados os gráficos comparativos filtrados por parâmetro, os gráficos para cada
✓ e as curvas de Ps (t) geradas pelos respectivos parâmetros. Todos os valores dos parâmetros de
✓ foram normalizados entre 0 e 1: Rs , Rm , Ra , Rc , Cae , Cs , Cao , L, Emax , Emin .

30
4.2

Estimação utilizando o topologia MLP

Pode-se visualizar na Figura 16 o desempenho do processo de estimação para os parâmetros do vetor ✓ utilizando a topologia MLP, demonstrando a comparação do valor real utilizado
no modelo com o valor estimado do respectivo parâmetro.

Figura 16 – Comparação entre os valores reais utilizados no modelo (azul) e os valores estimados
(laranja) para cada parâmetro de ✓ utilizando redes MLP.
Na Figura 17, pode-se visualizar os mesmo valores da Figura 16, no entanto, organizados
de forma que cada gráfico apresenta o resultado de todos os parâmetros para um único ✓, para
que o leitor possa correlacionar com a Figura 18, onde pode-se visualizar as curvas de Ps (t)
geradas por cada ✓. Cabe destacar na Figura 17 a estimação do parâmetro Cs para o vetor ✓9 ,
onde o resultado foi um valor negativo. Este comportamento ocorre sempre que a rede neural
escolhe um valor menor do que o valor mínimo presente na base de dados mas não implica em
um valor negativo para este parâmetro, uma vez que o gráfico em questão está com os valores
normalizados.

31

Figura 17 – Comparação entre os valores reais utilizados no modelo (azul) e os valores estimados
(laranja) para cada ✓ utilizando redes MLP.

Figura 18 – Comparativo entre Ps (t) (azul) e Ps est (t) (laranja) gerados pelo modelo usando os
vetores entre ✓1 e ✓9
Para estabelecer um método comparativo dos resultados entre as redes neurais escolhidas,

32
foi desenvolvido um algoritmo que verifica a taxa de acerto entre os 150 vetores da base de
testes e os respectivos vetores estimados, considerando uma margem de erro de ± 10%. Se a
rede neural for capaz estimar o valor de um determinado parâmetro dentro dessa margem de
erro, a estimação será considerada um acerto; do contrário, será considerada um erro. Depois,
para obter a taxa de acerto em porcentagem, basta dividir o valor total de acertos pelo número de
estimações. O resultado da taxa de acertos para cada parâmetro da base de testes, comparando
✓ e ✓est , e utilizando o algoritmo MLP está disponível na Figura 19, onde o centro equivale a
0% de acerto e a borda do círculo mais externo equivale a 100% de acerto. Percebe-se a taxa
de acertos ficou acima de 50% apenas para os parâmetros Rs , Cs e Emax . Em outras palavras,
pouco mais de 75 vetores da base de testes foram estimados com erro de aproximadamente
10% para o parâmetro Cs . Por outro lado, aproximadamente 25% dos vetores da base de testes
foram estimados com erro de aproximadamente 10% para os parâmetros Cae , Rc , Ra e Rm . É
importante frisar que não é garantido que todos os melhores acertos estão no mesmo vetor de
parâmetros, de forma que um vetor pode ter uma estimativa satisfatória para L e uma estimativa
insuficiente para Emax

Figura 19 – Gráfico representativo da taxa de acerto de uma rede MLP (laranja) para cada
parâmetro de ✓ considerando uma tolerância de ± 10%.
4.3

Estimação utilizando o algoritmo LSTM

Pode-se visualizar na Figura 20 o desempenho do processo de estimação para os parâmetros do vetor ✓ utilizando a topologia LSTM e demonstrando a comparação do valor real
utilizado no modelo com o valor estimado do respectivo parâmetro.

33

Figura 20 – Comparação entre os valores reais utilizados no modelo (azul) e os valores estimados
(marrom) para cada parâmetro de ✓ utilizando redes LSTM.
Na Figura 21, pode-se visualizar os mesmos valores da Figura 20, no entanto, organizados
de forma que cada gráfico apresenta o resultado de todos os parâmetros para um único ✓, para
que o leitor possa correlacionar com a Figura 22, onde pode-se visualizar as curvas de Ps (t)
geradas por cada ✓.

34

Figura 21 – Comparação entre os valores reais utilizados no modelo (azul) e os valores estimados
(marrom) para cada ✓ utilizando redes LSTM.

Figura 22 – Comparativo entre Ps (t) (azul) e Ps est (t) (marrom) gerados pelo modelo usando
os vetores entre ✓1 e ✓9
Na Figura 23 estão disponíveis as taxas de acerto para cada parâmetro, com margem de

35
erro de ±10%, das redes MLP e LSTM. Embora as redes LSTM sejam indicadas para o uso com
séries temporais, como mencionado anteriormente, percebe-se claramente uma taxa de acerto
maior da rede MLP.

Figura 23 – Gráfico representativo da taxa de acerto das rede MLP (laranja) e LSTM (marron)
para cada parâmetro de ✓ considerando uma tolerância de ± 10%.
4.4

Estimação utilizando o algoritmo CNN

Pode-se visualizar na Figura 24 o desempenho do processo de estimação para os parâmetros do vetor ✓ utilizando a topologia LSTM, demonstrando a comparação do valor real utilizado
no modelo com o valor estimado do respectivo parâmetro.

36

Figura 24 – Comparação entre os valores reais utilizados no modelo (azul) e os valores estimados
(verde) para cada parâmetros de ✓ utilizando redes CNN.
Na Figura 25, pode-se visualizar os mesmo valores da Figura 24, no entanto, organizados
de forma que cada gráfico apresenta o resultado de todos os parâmetros para um único ✓, para
que o leitor possa correlacionar com a Figura 26, onde pode-se visualizar as curvas de Ps (t)
geradas por cada ✓.

37

Figura 25 – Comparação entre os valores reais utilizados no modelo (azul) e os valores estimados
(verde) para cada ✓ utilizando redes CNN.

Figura 26 – Comparativo entre Ps (t) (azul) e Ps est (t) (verde) gerados pelo modelo usando os
vetores entre ✓1 e ✓9
Na Figura 23 estão disponíveis as taxas de acerto para cada parâmetro, também com

38
margem de erro de 10%, das redes MLP, LSTM e CNN. Destaca-se aqui uma melhora na taxa
de acertos das variáveis Rc , Cae e Rs e Cs , o que não ocorre para as variáveis Ra e Rm . Um fato
que deve ser levado em consideração é uma leve piora na taxa de acerto do parâmetro Cao .

Figura 27 – Gráfico representativo da taxa de acerto das rede MLP (laranja), LSTM (marron) e
CNN (verde) para cada parâmetro de ✓ considerando uma tolerância de ± 10%.
Reitera-se que a pressão arterial sistêmica Ps (t) foi utilizada como entrada para as
topologias utilizadas neste trabalho por se tratar de uma variável obtida por métodos não
invasivos. No entanto, como descrito anteriormente, o modelo 0D do sistema cardiovascular
utilizado nesta pesquisa é capaz de reproduzir o comportamento dinâmico de seis variáveis
hemodinâmicas: Vve , Pae , Qao , Pao , Ps e Pve . Logo, com o objetivo de avaliar o desempenho do
algoritmo (CNN), o processo de estimação foi aplicado novamente para esta topologia, entretanto
utilizando as seis variáveis como entrada nessa rede. Os resultados podem ser observados na
Figura 28, onde estão disponíveis as taxas de acerto, com margem de erro de ±10%, para cada
parâmetro de ✓.

39

Figura 28 – Taxa de acerto para cada parâmetro de ✓, considerando uma tolerância de ± 10%
Como esperado, houve melhora da taxa de acerto para a maioria dos parâmetros. Entretanto, observa-se uma melhora muito tímida dos parâmetros Cao e da indutância L, além de uma
piora na taxa de acerto do parâmetro Ra , o que confirma os resultados obtidos com as análises
de sensibilidade paramétrica.
4.5

Estimação utilizando o algoritmo CNN com alteração na base de treinamento e exclusão de parâmetros

Nesta seção uma sequencia de alterações na metodologia proposta é realizada, a fim de
verificar a possibilidade de melhoria nos resultados obtidos até aqui, seja por falta de informação
ou por outras características relacionadas à base de dados de entrada da rede neural. Também será
verificada a correlação entre o estudo de sensibilidade paramétrica e o resultado das estimações
A primeira alteração consiste em modificar o tempo de simulação por amostra de 0,8
segundos para 2,4 segundos - de 1 para 3 ciclos - e aplicar o mesmo método de treinamento descrito anteriormente. Sabendo que o objetivo dos filtros convolucionais é destacar características
relevantes em determinadas regiões, surge a seguinte pergunta: a quantidade de informações
fornecidas para a rede é insuficiente?
No estudo de sensibilidade paramétrica ficou evidente quais parâmetros têm maior
influência sobre as variáveis hemodinâmicas, e.g., o parâmetro L não apresenta influência em
nenhuma das variáveis do modelo. A partir desta observação, surge a hipótese de que as variáveis
hemodinâmicas são pouco sensíveis a determinados parâmetros e que estes podem, inclusive,
ser fatores negativos para o processo de estimação. Assim, a segunda alteração na metodologia
proposta foi, utilizando a mesma base de dados, remover os parâmetros Ra , Rm , L, Cao , Cae do

40
processo de estimação. O resultado deste processo, com as duas alterações supracitadas, pode
ser visualizado na Figura 29.

Figura 29 – Taxa de acerto para cada parâmetro de ✓, considerando uma tolerância de ± 10%
Percebe-se claramente que não houve nenhuma melhoria nos resultados de estimação. É
importante destacar que os parâmetros removidos nesta etapa apresentam o valor 0 apenas para
indicar que não foram estimados. Em relação aos parâmetros que foram utilizados, o resultado
de estimação se mantém aproximadamente o mesmo apresentado na Figura 27 com o uso da
CNN.
Em seguida, considerando que a variável Pve (t) pode ser obtida de forma não invasiva,
não descaracterizando o objeto desta dissertação e; que o estudo de sensibilidade conclui
que Pve (t) tem alta sensibilidade às variações paramétricas Emin e Rc , a variável em questão
foi adicionada como entrada no processo de estimação. Vale ressaltar mais uma vez que os
resultados apresentados na Figura 28 já confirmavam que haveria melhoraria com a inserção de
mais variáveis no processo de estimação. Entretanto, esta alternativa não pode ser considerada
para a utilização de todas as variáveis hemodinâmicas presentes no modelo, pois a maioria
não pode ser obtida fácil e confiavelmente de maneira não-invasiva. Os resultados podem ser
observados na figura30

41

Figura 30 – Taxa de acerto para cada parâmetro de ✓, considerando uma tolerância de ± 10%
Conforme esperado, observa-se uma melhora no desempenho de Emin e Rc , em acordo
com o estudo de sensibilidade. Por outro lado, analisando a Figura 28, percebe-se que as
estimativas para os parâmetros Ra , Cao e L mesmo com a utilização de todas as variáveis do
modelo. Este resultado indica que a estrutura do modelo 0D do SCH pode não ser uma boa
escolha para a utilização em pacientes específicos, seja utilizando apenas variáveis não-invasivas,
ou até mesmo utilizando todas as variáveis presentes no modelo.
4.6

Considerações finais

Neste capítulo foram apresentados os resultados obtidos e as discussões referentes as
escolhas das estrategias utilizadas.

42

5 CONCLUSÃO

Este trabalho apresenta uma metodologia de estimação paramétrica de um modelo
0D do sistema cardiovascular humano baseado em aprendizagem profunda. Três topologias
foram utilizadas para a mesma finalidade: Multilayer perceptron (MLP), Long Short-term
Memory (LSTM) e Convolutional Neural Networks (CNN). Por meio da análise dos resultados
apresentados, pode-se concluir que há um desempenho superior da topologia CNN, embora tenha
sido enfatizado que a topologia LSTM seja mais adequada para trabalhar com séries temporais.
Acredita-se que este resultado deve-se ao fato de que os sinais analisados foram padronizados de
forma tal que a comparação entre eles é mais relevante que a sua variação no tempo, permitindo
que CNNs atuem de forma a destacar os detalhes que diferenciam esses sinais.
O estudo de sensibilidade foi muito relevante para compreender a correlação entre
a variação paramétrica e as variáveis hemodinâmicas do modelo. De posse desta análise, foi
possível compreender que estudos relacionados à novas técnicas ou arquiteturas das redes neurais,
bem como alterações na base de dados podem não ser otimizar os resultados de estimação, uma
vez que para o modelo 0D do SCH escolhido, a variação de determinados parâmetros pouco
ou nada influenciam nas variáveis hemodinâmicas presentes no modelo. Este estudo particular
gerou o artigo (YANG et al., 2021), aceito para publicação no evento 43rd Annual International
Conference of the IEEE Engineering in Medicine and Biology Society que possui Qualis B1 para
a área de avaliação Ciência da Computação.
Quando se trata de um estudo que apresenta uma abordagem específica para um determinado paciente, um modelo que leva em consideração somente o lado esquerdo do coração tende
a desconsiderar muitas informações relevantes para o quadro clínico do mesmo. É importante
ressaltar que variáveis como a circulação pulmonar e a saída cardíaca têm forte influência no
comportamento do sistema cardiovascular. Ao desconsiderar tais variáveis, assume-se condições
muito semelhantes a pacientes que na verdade se apresentam com diferentes quadros clínicos.
5.1

Trabalhos futuros
Como trabalhos futuros, os seguintes temas poderão ser investigados:

1. Utilizar a metodologia proposta para modelos do sistema cardiovascular com estruturas
que levem em conta o lado direito do coração e a circulação pulmonar.
2. Utilizar técnicas mais robustas de análise de sensibilidade para tentar melhorar o desempenho do processo de estimação paramétrica para pacientes específicos.
3. Investigar técnicas não invasivas para a obtenção de variáveis hemodinâmicas, baseadas
em sons e imagens ou em processos de estimação, para que sejam utilizadas como entrada
para o processo de estimação paramétrica.

43

REFERÊNCIAS
ABDEL-NASSER, M.; MAHMOUD, K. Accurate photovoltaic power forecasting models using
deep lstm-rnn. Neural Computing and Applications, Springer, v. 31, n. 7, p. 2727–2740, 2019.
Citado na página 20.
ALOMARI, A.-H. H. et al. Developments in control systems for rotary left ventricular assist
devices for heart failure patients: a review. Physiological measurement, IOP Publishing, v. 34,
n. 1, p. R1, 2012. Citado na página 10.
ARORA, N. et al. A propensity analysis of the risk of vascular complications after cardiac
catheterization procedures with the use of vascular closure devices. American heart journal,
Elsevier, v. 153, n. 4, p. 606–611, 2007. Citado na página 10.
CAO, J.; LI, Z.; LI, J. Financial time series forecasting model based on ceemdan and lstm.
Physica A: Statistical Mechanics and its Applications, Elsevier, v. 519, p. 127–139, 2019.
Citado na página 20.
CASAS, B. et al. Bridging the gap between measurements and modelling: a cardiovascular
functional avatar. Scientific reports, Nature Publishing Group, v. 7, n. 1, p. 1–15, 2017. Citado
na página 11.
CORDEIRO, T. D. et al. A physiological control system for ecg-synchronized pulsatile pediatric
ventricular assist devices. Biomedical Signal Processing and Control, Elsevier, v. 57, p. 101752,
2020. Citado 2 vezes nas páginas 10 e 16.
FAWAZ, H. I. et al. Deep learning for time series classification: a review. Data Mining and
Knowledge Discovery, Springer, v. 33, n. 4, p. 917–963, 2019. Citado 3 vezes nas páginas 5, 21
e 22.
FERREIRA, A. et al. A nonlinear state-space model of a combined cardiovascular system and a
rotary pump. In: IEEE. Proceedings of the 44th IEEE Conference on Decision and Control.
[S.l.], 2005. p. 897–902. Citado na página 16.
HOCHREITER, S.; SCHMIDHUBER, J. Long short-term memory. Neural computation, MIT
Press, v. 9, n. 8, p. 1735–1780, 1997. Citado na página 20.
IGNATOV, A. Real-time human activity recognition from accelerometer data using convolutional
neural networks. Applied Soft Computing, Elsevier, v. 62, p. 915–922, 2018. Citado na página
21.
KESHAVARZ-MOTAMED, Z. et al. Non-invasive determination of left ventricular workload in
patients with aortic stenosis using magnetic resonance imaging and doppler echocardiography.
PLoS One, Public Library of Science, v. 9, n. 1, 2014. Citado na página 11.
KIM, I.-C.; YOUN, J.-C.; KOBASHIGAWA, J. A. The past, present and future of heart
transplantation. Korean circulation journal, The Korean Society of Cardiology, v. 48, n. 7, p.
565–590, 2018. Citado na página 10.
KONG, W. et al. Short-term residential load forecasting based on lstm recurrent neural network.
IEEE Transactions on Smart Grid, IEEE, v. 10, n. 1, p. 841–851, 2017. Citado na página 19.

44
NIELSEN, M. A. Neural networks and deep learning. [S.l.]: Determination press San Francisco,
CA, USA:, 2015. v. 2018. Citado na página 17.
PASCANU, R. et al. How to construct deep recurrent neural networks. arXiv preprint
arXiv:1312.6026, 2013. Citado na página 19.
SAGHEER, A.; KOTB, M. Time series forecasting of petroleum production using deep lstm
recurrent networks. Neurocomputing, Elsevier, v. 323, p. 203–213, 2019. Citado na página 20.
SAK, H.; SENIOR, A.; BEAUFAYS, F. Long short-term memory based recurrent neural network
architectures for large vocabulary speech recognition. arXiv preprint arXiv:1402.1128, 2014.
Citado na página 20.
SIMAAN, M. A. et al. A dynamical state space representation and performance analysis of a
feedback-controlled rotary left ventricular assist device. IEEE Transactions on Control Systems
Technology, IEEE, v. 17, n. 1, p. 15–28, 2008. Citado 8 vezes nas páginas 5, 7, 14, 15, 16, 17,
23 e 27.
SUGA, H.; SAGAWA, K. Instantaneous pressure-volume relationships and their ratio in the
excised, supported canine left ventricle. Circulation research, Am Heart Assoc, v. 35, n. 1, p.
117–126, 1974. Citado 2 vezes nas páginas 14 e 15.
YANG, X. et al. Estimation of systemic vascular bed parameters for artificial heart control. IEEE
Engineering in Medicine and Biology Society, IEEE, v. 43, 2021. Citado 2 vezes nas páginas 25
e 42.
YILDIRIM, Ö. A novel wavelet sequence based on deep bidirectional lstm network model for
ecg signal classification. Computers in biology and medicine, Elsevier, v. 96, p. 189–202, 2018.
Citado na página 20.
YU, Y.-C. et al. Estimation of systemic vascular bed parameters for artificial heart control. IEEE
Transactions on Automatic Control, IEEE, v. 43, n. 6, p. 765–778, 1998. Citado na página 23.