Uma abordagem de ciência de dados em uma análise socioeconômica de preços para viagens de transporte por aplicativo Uber

Aluno: Giancarlo Lima Torres Orientador: Prof. Dr. Bruno Almeida Pimentel

Giancarlo-Dissertao_de_Mestrado.V11.ComFichaCatalogrfica.pdf
Documento PDF (3.0MB)

UNIVERSIDADE FEDERAL DE ALAGOAS
INSTITUTO DE COMPUTAÇÃO
PROGRAMA DE PÓS GRADUAÇÃO EM INFORMÁTICA

GIANCARLO LIMA TORRES

UMA ABORDAGEM DE CIÊNCIA DE DADOS EM UMA ANÁLISE SOCIOECONÔMICA DE
PREÇOS PARA VIAGENS DE TRANSPORTE POR APLICATIVO UBER

Maceió – AL
2022

GIANCARLO LIMA TORRES

UMA ABORDAGEM DE CIÊNCIA DE DADOS EM UMA ANÁLISE SOCIOECONÔMICA DE
PREÇOS PARA VIAGENS DE TRANSPORTE POR APLICATIVO UBER

Dissertação apresentada ao Programa de Pós-Graduação
em Informática da Universidade Federal de Alagoas,
como requisito para obtenção do grau de Mestre em
Informática.

Orientador:
Professor Dr. Bruno Almeida Pimentel

Maceió – AL
2022

“ Pois é Deus quem efetua em vocês tanto o querer quanto o realizar, de acordo com a boa vontade
Dele. ”
Bíblia Sagrada. Filipenses 2:13.

AGRADECIMENTOS

Agradeço a Deus, criador de tudo que existe, por toda sabedoria e persistência que me
concedeu durante esta pesquisa. Durante essa jornada, descobri que devemos sempre tentar,
mesmo se as circunstâncias parecerem impossíveis, pois para Deus nada é impossível. É
passando por dificuldades que nos aperfeiçoamos e, por isso, Deus muitas vezes permite que
passemos por situações desfavoráveis.
Creio que a Ciência é uma dádiva concedida por Deus para que possamos evoluir como
seres humanos. Nesse sentido, devemos compartilhá-la e aperfeiçoá-la sempre que possível. O
trabalho em equipe é de suma importância para o crescimento da humanidade. Assim, quero
agradecer ao meu orientador Professor Bruno que teve muita paciência e sabedoria ao me
conduzir pelos caminhos da Ciência de Dados, fazendo com que enxergasse perspectivas ainda
não conhecidas por mim.
Gratidão aos colegas que conheci durante o programa de mestrado da instituição, pois
me ajudaram em momentos difíceis em algumas disciplinas, além de poder contribuir com eles
para que conseguissem obter sucesso.
Agradecimento aos meus amigos que volta e meia me ouviam falar sobre as dificuldades
que enfrentava durante a pesquisa e me incentivavam a prosseguir.
Também não poderia deixar de agradecer aos meus colegas de trabalho que sempre me
apoiaram durante esse período de aulas e pesquisa em que executaram algumas atividades
minhas para que eu pudesse continuar estudando.
Por fim, não poderia deixar de registrar os agradecimentos a minha amada esposa que
sempre depositou confiança em mim, incentivando a prosseguir mesmo estando cansado das
atividades do trabalho e da própria pesquisa.
A Deus toda honra e glória!

RESUMO

Estudos que utilizam dados da empresa de transporte por aplicativo Uber evidenciaram que há
fatores que contribuem para o aumento de preços dos seus serviços de viagens. Nesse contexto,
esta pesquisa teve como objetivo analisar rotas de viagens de usuários de baixa renda e
contribuir na redução desses preços. Para isso, buscou-se responder: Se um centro financeiro
estivesse mais próximo de bairros economicamente mais pobres, haveria mudança nos preços
médios dessas viagens? Essa mudança poderia melhorar financeiramente a vida das pessoas de
baixa renda? A proposta de nossa pesquisa para responder a esses questionamentos foi a de
averiguar em regiões territoriais essas concentrações financeiras por meio de um processo de
Ciência de Dados, analisando preços e dados socioeconômicos da cidade sul-americana de
Fortaleza, localizada no país Brasil e da cidade norte americana de Boston, localizada no país
Estados Unidos da América. Assim, seria possível evidenciar se os usuários da Uber que moram
em bairros mais pobres financeiramente e utilizam esse serviço de viagens acabam pagando
mais caro do que os usuários dos bairros mais ricos, quando o destino é o centro financeiro. As
análises e os resultados obtidos para Boston serviram de validação por analogia para os
resultados obtidos para Fortaleza. A base de dados analisada para Boston se refere a um
conjunto de dados real, disponível na comunidade online Kaggle. A base de dados analisada
para Fortaleza foi construída durante nosso trabalho e também está disponível na comunidade
online Kaggle, podendo servir de ferramenta para analises futuras em outras pesquisas. Para
construção dessa base, foram utilizadas informações de Fortaleza sobre tráfego, horários de
pico, dias da semana, quantidade de viagens e o simulador de preços da Uber. Para alcançar o
objetivo da pesquisa, a Metodologia empregada consistiu nas etapas de Obtenção e Construção
de preços, Obtenção de Dados Socioeconômicos, Análise Exploratória de Dados, Limpeza e
Tratamento de Dados, Construção de Modelos de Aprendizado de Máquina e Análise entre os
Dados Socioeconômicos e os preços de viagens para as cidades em estudo. Como resultados
obtidos, observou-se que, em um cenário mais desconcentrado de centro financeiro, os usuários
de baixa renda da Uber em Fortaleza poderiam ter os preços das viagens reduzidos em cerca de
43,07%. Essa redução representaria uma economia mensal de cerca de 18,82% de suas Rendas
Médias Pessoais. Para usuários que vivem em bairros ricos (alta renda), essa descentralização
aumentaria os custos de viagens para pouco mais de 100%. No entanto, esse aumento
representaria 6,71% de suas Rendas Médias Pessoais. Futuras pesquisas podem expandir os
resultados aqui obtidos, otimizando a base de dados criada e modificando o processo de Ciência
de Dados utilizado.
Palavras – chave: Transportes por Aplicativo, Dados Socioeconômicos, Ciência de Dados,
Análise Exploratória de Dados.

ABSTRACT