Felipe Sembay

Guarapuava-PR · sembay.felipe@gmail.com

Economista, Analista e Cientista de Dados, apaixonado por tecnologia, criptomoedas e games.


Qualificações

Linguagens de Programação & Ferramentas
Conhecimentos Técnicos
  • Machine learning
  • Modelagem de Dados
  • Análise Exploratória
  • Banco de Dados
  • Power BI
  • Tableau
  • Visualização de Dados
  • ML Flow
  • Modelos em produção
  • Tensor Flow

Experiência

Analista de dados

Analise probabilistica em dados de call center, buscando prever quais dias dentro do mês os operadores conseguíriam mais acordos com os clientes.

Abril 2018 - Maio 2018

Gerente Financeiro

Excel avançado, ótimo atendimento ao cliente e fornecedores, matemática financeira, criação e atualização de KPI financeiro(mensalmente), emissão de nota fiscal, sistemas bancários, emissão de boletos, serviços de suporte a (RH), fluxo de caixa, faturamento, contas a pagar e receber, conciliação bancaria, planilhas de orçamento e controle financeiro, acompanhamento da rotina de todas tarefas pertinentes ao departamento financeiro. Além das atividades descritas acima, eu também criava modelos de machine learning, tais como: modelo de série temporal para prever receitas e despesas, regressão linear múltipla, modelo de classificação e simulação de Monte Carlo.

Reference link.

Setembro 2018 - Novembro 2020

Formação Acadêmica

Universidade Estadual do Centro Oeste -UNICENTRO

Bacharelado em Ciências Econômicas
Entre vários campos de estudo, a estatística/ econometria, e o uso de dados para prever comportamento e indicadores macroecnômicos.

Fevereiro 2010 - Dezembro 2017

Centro Universitário de Maringá - UNICESUMAR

Bacharelado em Engenharia de Produção
Matemática e áreas relacionados a gestão e conhecimento de negócios.

Outubro 2015 - Atualmente trancada - Previsão conclusão 2022

Universidade Estadual do Centro Oeste - UNICENTRO

Mestrando em Administração - Área de Inovação e Tecnologia
Atualmente estou participando do Mestrado Profissional na Área de Administração, focado em Inovação e Tecnologia. Pretendo fazer a minha dissertação utilizando Machine Learning aplicado ao mercado de criptoativos, mais especificamente na administração de portfólio.

Março 2021 - Novembro 2022

Projetos

Esta seção contém alguns dos meus projetos:

Analise dos dados de vôos ocorridos nos EUA no ano de 2015

Analise dos dados de vôos ocorridos nos EUA no ano de 2015

Tableau

Analisando correlações de vôos atrasados e cancelados em decorrência do clima

Visualização de Dados Tableau

Segmentação, classificação e Projeção de Receitas

Segmentação, classificação e Projeção de Receitas

Python, ARIMA, ETS, PROPHET, Cluster, Classificação

Esse é o projeto final da Nanodegree em análise de dados, na qual foi replicado 100% no Python. Foi utilizado modelo para clusterização, classificação e série temporal. O principal objetivo desse projeto era segmentar todas as lojas por cluster, e prever a receita de produtos perecíveis.

Pré Processamento de Dados Modelo de Série Temporal Arima ETS Prophet Cluster Modelo de classificação

Modelo de Regressão Linear para previsão do preço de diamantes

Modelo de Regressão Linear para previsão do preço de diamantes

Python, Pandas, Seaborn, Numpy

Etapa 1 nesse projeto foi utilizado modelo de regressão linear para prever o preço de diamantes.

Machine Learning Regressão Linear Python

Prevendo a demanda de um novo catálogo.

Prevendo a demanda de um novo catálogo.

Python, Pandas, Seaborn, Numpy, Regressão Linear

Neste projeto foi utilizado Regressão Linear para prever qual seria o lucro de uma loja caso se fosse lançado um novo catálogo de produtos.

Machine Learning Regressão Linear Python

Classificação de Risco de Empréstimo de Crédito.

Classificação de Risco de Empréstimo de Crédito.

Python, Pandas, Seaborn, Numpy, Modelos de classificação

Neste projeto foi utilizado modelos de classificação para prever quais pessoas teriam os seus pedidos de empréstimos aceitos e quais teriam o seu pedido negado.

Machine Learning Python Classificação

Projeção de Vendas de uma loja de Video Game.

Projeção de Vendas de uma loja de Video Game.

Python, Pandas, Seaborn, Numpy, ETS, ARIMA, Prophet

Neste projeto foi utilizado 3 modelos de série temporal diferente para prever a quantidade de video game vendidos ao longo de 15 meses.

Machine Learning Python Arima ETS Prophet

Teste prático - Vaga Creditas.

Teste prático - Vaga Creditas.

Uma análise de um conjunto de dados fictício para seleção de uma vaga.

Este projeto refere-se a um teste para uma vaga de analista de inteligência de mercado na Start Up Creditas.

Machine Learning Python Pandas Numpy Seaborn Pycaret

Kaycash.

Kaycash.

Uma análise de um conjunto de dados fictício para uma vaga na Kaycash.

Este projeto refere-se a um teste publicado num grupo de Data Science no facebook. Eu não participei do teste pois na época estava empregado. Porém baixei os arquivos contendo os dados, para fins de aprendizado.

Machine Learning Python Pandas Numpy Seaborn Sklearn Statsmodels

Airbnb.

Airbnb.

Criando uma nuvem de palavras com dados do AIRBNB da cidade de Seatle.

Nesta análise foi criado uma nuvem de palavras com dados do AIRBNB, referente a cidade de Seatle, para identificar quais são os termos ou palavras mais utilizadas.

Machine Learning Pandas Numpy Matplotlib Wordcloud

Simulação de Monte Carlo.

Simulação de Monte Carlo.

Utilizando a Simulação de Monte Carlo, para simular cenários afim de estimar o lucro da empresa.

Nesta análise, foi utilizado a Simulação de Monte Carlo para estimar a receita, despesas e o lucro de uma empresa. Essa técnica é utilizada quando a quantidade de dados disponíveis na série histórica é insuficiente para a criação de um modelo de série temporal convencional.

Simulação de Monte Carlo

Série Temporal para previsão na Bolsa de Valores.

Série Temporal para previsão na Bolsa de Valores.

Cotação do Indice Bovespa desde 01/01/2008 até 31/12/2019.

Nesta análise, foi utilizado o indice Bovespa para estimar qual seria a pontuação mensal do indice Bovespa até o mês 12/2020.

Série Temporal ETS ARIMA SARIMA

Churn.

Churn.

Análise e Modelo de Machine Learning.

Nesta análise, foi utilizado dados referente a uma empresa de telecomunicações, referente a uma competição de Machine Learning no Kaggle. Primeiramente, foi feito uma análise exploratória dos dados, para buscar entender os dados e as suas relações e correlações. Após realizada a analise de exploração dos dados, buscamos construir o nosso modelo.

Machine Learning Competição Classificação EDA Pycaret

Ataque Cardíaco.

Ataque Cardíaco.

Análise e Modelo de Machine Learning.

Heart Atack é um arquivo referente a classificação de pessoas que podem ou não ter um ataque cardíaco / infarto. Os dados utilizados foram obtidos no site do Kaggle. Buscou-se fazer uma análise exploratória primeiramente, e posteriormente a construção do modelo. O modelo apresentou uma acurácia de 0.8132.

Machine Learning Classificação EDA Pycaret

Porto Seguro Competição Machine Learning - Kaggle.

Porto Seguro Competição Machine Learning - Kaggle.

Análise e Modelo de Machine Learning.

É um arquivo referente uma competição no site do Kaggle. Foi feito, vários modelos, utilizamos Pycaret e pacotes do próprio Sklearn. O pycaret foi utilizado para termos uma base de quais modelos perfomariam melhor. E após isso, tratamos de melhorar o modelo de forma mais "personalizada" na biblioteca do Sklearn. Minha submissão feita diretamente no site no Kaggle, aonde minha pontução com Private Score foi de 0.63696 e o Public Score de 0.64212

Machine Learning Classificação EDA Pycaret SkLearn SweetViz

Projeto Machine Learning - VAGAS.COM.

Projeto Machine Learning - VAGAS.COM.

Análise e Modelo de Machine Learning.

É um arquivo referente a classificação de pessoas que foram aprovados ou não em uma determinada vaga de emprego.Primeiramente, foram utilizadas técnicas de normalização nos dados. O resultado do modelo de machine learning apresentou um score do Random Forest de 0.8390 enquanto que o score da Rede Neural apresentou 0.8262. Os resultados do arquivo de submissão apresentaram os seguintes resultados. Machine Learning 25055 aprovados e 1079 não aprovados. A rede neural apresentou 24335 aprovados e 1799 não aprovados.

Machine Learning Classificação EDA Pycaret SkLearn Redes Neurais

Projeto Bolsa de Valores - Otimização de Carteira de Investimento.

Projeto Bolsa de Valores - Otimização de Carteira de Investimento.

Análise e Otimização de Carteira de Investimento.

Buscou-se analizar as 11 maiores empresas de seus nichos de mercado. Essas 11 empresas representam perto de 50% do Indice Bovespa. Os dados de análise vão do dia 02/01/2019 até a data de 30/11/2021. Essa carteira obteve um retorno acumulativo de 74.71% no período. Sua volatilidade anual está em 32.96% e o indice de Sharpe está em 0.77.

Otimização Markowitz Retornos Ações

Calculo Financeiros e de Valuation utilizando Python.

Calculo Financeiros e de Valuation utilizando Python.

Como calcular o Valuation de uma empresa .

Nesse arquivo, busca-se calcular o valor aproximado de uma empresa (valuation) através do seu Fluxo de Caixa. Também foi utilizado conceitos encontrados no livro "Decisões Financeiras e Análise de Investimento" dos autores Alceu Souza e Ademir Clemente.

Numpy Financial VPL TIR TMA Valuation


Cursos

  • Data Science do Zero - Minerando Dados
  • Python para Data Science e Machine Learning - Completo - Udemy
  • Python para Finanças, Investimentos e Analise de Dados - Udemy
  • Predictive Analytics for Business - Udacity
  • Inteligência Artificial Fundamentos - Data Science Academy
  • Into to SQL for Data Science - DataCamp
  • Fundamentos de Análise de Dados - Udacity
  • Aprendendo Programar em R - Udemy
  • Big Data & Analytics - FIAP
  • Big Data para Cientista de Dados (Spark) - Stack Academy