Skip to content

matheu-spereira/stack-processing-data

Repository files navigation

stack-processing-data

Stack open source para processamento de dados utilizando Jupyter Notebook, Cluster Spark, MinIO, PostgreSQL, Metabase e Briefer, aplicada em ambiente Docker.

Instruções de Instalação e Execução

Pré-requisitos

  • Docker instalado.
    Caso não tenha o Docker, siga a documentação oficial para instalar o Docker.

  • Caso utilize o Windows. WSL (Windows Subsystem for Linux) instalado no Windows.
    Se ainda não tiver o WSL instalado, siga as instruções da documentação oficial da Microsoft.

Passo a Passo de Instalação

  1. Clone o repositório: Abra o terminal (no WSL ou no prompt de comando do Windows) e execute o seguinte comando para clonar o repositório:
    git clone https://github.com/matheu-spereira/stack-processing-data.git
    
  2. Acesse o repositório clonado: Acesse o diretório do projeto: Navegue até a pasta do repositório clonado:
    cd {caminho/do/diretorio}
    
  3. Execute o Docker Compose: No diretório do projeto, onde o arquivo docker-compose.yml está localizado, execute o seguinte comando para construir e iniciar os containers em segundo plano::
    docker-compose up --build -d
    

Endereço dos serviços

Versões utilizadas no ambiente

  • Spark: 3.5.2
  • Delta: 3.2.0
  • Python: 3.11.9

Estrutura

image

About

Stack open source para processamento de dados utilizando Jupyter, Cluster Spark, MinIO, PostgreSQL, Metabase e Briefer

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors