Stack open source para processamento de dados utilizando Jupyter Notebook, Cluster Spark, MinIO, PostgreSQL, Metabase e Briefer, aplicada em ambiente Docker.
-
Docker instalado.
Caso não tenha o Docker, siga a documentação oficial para instalar o Docker. -
Caso utilize o Windows. WSL (Windows Subsystem for Linux) instalado no Windows.
Se ainda não tiver o WSL instalado, siga as instruções da documentação oficial da Microsoft.
- Clone o repositório:
Abra o terminal (no WSL ou no prompt de comando do Windows) e execute o seguinte comando para clonar o repositório:
git clone https://github.com/matheu-spereira/stack-processing-data.git
- Acesse o repositório clonado:
Acesse o diretório do projeto: Navegue até a pasta do repositório clonado:
cd {caminho/do/diretorio} - Execute o Docker Compose: No diretório do projeto, onde o arquivo docker-compose.yml está localizado, execute o seguinte comando para construir e iniciar os containers em segundo plano::
docker-compose up --build -d
- History Server: http://localhost:18080/
- Spark UI: http://localhost:8081/
- Jupyter: http://localhost:8888/
- Minio: http://localhost:9001/
- Metabase: http://localhost:3000/
- Briefer: http://localhost:4000/
- Spark: 3.5.2
- Delta: 3.2.0
- Python: 3.11.9
