Cursuri IT modularizate
>
Python Development

How to Build Data Pipelines & ETL Processes

Intermediar
20 ore

Start curs:Februarie

Ce înveți la acest curs

Acest curs te învață cum să construești pipeline-uri de date funcționale, să implementezi procese ETL și să lucrezi cu Big Data prin extragerea, transformarea și stocarea datelor. Vei învăța să automatizezi procesele repetitive, să integrezi surse de date diverse și să gestionezi seturi mari de date pentru a construi soluții scalabile și performante. Strategiile și tehnicile predate sunt moderne, te ajută să lucrezi eficient cu datele și să le procesezi rapid. 

De ce să alegi acest curs 

Cum să construiești pipeline-uri de date și procese ETL îți asigură abilități esențiale pentru gestionarea și prelucrarea seturilor mari de date, automatizând procesele repetitive.

Acest curs este pentru tine
  1. Dacă lucrezi în dezvoltare software ești interesat să înveți mai mult despre prelucrarea avansată a datelor și integrarea acestora în fluxuri de lucru complexe;
  2. Dacă ești inginer de date la început de drum și vrei să înveți procesele fundamentale de extracție, transformare și încărcare a datelor (ETL);
  3. Dacă ești analist de date și vrei să înțelegi mai bine modul în care datele sunt gestionate, prelucrate și stocate pentru analize avansate.
Prerequisites
  •  Cunoștințe de bază în programare, în special în Python (structuri de control, variabile, funcții).
  • Experiență minimă în lucrul cu fișiere și manipularea datelor în Python (cum să deschizi, citești și scrii în fișiere).
  •  O înțelegere fundamentală a conceptelor de bază ale bazelor de date și interogări SQL.

💡 Vezi modulul Python Basics: Essential Skills for Beginners.

Curriculum

Cum să configurezi mediul pentru Data Engineering
*
Vei descoperi cum să instalezi și să configurezi biblioteci esențiale, precum Pandas și SQLAlchemy pentru a începe lucrul cu date.

Cum să extragi date din fișiere CSV, JSON și API-uri REST
*
Vei învăța pașii practici pentru a colecta date din surse diverse și a le pregăti pentru procesare.

Cum să creezi conexiuni la baze de date și să execuți interogări SQL
*
Vei învăța cum să folosești SQLAlchemy pentru a conecta aplicațiile tale la baze de date, a crea tabele și a manipula date prin interogări eficiente.

Cum să cureți și să preprocesezi datele pentru analiză
*
Vei deprinde tehnici esențiale de curățare și preprocesare pentru a obține date curate și gata de utilizare.

Cum să restructurezi și să sumarizezi datele prin grupare, pivotare și agregare
*
Vei învăța instrumente avansate din Pandas pentru a organiza și analiza datele într-un mod eficient.

Cum să gestionezi Big Data și să optimizezi fluxurile de lucru
*
Vei știi cum să abordezi seturi mari de date și să implementezi soluții scalabile pentru manipularea acestora.

Cum să înregistrezi datele în baze de date și să asiguri integritatea acestora
*
Vei învăța cum să salvezi date în baze de date, să configurezi procese de logging și să gestionezi datele pentru acces rapid.

Cum să salvezi datele în fișiere și să alegi formatele potrivite
*
Vei învăța să salvezi și să exportezi datele în formate precum CSV și JSON pentru utilizare ulterioară.

Cum să automatizezi procesul de încărcare și stocare a datelor
*
Vei descoperi tehnici de automatizare care economisesc timp și reduc riscurile de eroare în manipularea datelor.

Nivel
Intermediar
Format
Online Interactiv
Durata
6 săptămâni
Sesiuni
1 pe săptămână
Ziua de curs
Sâmbăta
Interval orar
10:00 - 15:00
Start curs
Februarie
Investiție

360

Au avut și au încredere în noi zeci de companii care cred în oameni și cursanți care au știut că pot mai mult

Betfair
Ford
Banca Transilvania
Orange
Google
By clicking “Accept”, you agree to the storing of cookies on your device to enhance site navigation, analyze site usage, and assist in our marketing efforts. View our Privacy Policy for more information.