1. λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ νλ: λ°μ΄ν° λ¨νΈνμμ νμ μΌλ‘ (The Modern Era of Data Orchestration: From Data Fragmentation to Collaboration)
https://dzone.com/articles/the-modern-era-of-data-orchestration
The Modern Era of Data Orchestration
This article explores the role data orchestrators play and how recent trends in the industry may bring these two disciplines closer together than ever before.
dzone.com
[μμ½μ 리]
λ°μ΄ν° μ€μΌμ€νΈλ μ΄ν°μ μν κ³Ό λ°μ΄ν° μμ§λμ΄λ§κ³Ό μννΈμ¨μ΄ μμ§λμ΄λ§μ μμΆ©λ κ΄κ³μ νμ μ’νλ λ°©λ²μ λν λ΄μ©μ΄λ€.
λ°μ΄ν° μ²λ¦¬μ ν΅ν©μ μλ‘μ΄ μ κ·Ό λ°©μμ λν΄ λ°μ΄ν°λ₯Ό κ΄λ¦¬νκ³ μ΅μ ννλ λ°©λ²λ‘ μ΄ μ€μνλ€.
νΉν ν΄λΌμ°λ λ€μ΄ν°λΈ μΈνλΌ, μλν, ν΅ν© νλ«νΌμ λμ μ΄ λ°μ΄ν° νμ΄νλΌμΈμ ν¨μ¨μ±μ λμ΄λ λ° μ€μν μν μ νλ€.
1. λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ π‘
1.1. λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ΄λ?
λ°μ΄ν°λ₯Ό μμ§, κ°κ³΅, μ λ¬νλ μΌλ ¨μ κ³Όμ μ μλννμ¬ ν¨μ¨μ±μ κ·Ήλννλ μμ
μ΅κ·Όμλ ν΄λΌμ°λ λ€μ΄ν°λΈ μ κ·Ό, λ°μ΄ν° νμ΄νλΌμΈ μλν, ν΅ν© νλ«νΌμ΄ λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ ν΅μ¬ μμλ‘ μ리 μ‘κ³ μλ€.
κ·Έλ λ€λ©΄, λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ΄ μ μ€μν κΉ?
1.2. λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ΄ μ€μν μ΄μ ?
λ°μ΄ν° μμ§λμ΄λ§κ³Ό μννΈμ¨μ΄ μμ§λμ΄λ§μ νμ κ°νλ₯Ό μν΄μλ€.
λ€μν λ°μ΄ν° μμ€μ μ ν리μΌμ΄μ μ νλλ‘ μ°κ²°νμ¬ λ°μ΄ν° νλ¦μ μννκ² νκΈ° μν΄ νμνλ€.
1.3. λ°μ΄ν° νμ΄νλΌμΈ νλ¦

1. Data Sources :
λ°μ΄ν°λ² μ΄μ€, λ©μμ§ ν, REST API λ± λ€μν λ°μ΄ν° μμ€λ₯Ό μ€μ μμ€ν μΌλ‘ 보λΈλ€.
2. Convert to Parquet :
λ°μ΄ν°λ Parquet ν¬λ§·μΌλ‘ λ³ννλ€. Parquet(νμΌμ΄)λ μ΄ κΈ°λ° μ μ₯ ν¬λ§·μΌλ‘ λκ·λͺ¨ λ°μ΄ν° λΆμμ ν¨μ¨μ μ΄λ€. λ°μ΄ν° λΆμ, μ μ₯μμ μ΅μ ννκΈ° μν΄ Parquet ν¬λ§·μΌλ‘ λ³ννλ κ²!
3. Object Storage :
λ³νλ Parquet νμΌλ€μ μ€λΈμ νΈ μ€ν λ¦¬μ§ μ μ ν ν μ΄λΈμ μ μ₯λλ€.
4. Query Engine :
DuckDB, Apache Sparkμ κ°μ 쿼리 μμ§μ μ¬μ©νλ€.
DuckDB: λ¨μΌ λ Έλμμ μ€νλλ©° νμμ λ°μ΄ν° λΆμ (Exploratory Data Analysis)μ κΈ°λ₯ μμ§λμ΄λ§(Feature Engineering)μ μ£Όλ‘ μ¬μ©λλ€.
Apache Spark: λΆμ° μ²λ¦¬μ ν¨κ³Όμ μ΄λ©° λκ·λͺ¨ λ°μ΄ν° μ§ν©μ λΆμνκ±°λ λΉμ¦λμ€ μΈν 리μ μ€μ μ¬μ©λλ€.
5. Data Services :
λ°μ΄ν° μλΉμ€ λ μ΄μ΄λ λ°μ΄ν° κ΄μ°° κ°λ₯μ±(Observability), νμ§ κ΄λ¦¬(Quality), μ»΄νλΌμ΄μΈμ€(Compliance) λ±μ ν¬ν¨νμ¬ λ°μ΄ν° μΌκ΄μ±κ³Ό μ λ’°μ± μ μ§μ λμμ μ€λ€.
6. SaaS Tools :
λ§μΌν , νκ³, CRM κ°μ SaaS λꡬμμ ν΅ν©μ ν΅νμ¬ λΉμ¦λμ€ λ°μ΄ν°κ° λ€μν SaaS νλ«νΌμΌλ‘ μ λ¬λλ€.
7. μ΅μ’ μ μΌλ‘λ λ°μ΄ν°λ₯Ό νμμ λΆμ, κΈ°λ₯ μμ§λμ΄λ§, λΉμ¦λμ€ μΈν 리μ μ€ λ° λ°μ΄ν° κ±°λ²λμ€μ νμ©ν μ μκ² λλ€!
2. λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ μ£Όμ κ°λ π
2.1. ν΄λΌμ°λ λ€μ΄ν°λΈ
ν΄λΌμ°λ μ»΄ν¨ν νκ²½μμ νλμ μ ν리μΌμ΄μ μ ꡬμΆ, λ°°ν¬ λ° κ΄λ¦¬ν λ μννΈμ¨μ΄ μ κ·Ό λ°©μ
- λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μμ ν΄λΌμ°λ νκ²½μ κΈ°λ³Έμ΄λΌκ³ ν μ μλ€.
- ν΄λΌμ°λ λ€μ΄ν°λΈ μΈνλΌλ νμ₯μ±, μ μ°μ±, λΉμ© ν¨μ¨μ±μ΄ κ°μ μ΄λ©°, λ°μ΄ν° μ€μκ° μ²λ¦¬μ λΉ λ₯Έ λ°°ν¬λ₯Ό μ 곡νλ€.
2.2. μλνμ λ°μ΄ν° νμ΄νλΌμΈ
- λΉ λ°μ΄ν° μ¦κ°λ‘ μΈν΄ μλν νμμ±μ΄ μ μ 컀μ§κ³ μλ€.
- λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ νμ΄νλΌμΈμ κ° λ¨κ³(λ°λ³΅λλ μμ )λ₯Ό μλννκ³ μ€λ₯λ₯Ό μ€μ¬ λ°μ΄ν° νμ§μ μ μ§ν΄ μ€λ€.
- μ΄λ₯Ό ν΅ν΄, μ λ¬Έκ°λ€μ΄ λΆμ μμ μλ§ λ μ§μ€ν μ μκ² λλ€!
- νμ΄νλΌμΈμ μλνλ λ°μ΄ν° νλ¦μ λ μμ μ μ΄κ³ λΉ λ₯΄κ² λ§λ€μ΄μ€λ€.
2.3. ν΅ν© νλ«νΌκ³Ό κ±°λ²λμ€
ν΅ν© νλ«νΌμ λ€μν λ°μ΄ν° μμ€μ μμ€ν μ ν΅ν©νμ¬ μΌκ΄λ λ°μ΄ν° κ΄λ¦¬λ₯Ό λλλ€.
- λ°μ΄ν° ν΅ν©μ νμμ±μ΄ 컀μ§λ©΄μ λ°μ΄ν°λ₯Ό ν¨μ¨μ μΌλ‘ κ΄λ¦¬νκ³ μ κ·Ό μ μ΄λ₯Ό κ°ννλ ν΅ν© νλ«νΌμ μν μ΄ μ€μν΄μ§κ³ μλ€.
- μ¬λ¬ μμ€ν κ°μ λ°μ΄ν° μ΄λμ μννκ² νμ¬ λΉμ¦λμ€μ νμν λ°μ΄ν° κ°μμ±μ ν보νκ³ κ±°λ²λμ€λ₯Ό κ°ννλ€.
- ν΅ν© νλ«νΌμ λ°μ΄ν° νμ΄νλΌμΈμμ κ°κΈ° λ€λ₯Έ μμ€ν μ μ°κ²°νκ³ μΌκ΄λ μ μ± μ μ μ©νμ¬ λ°μ΄ν° 보μκ³Ό κ·μ μ€μλ₯Ό μ μ§ν΄ μ€λ€.
3. λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ Toolπ§
λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ μ ν¨κ³Όμ μΌλ‘ μννκΈ° μν λ€μν λꡬλ€μ μ 리ν΄λ³΄λ €κ³ νλ€.
λ°μ΄ν° μμ§λμ΄λ§κ³Ό νμ΄νλΌμΈ μ΅μ νμ ν° λμμ μ£ΌκΈ°λ νλ€(μΌλΆ λκ΅¬λ§ ν΄λΉ).
3.1. Apache Airflow
- μ€ν μμ€ μν¬νλ‘μ° κ΄λ¦¬ λꡬ
- DAGs(Directed Acylic Graphs)λ₯Ό μ¬μ©νμ¬ λ°μ΄ν° νμ΄νλΌμΈμ ꡬμ±νκ³ μλννλ€
- κ°λ ₯ν μ€μΌμ€λ§, λͺ¨λν°λ§ κΈ°λ₯
- μ¬μ΄ νμ΄νλΌμΈ λ¨κ³μ μμ‘΄μ± κ΄λ¦¬
3.2. Prefect
- Python κΈ°λ° λ°μ΄ν° νμ΄νλΌμΈ λꡬ
- μ€μ κ³Ό μ½λ κ°μ κ· νμ μ λ§μΆλ©°, μ μ°μ±μ μ 곡
- μ€λ₯ μ²λ¦¬ κ°νλ₯Ό ν΅ν μν¬νλ‘μ° μμ μ± ν₯μ
- Airflowλ³΄λ€ λΉκ΅μ μ¬μ©λ²μ΄ μ½λ€λ νμ΄ μλ€
3.3. dbt(Data Build Tool)
- λ°μ΄ν° λ³νμ μ€μ μ λ λꡬ
- SQLμ ν΅ν΄ λ°μ΄ν° λͺ¨λΈμ λ§λ€κ³ κ΄λ¦¬νλ€
- μ½κ² λ°μ΄ν° νμ΄νλΌμΈμ ꡬμ±νκ³ , ETL μμ μ ν¨μ¨μ μΌλ‘ μνν μ μλ€
3.4. Dagster
- Airflowμ μλ‘μ΄ κ²½μμλΌκ³ λ λΆλ¦¬λ λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ λꡬ
- λ°μ΄ν° νμ΄νλΌμΈμμ κ° λ¨κ³λ₯Ό ν μ€νΈν μ μμ΄ νμ΄νλΌμΈμ μ λ’°μ±μ λμ¬μ€λ€
- λ°μ΄ν° μμ‘΄μ±κ³Ό νμ΄νλΌμΈ μ¬μ€ν μμλ μ μ©νκ² νμ©λλ λꡬλ€
π€ μ΄μ λν λμ μκ°
μ΄λ²μ μ²μμΌλ‘ ‘λ°μ΄ν° μ€μΌμ€νΈλ μ΄μ ’μ΄λΌλ κ°λ μ μ νκ² λμ΄ ν₯λ―Έλ‘μ λ€.
λ λ°μ΄ν° μμ§λμ΄λ§ λΆμΌμμμ ν΄λΌμ°λμ μλν κΈ°μ μ΄ λ°μ΄ν° μμ§λμ΄λ§μμ μΌλ§λ μ€μνμ§ λ€μκΈ λλ μ μμλ€.
μ§λκ°λ©° λ€μ λꡬ(μμ΄νλ‘μ° λ±)μ λν κΈ°λ³Έ κ°λ λ μ λ¦¬ν΄ λ³Ό μ μλ μκ°μ΄μλ€.
νΉν ν΄λΌμ°λ λ€μ΄ν°λΈ μΈνλΌμ λμ μ΄ λ°μ΄ν° κ΄λ¦¬ λ° μ²λ¦¬μ ν¨λ¬λ€μμ λ°κΎΈκ³ μμ΄ λ―Έλμλ λ λμ μλν μμ€μ μꡬνλ λ°μ΄ν° μμ€ν μ΄ κ΅¬μΆλ κ²μ΄λΌλ μκ°λ λ λ€!γ γ
λν, μ΄λ² ν¬μ€ν μ ν΅ν΄ μμ£Ό μ¬μ©νλ IT λ° λ°μ΄ν° κ΄λ ¨ μ©μ΄λ₯Ό μ 리νκ³ , νμν λλ§λ€ λ€μ 곡λΆνλ μ΅κ΄μ λ€μ΄λ €κ³ νλ€!
κ·Έλμ μ΄λμ λ λ무 λ°λΉ μ λν₯ νμ μ λͺ»νμΌλκΉ γ γ