Mengenal Kettle

Diambil dari Pasas Pentaho Data Integration (PDI) atau Kettle adalah utilitas ETL open source di bawah Pentaho Corp. Amerika. Proyek ini awalnya merupakan inisiatif dari Matt Casters, seorang programmer dan konsultan. Business Intelligence (BI) dari Belgia yang telah menangani berbagai proyek BI untuk perusahaan besar. Untuk informasi lebih lanjut, Anda dapat mengunjungi alamat blog http://www.ibridge.be.
Saat ini Kettle merupakan utilitas ETL yang sangat populer dan salah satu yang terbaik di pasaran.

Beberapa kelebihannya adalah sebagai berikut:
• Memiliki koleksi modul pengolahan data yang cukup banyak. Lebih dari 100 modul atau step.
• Memiliki modul yang memudahkan perancangan model data warehouse seperti Slowly
Changing Dimension dan Junk Dimensions.
• Performa dan kemampuan skalabilitas yang baik dan sudah terbukti.
• Dapat dikembangkan dengan berbagai plugin tambahan.

Komponen Aplikasi Kettle

Kettle terdiri dari 4 utilitas dalam bentuk shell dan batch script yaitu:
Spoon
Merupakan utilitas yang digunakan untuk merancang dan menjalankan job / transformation
secara visual (GUI)
Dipaketkan dengan nama file spoon.bat (batch script) dan spoon.sh (BASH shell script)

Pan
Merupakan utilitas yang digunakan untuk mengeksekusi transformation
Umumnya dijalankan pada saat otomatisasi terjadwal (scheduled automation)
Dipaketkan dengan nama file pan.bat (batch script) dan pan.sh (BASH shell script)

Kitchen
Merupakan utilitas yang digunakan untuk mengeksekusi job
Umumnya dijalankan pada saat otomatisasi terjadwal (scheduled automation)
Dipaketkan dengan nama file pan.bat (batch script) dan pan.sh (BASH shell script)

Carte
Merupakan utilitas cluster web server yang digunakan untuk mengeksekusi job /
transformation
Terutama digunakan untuk meningkatkan performa ETL dengan pembagian load kerja pada
berbagai node Carte (master dan slave)


Gambar berikut rincian untuk organisasi Folder Kettle
Previous
Next Post »