AWS Glue
AWS Glue to w pełni zarządzana usługa AWS do realizacji procesów ETL (extract, transform, and load), która umożliwia katalogowanie danych oraz ich przygotowanie do analiz. Ułatwia odkrywanie danych z różnych źródeł, automatyczne generowanie schematów i tworzenie centralnego katalogu danych dostępnego dla innych usług AWS.
AWS Glue pozwala tworzyć i edytować skrypty ETL w językach takich jak Python lub Scala, aby przekształcać dane z formatu źródłowego do docelowego. Umożliwia harmonogramowanie i uruchamianie zadań ETL w środowisku bezserwerowym, eliminując potrzebę zarządzania infrastrukturą.
Usługa obsługuje integrację z wieloma źródłami danych, takimi jak Amazon S3, Amazon RDS, Amazon Redshift czy bazy danych JDBC. Ułatwia łączenie danych z różnych systemów, ich oczyszczanie i transformację na potrzeby analiz biznesowych, raportowania i uczenia maszynowego. AWS Glue wspiera również automatyczne wersjonowanie schematów i monitorowanie zadań ETL, co upraszcza zarządzanie i zapewnia kontrolę nad procesami przetwarzania danych.