Esercitazione DataStage: Formazione per principianti

Blog

Esercitazione DataStage: Formazione per principianti

Cos'è DataStage?

Datastage è uno strumento ETL che estrae i dati, trasforma e carica i dati dalla sorgente alla destinazione. Le origini dati possono includere file sequenziali, file indicizzati, database relazionali, origini dati esterne, archivi, applicazioni aziendali, ecc. DataStage facilita l'analisi aziendale fornendo dati di qualità per aiutare a ottenere informazioni aziendali. Ulteriori informazioni aggiuntive su Formazione online DataStage



Datastage viene utilizzato in una grande organizzazione come interfaccia tra diversi sistemi. Si occupa dell'estrazione, della traduzione e del caricamento dei dati dall'origine alla destinazione di destinazione. È stato lanciato per la prima volta da VMark a metà degli anni '90. Con l'acquisizione da parte di IBM di DataStage, è stato rinominato IBM WebSphere DataStage e successivamente IBM InfoSphere.

Le varie versioni di Datastage disponibili finora sul mercato erano Enterprise Edition (PX), Server Edition, MVS Edition, DataStage for PeopleSoft e così via. L'ultima edizione è IBM InfoSphere DataStage



IBM Information Server include i seguenti prodotti,

• IBM InfoSphere DataStage
• IBM InfoSphere QualityStage
• Direttore IBM InfoSphere Information Services
• IBM InfoSphere Information Analyzer
• IBM Information Server FastTrack
• Glossario aziendale IBM InfoSphere



Panoramica DataStage
Datastage ha le seguenti funzionalità.

dove acquistare token celsius

• Può integrare i dati dalla più ampia gamma di fonti di dati aziendali ed esterne
• Implementa regole di convalida dei dati
• È utile per elaborare e trasformare grandi quantità di dati
• Utilizza un approccio di elaborazione parallela scalabile
• Può gestire trasformazioni complesse e gestire più processi di integrazione
• Sfrutta la connettività diretta alle applicazioni aziendali come origini o destinazioni
• Sfrutta i metadati per l'analisi e la manutenzione
• Funziona in batch, in tempo reale o come servizio Web. Per avere una conoscenza approfondita su Formazione DataStage

Nelle sezioni seguenti, descriviamo brevemente i seguenti aspetti di IBM InfoSphere DataStage:

• Trasformazione dei dati
• Lavori
• Elaborazione parallela

InfoSphere DataStage e QualityStage possono accedere ai dati nelle applicazioni aziendali e nelle origini dati come:

• Database relazionali
• Database mainframe
• Applicazioni aziendali e analitiche
• Database di pianificazione delle risorse aziendali (ERP) o di gestione delle relazioni con i clienti (CRM)
• Elaborazione analitica online (OLAP) o database di gestione delle prestazioni

Tipi di fase di elaborazione

Il lavoro IBM infosphere è costituito da singole fasi collegate tra loro. Descrive il flusso di dati da un'origine dati a una destinazione dati. Di solito, uno stadio ha almeno un input di dati e/o un output di dati. Tuttavia, alcune fasi possono accettare più di un input e output di dati in più di una fase.

Nella progettazione del lavoro le varie fasi che puoi utilizzare sono:

• Fase di trasformazione
• Fase di filtraggio
• Fase aggregatore
• Fase Rimuovi duplicati
• Entra in scena
• Fase di ricerca
• Fase di copia
• Fase di ordinamento
• Contenitori

Componenti e architettura di DataStage

DataStage ha quattro componenti principali, vale a dire,

1. Amministratore: Viene utilizzato per le attività di amministrazione. Ciò include l'impostazione degli utenti DataStage, l'impostazione dei criteri di eliminazione e la creazione e lo spostamento di progetti.
2. Responsabile: È l'interfaccia principale del Repository di DataStage. Viene utilizzato per l'archiviazione e la gestione di metadati riutilizzabili. Tramite DataStage manager è possibile visualizzare e modificare i contenuti del Repository.
3. Progettista: Un'interfaccia di progettazione utilizzata per creare applicazioni DataStage O lavori. Specifica l'origine dati, la trasformazione richiesta e la destinazione dei dati. I lavori vengono compilati per creare un eseguibile pianificato dal direttore ed eseguito dal server
4. Direttore: Viene utilizzato per convalidare, pianificare, eseguire e monitorare i lavori del server DataStage e i lavori paralleli.

Questo è il titolo dell'immagine
L'immagine sopra spiega come IBM Infosphere DataStage interagisce con altri elementi della piattaforma IBM Information Server. DataStage è diviso in due sezioni, Shared Components e Runtime Architecture.

#DataStage #DataStagetraining