Talend Open Studio でメタデータを作成する2

Talend Open Studio でメタデータを作成する方法をご説明します。この記事は、Talend Open Studio for Data Integration v5.4.2 をベースに記事を作成しています。メタデータに関する簡単なご説明は以下の記事で記載しています。まだご覧になられていない方は是非御覧下さい。

Talend Open Studioのメタデータとは

また、CSVをデータソースとするメタデータの作成方法は以下の記事にてご紹介済みです。簡単なジョブの作成方法と合わせてご説明していますので、是非御覧下さい。
Talend Open Studio で簡単なジョブの作成(前半)
Talend Open Studio で簡単なジョブの作成(後半)

なお、本記事で作成するメタデータはRDBのMicrosoft SQL Server 2012 としています。メタデータの作成は幾つかの記事に分けてご説明しています。本記事では、データベースの接続定義を作成した後の、テーブルの定義情報設定についてご説明しています。データベースの接続定義の作成方法は前の記事「Talend Open Studio でメタデータを作成する1」をご参照下さい。対象のジョブやRDBについては皆様の環境と読み替えて御覧下さい。


1.前述のとおり、この記事ではデータベースの接続定義が作成済みであることを前提にご説明します。データベースの接続定義が作成済みであると、リポジトリツリーのDB接続には項目がひとつ追加されていると思います。以下の画面の状態です。以下の説明では、この接続定義にテーブルレイアウトの定義情報を設定する方法を記載しています。

追加された メタデータ DB接続定義

追加された メタデータ DB接続定義

2.メタデータのDB接続定義にテーブル定義情報を追加するためには、メタデータ項目を右クリックし「スキーマ情報の取得」を選択します。Talendで言う「スキーマ」はデータの定義情報(レイアウト情報)と読み替えて下さい。この「スキーマ」というキーワードは、Talend Open Studioで開発を行っていると随所で出てきます。また、この「スキーマ情報の取得」メニューは別の記事でもご説明しましたが、以前のバージョンでは「リトリーブ」とも表記されていて、Talend Open StudioがRDBからテーブル定義情報を収集する機能です。この機能があることで、開発者はテーブル定義情報を一から入力せずとも、Talendがデータを扱えるようにすることができます。

メタデータにスキーマ情報を追加する

メタデータにスキーマ情報を追加する

3.「スキーマ情報の取得」ダイアログが起動したら、まずは「次へ」ボタンをクリックして下さい。(使い慣れてきたらフィルタなど掛けてよりやりやすくお使いください)


Sponsored Link

メタデータ スキーマの取得 ダイアログの起動

メタデータ スキーマの取得 ダイアログの起動

4.RDBの全スキーマ、全テーブルを読み取る(フィルタをしなかったため)ように進めたので、選択可能なリストにはこの接続定義で参照可能なスキーマ、テーブルのすべてが表示されています。リストはツリー構造となっており、左の三角マークを展開・折りたたみでリスト表示を切り替えられます。一度、全リストをご確認下さい。Microsoft SQL Server でユーザデータベースで標準のスキーマ dbo から、今回のサンプルで使用する AdventureWorks2012 独自のスキーマも確認できます。

RDBから読み取るスキーマ情報の選択

RDBから読み取るスキーマ情報の選択

5.今回は、見本的に定義情報を取り込みますので、スキーマ「Person」を一括で選択します。Personスキーマはツリー構造で表記されており、スキーマ名の「Person」を選択する(チェックを入れる)と配下のテーブル、ビューは全て選択したことになります。選択すると、一覧の「Column Number」と「Creation Status」にスキーマ情報の取得状況が表示されます。下の画面のように、チェックを入れたテーブルに取得したカラム数とステータスとして「成功」と表示されていることを確認して下さい。今回は、Personスキーマを選択した状態で、「次へ」をクリックします。

読み取るスキーマ情報の選択

読み取るスキーマ情報の選択

6.読み取るスキーマを選択した後に、一つ、警告メッセージが表示されます。仕組みが理解できていれば非表示にしてしまって構いません。このメッセージで促している注意は、Talend Open Studioが読み取るスキーマ情報は必ずしも正確ではない、または、開発者が意図するデータ型や長さになっていないことを意味しています。今回の取り込み作業では、複数のスキーマを一括で取り込んでいますが、この警告が示すとおり、スキーマ情報の正常性チェックは開発者に委ねられているため、必要最低限のスキーマだけを取り込むことがポイントです。

スキーマ選択時の警告メッセージ

スキーマ選択時の警告メッセージ

7.そして、先の警告メッセージが示すとおりに、Talend Open Studioが自動的に設定したスキーマ情報は確認が必須であるため、この画面でひとつひとつ確認します。スキーマ情報の修正については別の記事でご説明します。ここでは、スキーマ情報の確認は必要になることをご認識ください。

スキーマ定義の手動再設定

スキーマ定義の手動再設定

8.正常に追加されたスキーマ情報はリポジトリツリー上でも確認することができます。ツリーの各々のアイテムは、ジョブを開発する時に使用するデータソースとなり、テーブルやビューそのものです。

追加されたスキーマ情報

追加されたスキーマ情報

スキーマ情報を取り込む手順は以上で終了です。

メタデータをジョブで使用する方法は次の記事でご紹介します。


Sponsored Link

関連記事

metadata_01

Talend Open Studioのメタデータとは

Talend Open Studio のメタデータについてご説明します。この記事は Talend O

記事を読む

Talend Open Studio で作成したメタデータをジョブで使用する

Talend Open Studio で作成したメタデータを使い、ジョブを開発する方法をご説明します

記事を読む

Talend Open Studio スキーマのカラム名に日本語を使用する

Talend Open Studio のスキーマでカラム名に日本語を使用する方法です。この記事は、T

記事を読む

no image

Talend Open Studio でメタデータを作成する1

Talend Open Studio でメタデータを作成する方法をご説明します。この記事は、Tale

記事を読む

PAGE TOP ↑