Talend Open Studio で簡単なジョブの作成(前半)

Talend Open Studioで簡単なサンプルジョブの作り方をご説明します。

これまで、Talend Open Studioを起動して画面構成の説明までしました。画面は複数のペインに分かれていて、一見、とっつきにくい印象を持つ方もいるかもしれませんが、普段の作業で使用するのは幾つかに限られています。習うより慣れろ、そんな簡単なツールなので、まずは簡単なジョブから作成してみましょう。

ここで作成するジョブは、CSVからデータを読み込み、そのままの形でExcel に出力するという非実用的なものですが、流れを理解しやすくするためにシンプルにしています。


 

1.はじめに、左ペインにツリー表示されている「リポジトリ」を操作します。「ジョブ」の上で右クリックメニューを開き、「ジョブの作成」を選択します。

サンプルジョブの作成

サンプルジョブの作成

「新規ジョブ」ダイアログが開いたら、最低限、ジョブの名前だけでも設定します。ここでは、「t001_SampleJob」としました。入力したら「終了」ボタンをクリックします。

新規ジョブの作成

新規ジョブの作成

画面中央の「デザインエリア」に空白のジョブが編集状態で開きます。

空白のジョブ

空白のジョブ


 

2.この空白の「デザインエリア」に処理をデザインしていきます。画面右の「パレットビュー」には、ジョブデザインに使用する数百の「コンポーネント」が登録されています。パレットビューからコンポーネントを選んで配置し、処理の順序通りに線をつなぎ合わせ、一連の処理フローを作成します。ここでは、簡単なジョブとして、CSVファイルを読み込んで別のCSVファイルに出力するだけの処理を作成しますので、はじめはパレットビューは使用しません(後述します)。

パレットビュー

パレットビュー

ちなみに、CSVは総務省から提供されている、統計に用いる標準地域コードを使用します。CSVファイルは下記URLこらダウンロードしてください。ダウンロードしたCSVファイルは任意のフォルダに配置します。この説明では、「C:\Talend\samplejob_標準地域コード.csv」としました。
総務省のサイト
http://www.stat.go.jp/index/seido/9-5.htm
CSVファイル
http://www.stat.go.jp/index/seido/csv/9-5.csv


3.続いて、ジョブがCSVファイルを読み込みできるよう、コンポーネントを配置します。前述のとおり、今はパレットビューは使用せず、メタデータの作成から始めます。メタデータとは、ファイルやデータベースのテーブル定義を管理するための機能です。予めダウンロードした標準地域コードのCSVファイルをもとにメタデータの作成をおこなっていきます。


Sponsored Link

メタデータの作成はリポジトリビューからおこないます。リポジトリツリーの中に「メタデータ」という項目があることを確認してください。メタデータのツリーを展開すると、幾つかのメタデータタイプが展開されます。今回はCSVファイルですので、「区切り記号付きファイル」として作成します。

項目メタデータ>区切り記号付きファイル で右クリックメニューを出し、「区切り記号付きファイルの作成」を選択します。

 

メタデータの作成

メタデータの作成

新規列区切り記号付きファイル」のダイアログが起動したら、メタデータの名前を入力します。ここでは「標準地域コードCSV」としました。入力したら「次へ」ボタンをクリックします。

CSVメタデータ作成

CSVメタデータ作成

続いて、ファイルを選択します。先ほど保存したCSVファイルを、ファイル選択ダイアログから選択します。「フォーマット」もWindowsに設定しておきます。

CSVメタデータ作成

CSVメタデータ作成

次は、CSVファイルに関する詳細な設定値を与えます。
エンコーディング: MS932 を手入力します。
フィールドセパレータ: Comma を選択。
ロウセパレータ: \r\n とします。
エスケープ文字の設定: CSV を選びます。
テキストエンクロージャ: \” を選びます。
プレビュー欄の 「列名として先頭行を設定」 にチェックを入れます。
最後に「プレビューのリフレッシュ」をクリックすると、CSVファイルのプレビューが表示されます。
ここで文字化けなく表示されていることを確認してください。

CSVメタデータ詳細設定

CSVメタデータ詳細設定

最後に、CSVファイルの列定義です。名前を「標準地域コード」としておきます。また、ダイアログの下半分が、列を定義した一覧になっています。Talend Open StudioがCSVを読み取り、データ型、データの長さを推測して定義を作成してくれます。ただ、この定義が必ずしも正しい設定ではないことがあるため、必ず確認して下さい。今回は、市町村などの名前フィールドの文字列の長さを64にしておきました。最後に「終了」ボタンをクリックすると、メタデータの作成は完了です。

CSVメタデータの列定義

CSVメタデータの列定義

メタデータの作成が終わると、元の画面に戻ります。リポジトリビューのツリーの中に、先ほど作成した「標準地域コードCSV」が作成されていることを確認して下さい。

作成されたCSVメタデータ

作成されたCSVメタデータ

 

まずはここまでを、「簡単なジョブを作成」の前半とします。

後半は、このメタデータを使ったジョブの作成をご説明します。



Sponsored Link

関連記事

Talend Open Studio で簡単なジョブの作成(後半)

Talend Open Studioで簡単なジョブの作成方法をご紹介しています。 前半では、ジ

記事を読む

PAGE TOP ↑