データの集約とは「あるカラムの値が同じであるレコードをグルーピングし、合計/平均などを算出すること」です。
「顧客ID」の値が同じカラムをグルーピングして「PV数」のカラムの値を足し合わせることで、新たに「顧客ID」と「PV数」のカラムを作成する例を紹介します。
「集約して残したいカラム」に対して使用できる集計方法は、「集約して残したいカラム」のデータ型によって異なります。
以下では、集計方法の種類と集計内容、使用できるデータ型についてまとめましたのでご参照ください。
| # | 集計方法 | 集計内容 |
使用できる
データ型 |
| 1 | カウント | 「集約して残したいカラム」で選択したカラム内に存在する「NULL」以外のレコード数を集計する |
テキスト型
整数型 小数型 日付型 日時型 真偽型 |
| 2 |
ユニーク
カウント |
「集約して残したいカラム」で選択したカラム内に存在する「NULL」以外のレコードのユニーク数を集計する |
テキスト型
整数型 小数型 日付型 日時型 真偽型 |
| 3 | 合計 | 「集約して残したいカラム」で選択したカラム内に存在するレコードの値の合計を算出する |
整数型
小数型 |
| 4 | 平均 |
「集約して残したいカラム」で選択したカラム内に存在するレコードの値の平均を算出する
※「NULL」の数は平均を取る際の分母にカウントしない |
整数型
小数型 |
| 5 | 最大 | 「集約して残したいカラム」で選択したカラム内に存在するレコードの最大値を抽出する |
整数型
小数型 |
| 6 | 最小 | 「集約して残したいカラム」で選択したカラム内に存在するレコードの最小値を抽出する |
整数型
小数型 |
| 7 | 最新 | 「集約して残したいカラム」で選択したカラム内に存在するレコードの最新日/最新日時を抽出する |
日付
日時型 |
| 8 | 最古 | 「集約して残したいカラム」で選択したカラム内に存在するレコードの最古日/最古日時を抽出する |
日付型
日時型 |
| 9 | 行結合 | 「集約して残したいカラム」で選択したカラム内に存在する値を、並び順と区切り文字を設定することで1つのセルに結合する |
テキスト型
整数型 小数型 日付型 日時型 真偽型 |