Skip to content
Last updated

データアナリスト向けワークフロー

WebDesktop

このガイドでは、データアナリストがTreasure AI Studio内で実行するワークフローを解説します。曖昧なビジネス上の問いから、洗練されたエクスポート可能なダッシュボードの完成まで、すべてのステップが1つの会話の中で完結します。AIがツール間の移行を担うため、分析そのものに集中できます。

注意

AIはバックグラウンドで複数のツールを連携させています。データ探索にはCLIコマンド、クエリにはTrino SQL、可視化にはHTMLチャート生成、エクスポートにはファイル生成を使用します。すべてのツール呼び出しはチャットストリームに表示され、展開して各ステップを確認できます。AIがどのようにマルチステップのワークフローを計画・実行するかについては、Agent Orchestratorをご参照ください。

目的

データアナリストが「先四半期のコンバージョン率はどうなったのか?」という問いから、検証済みのステークホルダー向けダッシュボードを1つのセッションで完成できるようにします。通常、分析作業を断片化させているクエリエディタ・可視化ツール・プレゼンテーションソフト間のコンテキストスイッチングを排除します。


ある1日の流れ

月曜日の朝、プロダクト担当VPからSlackメッセージが届きます。「コンバージョン率が下がっているようだ。午後2時のリーダーシップミーティングに向けてQ1のパフォーマンス概要をまとめてもらえるか?」

通常であれば、クエリエディタを開き、どのテーブルにコンバージョンイベントが格納されているかを思い出し、SQLを書いてデバッグし、結果をスプレッドシートにコピーし、チャートを作成してスライドに貼り付ける、という作業が必要です。2時間のコンテキストスイッチングです。

Studioなら、すべてが1つの会話で完結します。目標を伝えると、AIがデータを探索し、最適化されたクエリを書き、チャートを描画し、ダッシュボードを組み立て、資料を生成します。分析の方向性はあなたが決め、ツールの操作はAIが担います。


推奨セットアップ

ワークフローを開始する前に、最大限の効率を発揮できるよう環境を設定してください。

セットアップ手順方法理由
プロジェクトを作成するTDコンテキストでデフォルトデータベースを設定した「Analytics」という名前のプロジェクトを作成するクエリごとにデータベースを指定する手間を省けます
スキルを有効化するスキルのドロップダウンで trinotime-filteringtrino-optimizer を選択するAIにプラットフォームのSQLパターンを学習させます
モデルを選択するまず バランス(Sonnet)を使用し、複雑なJOINには プロ(Opus)に切り替える速度と推論品質のバランスを取ります

ステップバイステップのワークフロー:Q1パフォーマンスダッシュボード

ステップ1:データを探索する

どのテーブルをクエリするかではなく、何を探しているかをAIに伝えることから始めます。

You: I need to analyze Q1 conversion performance. What data do we have
     related to user signups, purchases, and page views?

AIがバックグラウンドで行うこと:

  1. tdx databases を実行して利用可能なデータベースを一覧表示する
  2. プロジェクト設定のデフォルトデータベースに対して tdx tables <database> を実行する
  3. 有望なテーブルに対して tdx describe を実行してスキーマを確認する
  4. 利用可能なデータを要約し、クエリのアプローチを提案する

表示される内容:

AI: [Tool: Bash] tdx databases
    [Tool: Bash] tdx tables marketing_prod
    [Tool: Bash] tdx describe marketing_prod.user_events
    [Tool: Bash] tdx describe marketing_prod.purchases

    I found two relevant tables in marketing_prod:

    | Table | Key Columns | Row Estimate |
    |-------|-------------|-------------|
    | user_events | user_id, event_type, time | ~45M rows |
    | purchases | user_id, amount, product_id, time | ~2.1M rows |

    user_events contains signup, page_view, and add_to_cart events.
    I can calculate conversion as signups → purchases. Shall I proceed?
プロのヒント

テーブルが既にわかっている場合は、探索をスキップできます。「Q1のコンバージョンについて marketing_prod.user_eventsmarketing_prod.purchases をクエリしてください」と伝えると、AIはデータ探索をスキップしてクエリの構築に直接進みます。

ステップ2:分析クエリを実行する

アプローチを確認し、AIにSQLを書かせます。

You: Yes, calculate daily conversion rate (signups to purchases) for Q1.
     Break it down by week and by traffic source.

AIが行うこと:

  1. time-filtering スキルに従い、td_interval() を使用してQ1の日付フィルタリングを含むTrinoクエリを構築する
  2. user_id をキーに user_eventspurchases をJOINする
  3. trino スキルに従い、パフォーマンスのためにパーティションプルーニングを適用する
  4. tdx query 経由でクエリを実行する

表示される内容:

AI: [Tool: Bash] tdx query -e trino "
      SELECT
        TD_TIME_FORMAT(e.time, 'yyyy-ww') AS week,
        e.source AS traffic_source,
        COUNT(DISTINCT e.user_id) AS signups,
        COUNT(DISTINCT p.user_id) AS purchasers,
        ROUND(COUNT(DISTINCT p.user_id) * 100.0
              / NULLIF(COUNT(DISTINCT e.user_id), 0), 2) AS conversion_rate
      FROM marketing_prod.user_events e
      LEFT JOIN marketing_prod.purchases p
        ON e.user_id = p.user_id
        AND TD_INTERVAL(p.time, '-90d')
      WHERE e.event_type = 'signup'
        AND TD_INTERVAL(e.time, '-90d')
      GROUP BY 1, 2
      ORDER BY 1, 2
    "

    Here are the results:

    | Week | Source | Signups | Purchasers | Rate |
    |------|--------|---------|------------|------|
    | 2026-01 | organic | 1,240 | 186 | 15.0% |
    | 2026-01 | paid | 890 | 98 | 11.0% |
    | ... | ... | ... | ... | ... |

    Conversion rate dropped from 15% in January to 11.2% in March,
    with paid traffic showing the steepest decline.

ステップ3:結果を可視化する

次に、可視化を依頼します。

You: Show me the weekly conversion trend as a line chart,
     with separate lines for each traffic source.

AIが行うこと:

  1. クエリ結果をチャートのデータ構造(ラベル+データセット)にフォーマットする
  2. チャートを含む自己完結型のHTMLファイルを生成し、open_file で開く
  3. チャートがファイルパネルに表示される

表示される内容:

ファイルパネルに以下を含む折れ線グラフが表示されます。

  • X軸:週(2026-01〜2026-13)
  • Y軸:コンバージョン率(%)
  • 折れ線:トラフィックソースごとに1本、色分けされている
  • ホバー時に正確な値を表示するツールチップ
You: The paid drop is steeper than I expected. Can you add a scatter plot
     showing spend vs. conversion for paid traffic?

AIがコストデータをJOINするフォローアップクエリを実行し、散布図を描画します。これでファイルパネルに2つのチャートが表示されます。

ステップ4:ダッシュボードを構築する

近日公開予定

グリッドダッシュボードは計画中の機能です。このステップで説明するワークフローは、現在のリリースではまだ利用できません。AIに個別のチャートやテーブルを別々のファイルとして生成するよう依頼することは引き続き可能です。

分析が完了したら、すべてをグリッドダッシュボードにまとめます。

You: Build a dashboard with:
     - KPI cards for overall Q1 conversion, total signups, and total revenue
     - The conversion trend line chart
     - A bar chart of conversion by source
     - A table of the top 10 underperforming weeks

AIが行うこと:

  1. KPIの合計値を計算するための追加クエリを実行する
  2. マルチセルのグリッドレイアウト(上段にKPI、中段にチャート、下段にテーブル)を含むHTMLファイルを生成する
  3. ファイルパネルでファイルを開く

表示される内容:

以下を含むインタラクティブなダッシュボードが表示されます。

  • トレンド矢印付きで合計指標を表示する3つのKPIカード
  • 折れ線グラフと棒グラフが横並びで表示される
  • 週ごとの詳細を表示するソート可能なテーブルが下部に配置される
プロのヒント

ダッシュボードは複数ページに対応する予定です。AIに「地域別の内訳のための2ページ目を追加してください」と依頼すると、ダッシュボードの上部にページセレクターのドロップダウンが表示されます。

ステップ5:遅いクエリをデバッグする

分析中にクエリの実行に時間がかかりすぎることがあります。AIが最適化を支援します。

You: That last query took 3 minutes. Can you optimize it?

AIが行うこと(trino-optimizerスキルに従う):

  1. 遅いクエリの構造を分析する
  2. パーティションプルーニングの欠如やコストの高いJOINを特定する
  3. 最適化パターンを使用してクエリを書き直す(中間結果にはCTAS、大きなカーディナリティには APPROX_DISTINCT、複数の LIKE 句の代わりに REGEXP_LIKE
  4. 最適化されたバージョンを実行し、速度向上を報告する
AI: The original query scanned all partitions. I've rewritten it with
    explicit TD_TIME_RANGE bounds and moved the join to a CTE:

    [Tool: Bash] tdx query -e trino "WITH signups AS (...) ..."

    Execution time: 12 seconds (was 3 minutes).
    The main improvement was partition pruning — the original WHERE clause
    didn't use TD_INTERVAL on the purchases table.

ステップ6:成果物をエクスポートする

分析が完了したら、午後2時のミーティング向けの成果物を生成します。

You: Create a PowerPoint deck with these findings for the leadership meeting.
     Include the charts, key takeaways, and a recommendation slide.

AIが行うこと:

  1. タイトル、エグゼクティブサマリー、コンバージョントレンドチャート、ソース別内訳、パフォーマンスが低い週のテーブル、推奨事項のスライドを含むPPTXを構成する
  2. 作業ディレクトリにファイルを書き込む
  3. プレビューボタンとダウンロードボタン付きのファイルカードがチャットに表示される
You: Also export the raw data as an Excel file with separate sheets
     for weekly metrics and source breakdown.

AIが行うこと:

  1. クエリ結果を複数シートのXLSX構造にフォーマットする
  2. ファイルを書き込む
  3. ダウンロード可能な別のファイルカードが表示される

ワークフローのバリエーション

Q1ダッシュボードはワークフローの一例です。Studioで使用できる他の一般的なアナリストワークフローを紹介します。

データ品質監査

You: Audit the customer_profiles table for data quality issues —
     check for nulls, duplicates, and stale records.

AI: 1. [Bash] tdx describe marketing_prod.customer_profiles → スキーマ確認
    2. [Bash] tdx query → 列ごとのNULL件数
    3. [Bash] tdx query → user_idの重複検出
    4. [Bash] tdx query → 鮮度確認(90日以上更新されていないレコード)
    5. [open_file] 列ごとのNULL率の棒グラフ
    6. [Text] 優先度付きの改善手順を含むサマリー

パイプラインのデバッグ

You: The daily_etl workflow failed last night. What happened?

AI: 1. [Bash] tdx wf sessions daily_etl → 失敗したセッションを特定
    2. [Bash] tdx wf attempt logs <session_id> → エラーログを読み込む
    3. [Thinking] 根本原因:テーブルが見つからない(スキーマ変更)
    4. [Write] 修正を加えた.digファイルを更新
    5. [Text] 説明と_retryブロックの追加に関する推奨事項

アドホック探索

You: I just got access to the new clickstream_raw table.
     What's in it and is it useful for attribution modeling?

AI: 1. [Bash] tdx describe clickstream_raw → スキーマとサンプル確認
    2. [Bash] tdx query → 行数、日付範囲、イベントタイプ
    3. [Bash] tdx query → 主要ディメンションのカーディナリティ
    4. [open_file] イベントタイプの分布
    5. [Text] 評価:マルチタッチアトリビューションに適している、
             purchasesテーブルとの推奨JOINストラテジー

AIの透明性:オーケストレーターの仕組み

このワークフロー全体を通じて、AIはユーザーが確認・操作できる意思決定を行っています。

AIの意思決定ユーザーが確認できる内容上書きする方法
クエリ対象のテーブルチャット内のtdx describeツール呼び出しanalytics.eventsを代わりに使用してください」
SQL構文と関数Bashツールカードに表示される完全なクエリ「TrinoではなくHiveを使用してください」または「region = 'US'のWHERE句を追加してください」
チャートタイプの選択open_file呼び出しで確認できるチャートHTMLファイル「折れ線グラフではなく棒グラフで表示してください」
ダッシュボードのレイアウトWriteツール呼び出しで確認できるYAMLファイル「KPIを上部の3列行に配置してください」
最適化ストラテジー元のクエリと並べて表示される書き直されたクエリ「元の構造を維持しつつ、パーティションプルーニングを追加してください」

AIはプラットフォーム固有のパターンに対してアクティブなスキル(Trino、時間フィルタリング、trino-optimizer)に従いますが、最終的な決定権は常にユーザーにあります。すべてのツール呼び出しは展開可能で、クリックすると正確なコマンドと結果を確認できます。


成功基準:ビジネス上の成果

このワークフローの最後には、以下が得られます。

  • 検証済みの分析結果 — すべての数値は、チャットに表示された特定のクエリまで追跡可能です
  • インタラクティブなビジュアライゼーション — ツールチップとレジェンドを備えたチャートで、画面共有中にプレゼンテーションできます
  • ステークホルダー向けダッシュボード — KPI、チャート、テーブルを含むマルチセルグリッド
  • エクスポート可能な成果物 — ダウンロード可能なPPTXデッキとXLSXデータファイル
  • 監査可能な記録 — 会話全体が分析プロセスのドキュメントとして機能します

クエリエディター、BIツール、スライドビルダーを切り替えることなく、すべて1つのセッションで作成できます。


確認事項

このワークフローに従った後、以下のことができるようになります。

  • 自然言語とAIのtdx describe呼び出しを使用して、未知のデータベースを探索する
  • TD固有の関数を含む最適化されたTrino SQLをリクエストして受け取る
  • クエリ結果からチャートを生成し、そのタイプをカスタマイズする
  • KPI、チャート、テーブルを含むマルチセルグリッドダッシュボードを構築する
  • ステークホルダーへの提供のためにPPTXおよびXLSX形式で結果をエクスポートする
  • すべての数値を、それを生成したツール呼び出しまで追跡する

トラブルシューティング

問題解決策
AIが存在しないテーブルを参照するSQLを記述するまずAIにtdx databasestdx tablesを実行させて、利用可能なテーブルを確認するよう依頼してください。プロンプトにデータベース名とテーブル名を明示的に指定してください
クエリ後にチャートがレンダリングされないクエリがデータを返したか確認してください — ツール呼び出しを展開して確認します。結果セットが空の場合は、クエリフィルターを調整してください
ダッシュボードのセルが空になっているグリッドダッシュボードでは、AIが各セルにデータを入力する必要があります。セルが空白の場合は、「クエリの値でKPIセルを埋めてください」とAIに依頼してください
エクスポートが失敗するか、空のファイルが生成される現在のセッションでデータが利用可能か確認してください。コンテキストが圧縮されている場合、AIはエクスポート前にクエリを再実行する必要がある場合があります

次のステップ