# PHPアプリケーションインポート統合

Treasure Dataは、サーバーサイドのログとイベントを収集し、PHPアプリケーションからTreasure Agent経由でデータをシームレスにインポートするための[td-agent](https://docs.treasuredata.com/smart/project-product-documentation/about-treasure-data-s-server-side-agent)を提供しています。

# 前提条件

- PHPの基本的な知識。
- [TD Toolbelt](https://toolbelt.treasuredata.com/)を含むTreasure Dataの基本的な知識。
- PHP 5.3以上(ローカルテスト用)。


fluent-logger-phpライブラリはHerokuでは動作しません([理由はこちら](https://docs.treasuredata.com/smart/project-integrations/heroku-add-on-notes))。

# td-agentのインストール

アプリケーションサーバーに`td-agent`をインストールします。td-agentはアプリケーションサーバー内に配置され、アプリケーションログのクラウドへのアップロードに重点を置いています。

![](/assets/image2020-12-2_14-13-34.1754f4e3154420d54cc976b16d454ef773c83ad5fc4b8580d99a87302c614932.44992bba.png)

[fluent-logger-php](http://github.com/fluent/fluent-logger-php)ライブラリにより、PHPアプリケーションはローカルのtd-agentにレコードを送信できます。td-agentは5分ごとにデータをクラウドにアップロードします。デーモンはローカルノードで実行されるため、ログの遅延は無視できるレベルです。

## td-agentインストールオプション

`td-agent`をインストールするには、環境に応じて以下のいずれかのコマンドを実行します。エージェントプログラムは、rpm/deb/dmgなどの各プラットフォームのパッケージ管理ソフトウェアを使用すると自動的にインストールされます。

### RHEL/CentOS 5,6,7


```
$ curl -L https://toolbelt.treasuredata.com/sh/install-redhat-td-agent3.sh | sh
```

### UbuntuおよびDebian


```
# 18.04 Bionic
$ curl -L https://toolbelt.treasuredata.com/sh/install-ubuntu-bionic-td-agent3.sh | sh
# 16.04 Xenial (64bit only)
$ curl -L https://toolbelt.treasuredata.com/sh/install-ubuntu-xenial-td-agent3.sh | sh
```

### Amazon Linux

Amazon Linux 1またはAmazon Linux 2を選択できます。[AWS LinuxへのTreasure Agentのインストール](https://docs.treasuredata.com/smart/project-product-documentation/installing-td-agent-on-aws-linux)を参照してください。

### MacOS X 10.11+


```
$ open 'https://td-agent-package-browser.herokuapp.com/3/macosx/td-agent-3.1.1-0.dmg'
```

MacOS X 10.11.1 (El Capitan)では、セキュリティの変更が導入されています。td-agentのインストール後、**/Library/LaunchDaemons/td-agent.plist**ファイルを編集して、**/usr/sbin/td-agent**を**/opt/td-agent/usr/sbin/td-agent**に変更してください。

### Windows Server 2012+

Windowsのインストールには、以下に詳述されている手順が必要です。

- [.msiインストーラーを使用したTreasure Agentのインストール(Windows)](https://docs.fluentd.org/installation/install-by-msi)


### Opscode Chefリポジトリ


```
$ echo 'cookbook "td-agent"' >> Berksfile
$ berks install
```

[AWS Elastic Beanstalk](https://github.com/treasure-data/elastic-beanstalk-td-agent)もサポートされています。現在、Windowsはサポートされていません。

## /etc/td-agent/td-agent.confの変更

次に、`apikey`オプションを設定してAPIキーを指定します。APIキーは、Treasure コンソールのプロフィールページからTreasure コンソールで確認できます。


```conf
# Unix Domain Socket Input
<source>
  type unix
  path /var/run/td-agent/td-agent.sock
</source>

# Treasure Data Output
<match td.*.*>
  type tdlog
  endpoint api.treasuredata.com
  apikey YOUR_API_KEY
  auto_create_table
  buffer_type file
  buffer_path /var/log/td-agent/buffer/td
  use_ssl true
</match>
```

`YOUR_API_KEY` は、実際の apikey 文字列に置き換える必要があります。API キーは、Treasure コンソール のプロファイルから取得できます。[Write-only API key](/products/my-settings/getting-your-api-keys) の使用が推奨されます。

以下の行が設定されたら、エージェントを再起動してください。


```
# Linux
$ sudo /etc/init.d/td-agent restart

# MacOS X
$ sudo launchctl unload /Library/LaunchDaemons/td-agent.plist
$ sudo launchctl load /Library/LaunchDaemons/td-agent.plist
```

td-agentは現在、ポート24224経由でデータを受け入れ、データをバッファリングし(*var/log/td-agent/buffer/td*)、自動的にデータをクラウドにアップロードします。

## fluent-logger-phpの使用

fluent-logger-phpを使用するには、パッケージマネージャーとして[Composer](https://getcomposer.org/)を使用します。まず、ディレクトリに以下の内容で`composer.json`を作成します。


```
{
  "require": {
    "fluent/logger": "v1.0.0"
  }
}
```

次に、`Composer`をインストールし、必要なライブラリをインストールします。


```
$ curl -sS https://getcomposer.org/installer | php
$ php composer.phar install
```

次に、以下のように初期化してレコードを送信します。


```
<?php
require_once __DIR__.'/vendor/autoload.php';
use Fluent\Logger\FluentLogger;
$logger = new FluentLogger("unix:///var/run/td-agent/td-agent.sock");
$logger->post("td.test_db.test_table", array("hello"=>"world"));
$logger->post("td.test_db.follow", array("from"=>"userA", "to"=>"userB"));
```

## データインポートの確認

前述のプログラムを実行します。


```
$ php test.php
```

SIGUSR1シグナルを送信すると、td-agentのバッファがフラッシュされます。アップロードはすぐに開始されます。


```
# Linux
$ kill -USR1 `cat /var/run/td-agent/td-agent.pid`

# MacOS X
$ sudo kill -USR1 `sudo launchctl list | grep td-agent | cut -f 1`
```

データが正常にアップロードされたことを確認するには、次のように*td tables*コマンドを実行します。


```
$ td tables
+------------+------------+------+-----------+
| Database   | Table      | Type | Count     |
+------------+------------+------+-----------+
| test_db    | test_table | log  | 1         |
| test_db    | follow     | log  | 1         |
+------------+------------+------+-----------+
```

post()の最初の引数によって、データベース名とテーブル名が決定されます。`td.test\_db.test\_table`を指定すると、データはデータベース*test_db*内のテーブル*test_table*にインポートされます。これらはアップロード時に自動的に作成されます。

# 本番デプロイメントのヒント

## ApacheとMod_phpを使用する

ApacheとMod_phpの使用を推奨します。その他のセットアップは完全に検証されていません。

## Apache prefork MPMを使用する

Apache prefork MPMを使用してください。worker MPMなどの他のMPMは使用しないでください。現在の設定は*apachectl -V*コマンドで確認できます。


```
$ apachectl -V | grep MPM:
Server MPM:     Prefork
```

## MaxRequestsPerChildを設定する

Apacheの設定ファイルで*MaxRequestsPerChild*を設定して、PHPプロセスを定期的に再起動することを推奨します。


```conf
<IfModule mpm_prefork_module>
  StartServers          32
  MinSpareServers       32
  MaxSpareServers       32
  MaxClients            32
  MaxRequestsPerChild 4096
</IfModule>
```

MaxRequestsPerChildをゼロに設定しないでください。

# 本番デプロイメント

## td-agentの高可用性構成

高トラフィックのウェブサイト(5つ以上のアプリケーションノード)の場合、データ転送の信頼性とクエリパフォーマンスを向上させるために、td-agentの高可用性構成を使用してください。

- [td-agentの高可用性構成](https://docs.treasuredata.com/smart/project-product-documentation/configuring-td-agent-for-high-availability)


## td-agentの監視

td-agent自体の監視も重要です。td-agentの一般的な監視方法については、以下のドキュメントを参照してください。

- [td-agentの監視](https://docs.treasuredata.com/smart/project-product-documentation/monitoring-td-agent)


td-agentは[Fluentdプロジェクト](http://fluentd.org/)の下で完全にオープンソース化されています。

# FAQ

## PHPアプリケーションに「Resource temporarily unavailable」警告メッセージが表示される

この問題は、比較的大量のトラフィックがある場合、または古いLinuxカーネルバージョンを使用している場合に発生します。Linuxカーネルを少し調整する必要があります。

### 最大ファイルディスクリプタ数を増やす

まず、プロセスごとの最大ファイルディスクリプタ数を増やします。`ulimit -n`コマンドを実行して結果が`1024`と表示された場合は、以下の手順に従って65535に増やしてください。

- [最大ファイルディスクリプタ数を増やす](https://docs.fluentd.org/installation/before-install)


### カーネルパラメータの最適化

以下のパラメータを`/etc/sysctl.conf`ファイルに追加します。`sysctl -w`と入力するか、ノードを再起動して変更を有効にします。root権限が必要です。


```
net.core.somaxconn = 1024
net.ipv4.tcp_tw_reuse = 1
net.ipv4.ip_local_port_range = 10240    65535
```

# 次のステップ

従来のRDBMSよりも柔軟なスキーマメカニズムを提供しています。クエリには、HiveとPrestoのクエリ言語を活用しています。

- [スキーマ管理](https://docs.treasuredata.com/smart/project-product-documentation/schema-management)
- [Prestoクエリ言語](/products/customer-data-platform/data-workbench/queries/trino/quickstart)
- [Hiveクエリ言語](/products/customer-data-platform/data-workbench/queries/hive/quickstart)
- [REST APIとそのバインディングによるプログラマティックアクセス](/apis/td-api)