AcroLearner

Machine Learning API for Cloud Service

日本語  中文  English

機械学習APIの利用手順概要
AcroLearnerは、自然言語処理の単純(ナイーブ)ベイズ分類器(Naive Bayes)、数値の線形回帰予測、ロジステック回帰分類、時系列AR/MA/ARMA/ARIMA回帰予測処理の機械学習RESTful API群を提供しています。
1.学習準備
1.1.学習テーマの定義:学習タイプなどの基礎情報を設定し、学習データ付きも可能です。学習処理に必要なtrainKeyと、結果取得に必要なresultKeyを発行します。
1.2.学習データの投入:学習テーマに関する学習データを個別または複数で一括投入します。大量の項目を追加する場合は、お気軽にご連絡ください。
2.学習処理trainKeyをセットして投入した学習テーマおよび学習データに基づき、対応する分類・予測モデルを生成します。
   - 自然言語分類処理の場合は、「テキスト分類学習」ボタンを利用して単純(ナイーブ)ベイズ分類器(Naive Bayes)モデルを生成します。
   ※現在は、日本語形態素解析のみが対応しており、アルファベット系の言語は一部のみ対応しています。
   - 数値データの回帰予測を行う場合は、「線形回帰学習」ボタンを使用して、該当する回帰予測モデルを作成してください。
   - 数値データの回帰分類解析を行う場合は、「ロジスティック回帰学習」ボタンを使用して、該当する回帰分類モデルを作成してください。
   - 時系列データの回帰予測を行う場合は、「AR/MA/ARMA/ARIMAモデルの学習」ボタンを使用して、該当する回帰予測モデルを作成してください。
3.分類・予測結果の取得:結果を取得するためには、resultKeyを設定し、テキスト、数値分類、または数値予測の結果を取得してください。
   - 自然言語分類処理を行う場合は、判別の対象となるテキストをtrainTextに設定し、「テキスト分類解析」ボタンを使用して、テキストの分類結果を取得してください。
   - 数値の回帰予測では、予測に使う説明変数をtrainTextにセットし、「線形回帰予測」ボタンを押して、あらかじめ作成した回帰予測モデルを使用して予測結果を取得します。
   - 数値の回帰分類解析では、分類に使う説明変数をtrainTextにセットし、「ロジスティック回帰分類」ボタンを押して、あらかじめ作成した回帰分類モデルを使用して分類結果を取得します。
   - 時系列回帰予測では、関連する引数を渡し、AR/MA/ARMA/ARIMAモデルの予測ボタンを押して、あらかじめ作成した回帰予測モデルを使用して予測結果を取得します。
AR:自己回帰、MA:移動平均、ARMA:自己回帰移動平均、ARIMA:自己回帰和分移動平均
統計ツールAPIも用意されています。
※他の情報取得、更新、削除APIも適宜お試しください。

1.学習準備

   1.1.学習テーマの定義
NameTypeURLJsonParamQueryParam

01105004
post
機械学習のテーマを追加します。
(language=0:英語、1:日本語、2:その他;partOfSpeech=名詞、形容詞、動詞、副詞、連体詞、助詞、助動詞、接頭辞、接続詞、記号など。Naivebayesテキスト分類のみ有効)
(trainType=1:Naivebayesテキスト分類、2:線形回帰、3:ロジステック回帰、4:時系列AR、5:時系列MA、6:時系列ARMA、7:時系列ARIMA)
学習テーマの項目情報と一緒に追加することも可能です。
- Naivebayesテキスト分類の場合、categoryを指定する必要があり、同じcategoryに複数の異なる項目が登録されることがあります。
- 線形回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があり、trainTextの数値組は半角スペースで区切り、すべての項目trainTextにおいて数値の数が一致している必要があります。最後の項目のtrainTextには実測値を格納してください。
- ロジステック回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があり、最後の項目のtrainTextに分類値を格納し、文字列でも可能です。 trainTextの数値または文字列の組み合わせは、半角スペースで区切り、すべての項目trainTextにおいて、数値または文字列の数が一致している必要があります。
- 時系列回帰予測の場合、基本的に1つの項目のtrainTextを登録する必要があり、trainTextの数値組は半角スペースで区切る必要があります。
成功したら、戻ってきたtrainKeyresultKeyをメモしてください。

01105005
put
学習テーマを更新します。
(language=0:英語、1:日本語、2:その他;partOfSpeech:名詞、形容詞、動詞、副詞、連体詞、助詞、助動詞、接頭辞、接続詞、記号など。Naivebayesテキスト分類のみ有効)
(trainType=1:Naivebayesテキスト分類、2:線形回帰、3:ロジステック回帰、4:時系列AR、5:時系列MA、6:時系列ARMA、7:時系列ARIMA)
学習テーマの項目情報と一緒に追加することも可能です。
- Naivebayesテキスト分類の場合、categoryを指定する必要があります。同じcategoryに複数の異なる項目を登録できます。
- 線形回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があります。trainTextの数値組は半角スペースで区切り、すべての項目のtrainTextには同じ数の数値が含まれている必要があります。最後の項目のtrainTextに実測値を格納します。
- ロジステック回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があります。最後の項目のtrainTextに分類値を格納します。文字列でも可能です。trainTextの数値または文字列の組み合わせは半角スペースで区切り、すべての項目のtrainTextには同じ数の数値または文字列が含まれている必要があります。
- 時系列回帰予測の場合、基本的に1つの項目のtrainTextを登録する必要があります。 trainTextの数値組は半角スペースで区切ります。

01105003
get
指定した学習テーマの属性情報(resultKeyを含む)を取得します。

01105006
delete
学習テーマを削除します。

01105007
put
学習テーマの状態を設定します。(StatusId=0:新規未承認; 1:承認済; 2:論理削除)
重要: 下記の学習、解析・予測処理を実施する前に必ず「1:承認済」に設定してください。

   1.2.学習データの投入
NameTypeURLJsonParamQueryParam

01106004
post
指定した学習テーマの明細項目情報(複数可)を追加します。
- Naivebayesテキスト分類の場合、categoryを指定する必要があります。同じcategoryに複数の異なる項目が登録されることがあります。
- 線形回帰の場合、少なくとも二つの項目のtrainTextを登録する必要があります。trainTextの数値組は半角のスペースで区切り、すべての項目のtrainTextにての数値数は一致しなければなりません。最後の項目のtrainTextに実測値を格納します。
- ロジステック回帰の場合も少なくとも二つの項目のtrainTextを登録する必要があります。最後の項目のtrainTextに分類値を格納し、文字列でも可能です。trainTextの数値又は文字列組は半角のスペースで区切り、すべての項目trainTextにての数値又は文字列数は一致しなければなりません。
- 時系列回帰予測の場合は、基本的に一つの項目のtrainTextを登録する必要があります。 trainTextの数値組は半角のスペースで区切ります。

01106005
put
指定した学習テーマの明細項目情報(複数可)を更新します。
- Naivebayesテキスト分類の場合、categoryを指定する必要があります。同じcategoryに異なる項目が複数登録されることがあります。
- 線形回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があります。trainTextの数値組は半角のスペースで区切り、すべての項目のtrainTextにての数値数は一致しなければなりません。最後の項目のtrainTextに実測値を格納します。
- ロジスティック回帰の場合も少なくとも2つの項目のtrainTextを登録する必要があります。最後の項目のtrainTextに分類値を格納することができ、文字列でも可能です。trainTextの数値又は文字列組は半角のスペースで区切り、すべての項目trainTextにての数値又は文字列数は一致しなければなりません。
- 時系列回帰予測の場合、基本的に1つの項目のtrainTextを登録する必要があり、trainTextの数値組は半角のスペースで区切ります。

01106001
get
指定した学習テーマの項目一覧を取得します。

01106002
get
指定した学習テーマの項目一覧をCSV形式で取得します。

01106003
get
指定した学習テーマの項目情報を取得します。

01106006
delete
指定した学習テーマの項目情報(複数項目番号指定可能)を削除します。

2.学習処理(分類・予測モデル生成)

NameTypeURLJsonParamQueryParam

01105008
get
学習項目のtrainTextに予め投入したテキストデータセットによって、単純(ナイーブ)ベイズ分類器(Naive Bayes)のモデルを生成します。学習項目の量によって時間が少しかかる場合があります。

01105010
get
学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、線形単回帰又は重回帰のモデルを作成します。学習が完了すると、結果一覧が戻ります。また、最後の決定係数(Score)値が1に近づくほど、良い予測結果が得られます。
(learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔)

01105012
post
学習項目のtrainText(スペース区切りの数値文字列)に予め投入した学習データセットによって、ロジスティック回帰の分類モデルを作成します。ここで、テスト用jsonデータはオプションで投入した学習データセットの一部もテストデータとして使われます。学習の結果一覧が戻り、最後の精度係数(Score)値が1に近づくなら、良い計算精度が得られます。
(testPercent: 投入した学習データセットにおけるテストデータの割合; learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔)

01105014
get
学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、自己回帰(AR)モデルを作成します。学習の結果一覧が戻り、最後の決定係数(Score)値が1に近づくと、良い予測結果が得られます。
(learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔; pOrder: 自己回帰の回数)

01105016
get
学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、移動平均(MA)モデルを作成します。学習の結果一覧が戻り、最後の決定係数(Score)値が1に近づくなら、良い予測結果が得られます。
(learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔; qOrder: 移動平均回帰の回数)

01105018
get
事前に投入された数値データセットを用いて、自己回帰移動平均(ARMA)モデルを作成します。学習の結果が返され、最後の決定係数(Score)の値が1に近づけば、正確な予測結果が得られます。
    (learnCount:学習回数;learnRate:学習率の増加率;interval:学習誤差の戻り間隔;pOrder:自己回帰次数;qOrder:移動平均回帰次数)

01105020
get
学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、自己回帰和分移動平均(ARIMA)モデルを作成します。学習の結果一覧が戻り、最後の決定係数(Score)値が1に近づけば、良い予測結果が得られます。
(learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔; pOrder: 自己回帰の回数; dOrder: 差分階数; qOrder: 移動平均回帰の回数)

3.分類・予測結果の取得

NameTypeURLJsonParamQueryParam

01105009
post
テキストを投入し、単純ベイズ(Naive Bayes)モデルで解析結果を取得します。学習する量によっては、処理に少し時間がかかることがあります。

01105011
post
引き渡した説明変数を使って作成した線形単回帰または重回帰モデルで予測を行い、その予測結果が返されます。

01105013
post
引き渡した説明変数を用いて作成したロジスティック回帰の分類モデルで計算処理を行い、分類の確率結果が返されます。

01105015
get
自己回帰(AR)モデルを使用して予測処理を行い、予測結果が返されます。
(outStartNo: 予測結果の戻り開始順序; outEndNo: 予測結果の戻り終了順序; cycleStartNo: 元の学習データの周期の開始順序; cyclePeriod: 元の学習データの周期)

01105017
get
移動平均(MA)モデルを使用して予測処理を行い、予測結果が返されます。
(outStartNo: 予測結果の戻り開始順序; outEndNo: 予測結果の戻り終了順序; cycleStartNo: 元の学習データの周期の開始順序; cyclePeriod: 元の学習データの周期)

01105019
get
自己回帰移動平均(ARMA)モデルで予測処理を行い、予測結果が返されます。
(outStartNo: 予測結果の戻り開始順番; outEndNo: 予測結果の戻り終了順番; cycleStartNo: 元の学習データの周期開始順番; cyclePeriod: 元の学習データの周期)

01105021
get
自己回帰和分移動平均(ARIMA)モデルで予測処理を行い、予測結果が返されます。
(outStartNo:予測結果戻りの開始順番、outEndNo:予測結果戻りの終了順番、cycleStartNo:元の学習データ周期開始順番、cyclePeriod:元の学習データ周期)

統計ツール

NameTypeURLJsonParamQueryParam

01301008
post
平均、幾何平均、平方平均、中央値、最頻値、最小値、最大値、合計、計数、分散、母分散、標準偏差、総偏差、共分散、総相関係数、偏差マトリックス、共分散マトリックス、ピアソン(pearsons)の相関係数マトリックス、スピアマン(spearmans)の相関係数マトリックス、ケンドール(kendalls)の相関係数マトリックスなどの統計結果が戻されます。線形回帰学習の場合は、説明変数と目的変数の相関係数が0.7以上であることを推奨します。

01301009
post
平均、幾何平均、平方平均、中央値、最頻値、最小値、最大値、合計、計数、分散、母分散、標準偏差、対数変換、対数差分変換、比率変換、ロジット変換、移動平均、移動中央、ホワイトノイズ、n階差分、自己共分散、自己相関係数、偏自己共分散、偏自己相関係数などの統計結果が戻されます。
(moveInterval:移動平均・中央の計算区間; convertMode:変換モード(0:元データ,1:差分,2:対数,3:対数差分,4:比率,5:ロジット); smoothMode:平滑化モード(0:なし,1:移動平均,2:移動中央); diffOrder:n階差分の階数)