AcroLearner自然言語分類、線形回帰、ロジステック回帰、時系列予測の機械学習API

1.学習準備

1.1.学習テーマの定義

Name	Type	URL	JsonParam	QueryParam
01105004 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains	{ "subject": "テスト1", "trainType": 0, "searchMode": 0, "partOfSpeech": "名詞,形容詞", "language": 1, "noSymbol": 1, "statusId": 1, "memo": "BBBB", "items": [ { "category": "スパム", "trainText": "XXXXXXXXXXXXXXXXX", "memo": "検証" }, { "category": "通常", "trainText": "XXXXXXXXXXXXXXXXX", "memo": "検証" } ] }
	機械学習のテーマを追加します。（language=0:英語、1:日本語、2:その他;partOfSpeech=名詞、形容詞、動詞、副詞、連体詞、助詞、助動詞、接頭辞、接続詞、記号など。Naivebayesテキスト分類のみ有効）（trainType=1:Naivebayesテキスト分類、2:線形回帰、3:ロジステック回帰、4:時系列AR、5:時系列MA、6:時系列ARMA、7:時系列ARIMA）学習テーマの項目情報と一緒に追加することも可能です。 - Naivebayesテキスト分類の場合、categoryを指定する必要があり、同じcategoryに複数の異なる項目が登録されることがあります。 - 線形回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があり、trainTextの数値組は半角スペースで区切り、すべての項目trainTextにおいて数値の数が一致している必要があります。最後の項目のtrainTextには実測値を格納してください。 - ロジステック回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があり、最後の項目のtrainTextに分類値を格納し、文字列でも可能です。 trainTextの数値または文字列の組み合わせは、半角スペースで区切り、すべての項目trainTextにおいて、数値または文字列の数が一致している必要があります。 - 時系列回帰予測の場合、基本的に1つの項目のtrainTextを登録する必要があり、trainTextの数値組は半角スペースで区切る必要があります。成功したら、戻ってきたtrainKeyとresultKeyをメモしてください。

01105005 json yaml	put	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains	{ "trainKey": "AAAAAAAA", "subject": "テスト1", "trainType": 0, "searchMode": 0, "partOfSpeech": "名詞,形容詞", "language": 1, "noSymbol": 1, "memo": "BBBB", "items": [ { "category": "スパム", "trainText": "XXXXXXXXXXXXXXXXX", "memo": "検証" }, { "category": "通常", "trainText": "XXXXXXXXXXXXXXXXX", "memo": "検証" } ] }	nullable=false
	学習テーマを更新します。（language=0：英語、1：日本語、2：その他；partOfSpeech：名詞、形容詞、動詞、副詞、連体詞、助詞、助動詞、接頭辞、接続詞、記号など。Naivebayesテキスト分類のみ有効）（trainType=1：Naivebayesテキスト分類、2：線形回帰、3：ロジステック回帰、4：時系列AR、5：時系列MA、6：時系列ARMA、7：時系列ARIMA）学習テーマの項目情報と一緒に追加することも可能です。 - Naivebayesテキスト分類の場合、categoryを指定する必要があります。同じcategoryに複数の異なる項目を登録できます。 - 線形回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があります。trainTextの数値組は半角スペースで区切り、すべての項目のtrainTextには同じ数の数値が含まれている必要があります。最後の項目のtrainTextに実測値を格納します。 - ロジステック回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があります。最後の項目のtrainTextに分類値を格納します。文字列でも可能です。trainTextの数値または文字列の組み合わせは半角スペースで区切り、すべての項目のtrainTextには同じ数の数値または文字列が含まれている必要があります。 - 時系列回帰予測の場合、基本的に1つの項目のtrainTextを登録する必要があります。 trainTextの数値組は半角スペースで区切ります。

01105003 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}
	指定した学習テーマの属性情報（resultKeyを含む）を取得します。

01105006 json yaml	delete	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}
	学習テーマを削除します。

01105007 json yaml	put	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKeys}/status/{statusId}
	学習テーマの状態を設定します。(StatusId=0:新規未承認; 1:承認済; 2:論理削除) 重要: 下記の学習、解析・予測処理を実施する前に必ず「1:承認済」に設定してください。

1.2.学習データの投入

Name	Type	URL	JsonParam	QueryParam
01106004 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/items	[ { "category": "スタンダード・プードル", "trainText": "オリジナルサイズのプードル。もともとリトリーバーとして主人が撃ち落とした鳥を回収するのに使われていた。現在は介助犬としても活躍している。体高45 - 60cm、体重15 - 19kgの中型犬。", "memo": "测试" }, { "category": "ミディアム・プードル", "trainText": "ドッグショーにおけるサイズの過密を解消するために近年指定されたサイズのプードルである。FCIやこれを踏襲するジャパン・ケネルクラブ（JKC）等では認定されているが、ミディアムサイズを指定していない国も多いため、混乱も発生している。体高35 - 45cm、体重8 - 15kgの中型犬。", "memo": "测试" }, { "category": "ミニチュア・プードル", "trainText": "サーカスや家庭で芸を仕込むために、飼いやすいようスタンダードサイズのものを小型化したもの。日本ではあまり馴染みはないが、アメリカなどでは人気が高い。体高28 - 35cm、体重5 - 8kgの小型犬。", "memo": "测试" }, { "category": "トイ・プードル", "trainText": "ミニチュア・プードルを純粋に愛玩犬として飼育するために更に小型化したもの。はじめは奇形がよく現れたが、改良の結果犬質が安定した。体高26 - 28cm、体重3kg前後の小型犬。", "memo": "测试" } ]
	指定した学習テーマの明細項目情報(複数可)を追加します。 - Naivebayesテキスト分類の場合、categoryを指定する必要があります。同じcategoryに複数の異なる項目が登録されることがあります。 - 線形回帰の場合、少なくとも二つの項目のtrainTextを登録する必要があります。trainTextの数値組は半角のスペースで区切り、すべての項目のtrainTextにての数値数は一致しなければなりません。最後の項目のtrainTextに実測値を格納します。 - ロジステック回帰の場合も少なくとも二つの項目のtrainTextを登録する必要があります。最後の項目のtrainTextに分類値を格納し、文字列でも可能です。trainTextの数値又は文字列組は半角のスペースで区切り、すべての項目trainTextにての数値又は文字列数は一致しなければなりません。 - 時系列回帰予測の場合は、基本的に一つの項目のtrainTextを登録する必要があります。 trainTextの数値組は半角のスペースで区切ります。

01106005 json yaml	put	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/items	[ { "itemNo": 1, "category": "スタンダード・プードル", "trainText": "オリジナルサイズのプードル。もともとリトリーバーとして主人が撃ち落とした鳥を回収するのに使われていた。現在は介助犬としても活躍している。体高45 - 60cm、体重15 - 19kgの中型犬。", "memo": "测试" }, { "itemNo": 2, "category": "ミディアム・プードル", "trainText": "ドッグショーにおけるサイズの過密を解消するために近年指定されたサイズのプードルである。FCIやこれを踏襲するジャパン・ケネルクラブ（JKC）等では認定されているが、ミディアムサイズを指定していない国も多いため、混乱も発生している。体高35 - 45cm、体重8 - 15kgの中型犬。", "memo": "测试" }, { "itemNo": 3, "category": "ミニチュア・プードル", "trainText": "サーカスや家庭で芸を仕込むために、飼いやすいようスタンダードサイズのものを小型化したもの。日本ではあまり馴染みはないが、アメリカなどでは人気が高い。体高28 - 35cm、体重5 - 8kgの小型犬。", "memo": "测试" }, { "itemNo": 4, "category": "トイ・プードル", "trainText": "ミニチュア・プードルを純粋に愛玩犬として飼育するために更に小型化したもの。はじめは奇形がよく現れたが、改良の結果犬質が安定した。体高26 - 28cm、体重3kg前後の小型犬。", "memo": "测试" } ]	nullable=false
	指定した学習テーマの明細項目情報（複数可）を更新します。 - Naivebayesテキスト分類の場合、categoryを指定する必要があります。同じcategoryに異なる項目が複数登録されることがあります。 - 線形回帰の場合、少なくとも2つの項目のtrainTextを登録する必要があります。trainTextの数値組は半角のスペースで区切り、すべての項目のtrainTextにての数値数は一致しなければなりません。最後の項目のtrainTextに実測値を格納します。 - ロジスティック回帰の場合も少なくとも2つの項目のtrainTextを登録する必要があります。最後の項目のtrainTextに分類値を格納することができ、文字列でも可能です。trainTextの数値又は文字列組は半角のスペースで区切り、すべての項目trainTextにての数値又は文字列数は一致しなければなりません。 - 時系列回帰予測の場合、基本的に1つの項目のtrainTextを登録する必要があり、trainTextの数値組は半角のスペースで区切ります。

01106001 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/items		category=&order=&offset=&rowcount=&statusId=1
	指定した学習テーマの項目一覧を取得します。

01106002 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/items/csv		category=&order=&offset=&rowcount=&statusId=1
	指定した学習テーマの項目一覧をCSV形式で取得します。

01106003 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/items/{itemNo}
	指定した学習テーマの項目情報を取得します。

01106006 json yaml	delete	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/items/{itemNos}
	指定した学習テーマの項目情報（複数項目番号指定可能）を削除します。

2.学習処理(分類・予測モデル生成)

Name	Type	URL	JsonParam	QueryParam
01105008 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/bayesmodel
	学習項目のtrainTextに予め投入したテキストデータセットによって、単純（ナイーブ）ベイズ分類器(Naive Bayes)のモデルを生成します。学習項目の量によって時間が少しかかる場合があります。

01105010 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/linearmodel		learnCount=1000&learnRate=0.001&interval=100
	学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、線形単回帰又は重回帰のモデルを作成します。学習が完了すると、結果一覧が戻ります。また、最後の決定係数(Score)値が1に近づくほど、良い予測結果が得られます。 (learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔)

01105012 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/logisticmodel	[ { "trainText": "10 20 30 40" }, { "trainText": "11 21 31 41" } ]	testPercent=50&learnCount=1000&learnRate=0.001&interval=100
	学習項目のtrainText(スペース区切りの数値文字列)に予め投入した学習データセットによって、ロジスティック回帰の分類モデルを作成します。ここで、テスト用jsonデータはオプションで投入した学習データセットの一部もテストデータとして使われます。学習の結果一覧が戻り、最後の精度係数(Score)値が1に近づくなら、良い計算精度が得られます。 (testPercent: 投入した学習データセットにおけるテストデータの割合; learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔)

01105014 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/armodel		learnCount=1000&learnRate=0.001&interval=100&pOrder=3
	学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、自己回帰(AR)モデルを作成します。学習の結果一覧が戻り、最後の決定係数(Score)値が1に近づくと、良い予測結果が得られます。 (learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔; pOrder: 自己回帰の回数)

01105016 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/mamodel		learnCount=1000&learnRate=0.001&interval=100&qOrder=3
	学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、移動平均(MA)モデルを作成します。学習の結果一覧が戻り、最後の決定係数(Score)値が1に近づくなら、良い予測結果が得られます。 (learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔; qOrder: 移動平均回帰の回数)

01105018 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/armamodel		learnCount=1000&learnRate=0.001&interval=100&pOrder=3&qOrder=3
	事前に投入された数値データセットを用いて、自己回帰移動平均（ARMA）モデルを作成します。学習の結果が返され、最後の決定係数（Score）の値が1に近づけば、正確な予測結果が得られます。（learnCount：学習回数；learnRate：学習率の増加率；interval：学習誤差の戻り間隔；pOrder：自己回帰次数；qOrder：移動平均回帰次数）

01105020 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{trainKey}/arimamodel		learnCount=1000&learnRate=0.001&interval=100&pOrder=3&dOrder=1&qOrder=3
	学習項目のtrainText(スペース区切りの数値文字列)に予め投入した数値データセットによって、自己回帰和分移動平均(ARIMA)モデルを作成します。学習の結果一覧が戻り、最後の決定係数(Score)値が1に近づけば、良い予測結果が得られます。 (learnCount: 学習回数; learnRate: 学習増分比率; interval: 学習誤差の戻り間隔; pOrder: 自己回帰の回数; dOrder: 差分階数; qOrder: 移動平均回帰の回数)

3.分類・予測結果の取得

Name	Type	URL	JsonParam	QueryParam
01105009 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/bayesvalue	{ "trainText": "win a gift" }
	テキストを投入し、単純ベイズ(Naive Bayes)モデルで解析結果を取得します。学習する量によっては、処理に少し時間がかかることがあります。

01105011 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/linearvalue	[ { "trainText": "10 20 30 40" }, { "trainText": "11 21 31 41" } ]
	引き渡した説明変数を使って作成した線形単回帰または重回帰モデルで予測を行い、その予測結果が返されます。

01105013 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/logisticvalue	[ { "trainText": "6.6 6.8 6.7 6" }, { "trainText": "3 2.8 3 2.9" }, { "trainText": "4.4 4.8 5 4.5" }, { "trainText": "1.4 1.4 1.7 1.5" } ]
	引き渡した説明変数を用いて作成したロジスティック回帰の分類モデルで計算処理を行い、分類の確率結果が返されます。

01105015 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/arvalue		outStartNo=1&outEndNo=10&cycleStartNo=1&cyclePeriod=30
	自己回帰(AR)モデルを使用して予測処理を行い、予測結果が返されます。 (outStartNo: 予測結果の戻り開始順序; outEndNo: 予測結果の戻り終了順序; cycleStartNo: 元の学習データの周期の開始順序; cyclePeriod: 元の学習データの周期)

01105017 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/mavalue		outStartNo=1&outEndNo=10&cycleStartNo=1&cyclePeriod=30
	移動平均(MA)モデルを使用して予測処理を行い、予測結果が返されます。 (outStartNo: 予測結果の戻り開始順序; outEndNo: 予測結果の戻り終了順序; cycleStartNo: 元の学習データの周期の開始順序; cyclePeriod: 元の学習データの周期)

01105019 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/armavalue		outStartNo=1&outEndNo=10&cycleStartNo=0&cyclePeriod=0
	自己回帰移動平均(ARMA)モデルで予測処理を行い、予測結果が返されます。 (outStartNo: 予測結果の戻り開始順番; outEndNo: 予測結果の戻り終了順番; cycleStartNo: 元の学習データの周期開始順番; cyclePeriod: 元の学習データの周期)

01105021 json yaml	get	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/ml/trains/{resultKey}/arimavalue		outStartNo=1&outEndNo=10&cycleStartNo=0&cyclePeriod=0
	自己回帰和分移動平均（ARIMA）モデルで予測処理を行い、予測結果が返されます。（outStartNo：予測結果戻りの開始順番、outEndNo：予測結果戻りの終了順番、cycleStartNo：元の学習データ周期開始順番、cyclePeriod：元の学習データ周期）

統計ツール

Name	Type	URL	JsonParam	QueryParam
01301008 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/tools/statistics	[ { "trainText": "1.4 2.3 3.6 4.1" }, { "trainText": "75.6 85.1 90.9 105.7" } ]	withDeviation=false&withCovariance=false&withPearsons=false&withSpearmans=false&withKendalls=false
	平均、幾何平均、平方平均、中央値、最頻値、最小値、最大値、合計、計数、分散、母分散、標準偏差、総偏差、共分散、総相関係数、偏差マトリックス、共分散マトリックス、ピアソン(pearsons)の相関係数マトリックス、スピアマン(spearmans)の相関係数マトリックス、ケンドール(kendalls)の相関係数マトリックスなどの統計結果が戻されます。線形回帰学習の場合は、説明変数と目的変数の相関係数が0.7以上であることを推奨します。

01301009 json yaml	post	https://www.restgate.net:8443/AcroLearner/v0_1/CltService/tools/tsstat	{ "trainText": "1.4 2.3 3.6 4.1" }	moveInterval=2&convertMode=0&smoothMode=0&diffOrder=3
	平均、幾何平均、平方平均、中央値、最頻値、最小値、最大値、合計、計数、分散、母分散、標準偏差、対数変換、対数差分変換、比率変換、ロジット変換、移動平均、移動中央、ホワイトノイズ、n階差分、自己共分散、自己相関係数、偏自己共分散、偏自己相関係数などの統計結果が戻されます。 (moveInterval:移動平均・中央の計算区間; convertMode:変換モード(0:元データ,1:差分,2:対数,3:対数差分,4:比率,5:ロジット); smoothMode:平滑化モード(0:なし,1:移動平均,2:移動中央); diffOrder:n階差分の階数)

AcroLearner

Machine Learning API for Cloud Service

日本語 中文 English

1.学習準備

2.学習処理(分類・予測モデル生成)

3.分類・予測結果の取得

統計ツール

AcroLearner

Machine Learning API for Cloud Service

日本語 中文 English

1.学習準備

2.学習処理(分類・予測モデル生成)

3.分類・予測結果の取得

統計ツール

日本語中文 English