AcroLearner

Machine Learning API for Cloud Service

中文  日本語  English

机器学习API使用步骤概要
AcroLearner当前提供自然语言处理的朴素贝叶斯分类器(Naive Bayes)、线性回归预测、逻辑回归分类和时间序列预测的机器学习RESTful API。
1.学习准备
1.1.定义学习主题: 设定学习类型等基础信息,可以一起附带学习项目,发行学习处理用的trainKey和获取结果用的resultKey
1.2.投入学习数据: 根据学习主题,追加单独或多个学习项目数据。如果有大量项目追加请与我联系。
2.学习处理: 输入trainKey,根据预先设定的学习主题和学习项目数据,生成对应的分类或预测模型。
   - 自然语言分类场合,按下文本分类学习按钮生成朴素贝叶斯分类器(Naive Bayes)的分类模型。
   * 现在仅进行日本语的词素解析,对于字母类语言也可以部分对应。
   - 数值的回归分析预测的场合,按下线性回归学习按钮生成对应的回归预测模型。
   - 数值的回归分类解析的场合,按下逻辑回归学习按钮生成相应的回归分类模型。
   - 时间序列回归预测的场合,按下AR/MA/ARMA/ARIMA模型的学习按钮生成相应的回归预测模型。
3.取得分类预测结果: 输入resultKey,获取文本或数值分类、数值预测结果。
   - 自然语言分类场合,在trainText输入源文本,按下文本分类解析按钮,执行解析处理,取得朴素贝叶斯分类器(Naive Bayes)解析的分类结果。
   - 数值的回归分析预测的场合,在trainText输入说明变量,按下线性回归预测按钮获取回归预测结果。
   - 在进行数值的回归分类解析时,在trainText输入说明变量,按下逻辑回归分类按钮即可获取回归分类概率结果。
   - 时间序列回归预测的场合,输入适当参数,按下AR/MA/ARMA/ARIMA模型的预测按钮根据预先生成的预测模型取得预测结果。
**AR: Autoregressive; MA: Moving average; ARMA: Autoregressive moving average; ARIMA: Autoregressive integrated moving average
**也准备了统计计算工具API。
**其他的信息取得、更新、删除等API也请自由尝试。
**点击按钮下面的链接,可以打开相应I/F帮助页面(html)和OpenAPI规范(json/yaml)。

1.学习准备

   1.1.定义学习主题
NameTypeURLJsonParamQueryParam

01105004
json  yaml
post
追加机器学习的主题。
(language=0:English, 1:Japanese, 2:Other;  partOfSpeech: 名词,形容词,动词,副词,连体词,助词,助动词,接头词,接续词,记号 等,仅对日文的文本分类有效)
(trainType=1:Naivebayes文本分类, 2:线性回归, 3:逻辑回归, 4:时间序列AR, 5:时间序列MA, 6:时间序列ARMA, 7:时间序列ARIMA)
可以同时登录学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。
若成功返回,请记录下返回的trainKeyresultKey

01105005
json  yaml
put
更新现有的学习主题。
(language=0:English, 1:Japanese, 2:Other;  partOfSpeech: 名词,形容词,动词,副词,连体词,助词,助动词,接头词,接续词,记号 等,仅对日文的文本分类有效)
(trainType=1:Naivebayes文本分类, 2:线性回归, 3:逻辑回归, 4:时间序列AR, 5:时间序列MA, 6:时间序列ARMA, 7:时间序列ARIMA)
可以同时登录学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。

01105003
json  yaml
get
取得指定的学习主题属性信息(包括resultKey)。

01105006
json  yaml
delete
删除现有的学习主题。

01105007
json  yaml
put
设定学习主题的状态。(StatusId=0:未生效; 1:有效; 2:伦理删除)
重要: 在执行下面的学习、解析或预测处理之前,需要预先在这里设定为《1:有效》。

   1.2.投入学习数据
NameTypeURLJsonParamQueryParam

01106004
json  yaml
post
追加指定学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。

01106005
json  yaml
put
更新指定学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。

01106001
json  yaml
get
取得指定学习主题的项目一览。

01106002
json  yaml
get
取得指定学习主题的项目一览CSV。

01106003
json  yaml
get
取得指定学习主题的项目信息。

01106006
json  yaml
delete
删除指定学习主题的项目信息(可以指定多个项目编号)。

2.学习处理(生成分类预测模型)

NameTypeURLJsonParamQueryParam

01105008
json  yaml
get
根据学习项目里预先导入的学习文本数据集,生成Naive Bayes(朴素贝叶斯)分类模型。根据学习项目的数量,有些场合的处理时间或许稍长。

01105010
json  yaml
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的线性单回归或重回归模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔)

01105012
json  yaml
post
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的逻辑回归分类模型。这里的测试用json输入是可选项,已经投入的学习数据集的一部分可以作为测试数据使用。
返回的学习结果一览的最后一行的精度系数(Score)值如果接近于1,将会得到较好的计算精度。
(testPercent: 已经投入的学习数据集中测试用数据的比例 learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔)

01105014
json  yaml
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的自回归AR模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; pOrder: 自回归的回数)

01105016
json  yaml
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的移动平均MA模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; qOrder: 移动平均回数)

01105018
json  yaml
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的自回归移动平均ARMA模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; pOrder: 自回归的回数; qOrder: 移动平均回数)

01105020
json  yaml
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的自回归差分移动平均ARIMA模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; pOrder: 自回归的回数; dOrder: 差分阶数; qOrder: 移动平均回数)

3.取得分类预测结果

NameTypeURLJsonParamQueryParam

01105009
json  yaml
post
赋予文本信息,取得Naive Bayes(朴素贝叶斯)分类模型的解析结果。根据学习项目的数量,有些场合的处理时间或许稍长。

01105011
json  yaml
post
根据生成的线性单回归或重回归模型执行预测处理,返回预测结果。

01105013
json  yaml
post
根据生成的逻辑回归模型执行分类处理,返回分类概率结果。

01105015
json  yaml
get
根据生成的自回归AR模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

01105017
json  yaml
get
根据生成的移动平均MA模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

01105019
json  yaml
get
根据生成的自回归移动平均ARMA模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

01105021
json  yaml
get
根据生成的自回归差分移动平均ARIMA模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

统计计算工具

NameTypeURLJsonParamQueryParam

01301008
json  yaml
post
返回平均、几何平均、平方平均、中间值、最频值、最小值、最大值、合计、计数、分散、母分散、标准偏差、总偏差、共分散、总相关系数、偏差矩阵、共分散矩阵、pearsons相关矩阵、spearmans相关矩阵、kendalls相关矩阵等统计结果。如果要进行线性回归学习,建议说明变量和目的变量的相关系数要达到0.7以上。

01301009
json  yaml
post
返回平均、几何平均、平方平均、中间值、最频值、最小值、最大值、合计、计数、分散、母分散、标准偏差、对数转换、对数差分转换、比率转换、Logit转换、移动平均、移动中央、白色噪音、n阶差分、自己共分散、自己相关系数、偏自己共分散、偏自己相关系数的统计值。
(moveInterval:移动平均、中央的计算区间; convertMode:转换模式(0:original,1:Diff,2:Log,3:LogDiff,4:Ratio,5:Logit); smoothMode:平滑模式(0:no,1:MoveAverage,2:MoveMedian); diffOrder:差分阶数)