Экспорт модели распределения в RapidMiner

У меня есть пример, установленный в Rapid Miner. Он имеет 2 столбца. Например

colA  colB 
a     1
a     2
b     3
b     2

=====

Я использовал наивный Байес. Это дает вероятность для каждого из colB для colA в таблице распределения. например, P(2) = .5

I need that distribution table output. 
write model, excel csv, write does not help.

Что я должен делать ? Заранее спасибо.


person Sazzad    schedule 18.01.2016    source источник


Ответы (2)


Самым простым решением будет просто отметить таблицу мышью (также работает Strg+A) и использовать копирование и вставку.

К сожалению, это работает только вручную, если вам приходится очень часто экспортировать данные, следующим лучшим шагом будет написать для него собственный оператор (что на самом деле довольно просто и требует только базовых навыков Java): http://docs.rapidminer.com/developers/

person David    schedule 18.01.2016
comment
спасибо, Дэвид, но вы уверены, что это невозможно в Rapid Miner? - person Sazzad; 18.01.2016
comment
Да, я совершенно уверен. Не каждый тип результатов можно легко экспортировать. - person David; 18.01.2016

Да, ты можешь. Если вы установите расширение Reporting из магазина (это бесплатно), вы сможете экспортировать таблицу распределения, графическое представление или текстовое представление.
Вот пример процесса.

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<process version="7.0.000">
  <context>
    <input/>
    <output/>
    <macros/>
  </context>
  <operator activated="true" class="process" compatibility="6.0.002" expanded="true" name="Process">
    <process expanded="true">
      <operator activated="true" class="reporting:generate_report" compatibility="5.3.000" expanded="true" height="68" name="Generate Report" width="90" x="45" y="34">
        <parameter key="report_name" value="myReport"/>
      </operator>
      <operator activated="true" class="retrieve" compatibility="7.0.000" expanded="true" height="68" name="Golf" width="90" x="112" y="85">
        <parameter key="repository_entry" value="//Samples/data/Golf"/>
      </operator>
      <operator activated="true" class="retrieve" compatibility="7.0.000" expanded="true" height="68" name="Golf-Testset" width="90" x="179" y="210">
        <parameter key="repository_entry" value="//Samples/data/Golf-Testset"/>
      </operator>
      <operator activated="true" class="naive_bayes" compatibility="7.0.000" expanded="true" height="82" name="Naive Bayes" width="90" x="246" y="34"/>
      <operator activated="true" class="reporting:report" compatibility="5.3.000" expanded="true" height="68" name="Report" width="90" x="380" y="34">
        <parameter key="report_name" value="myReport"/>
        <parameter key="report_item_header" value="Distribution Table"/>
        <parameter key="specified" value="true"/>
        <parameter key="reportable_type" value="Distribution Model"/>
        <parameter key="renderer_name" value="Distribution Table"/>
        <list key="parameters">
          <parameter key="min_row" value="1"/>
          <parameter key="max_row" value="2147483647"/>
          <parameter key="min_column" value="1"/>
          <parameter key="max_column" value="2147483647"/>
          <parameter key="sort_column" value="2147483647"/>
          <parameter key="sort_decreasing" value="false"/>
        </list>
      </operator>
      <operator activated="true" class="apply_model" compatibility="7.0.000" expanded="true" height="82" name="Apply Model" width="90" x="514" y="120">
        <list key="application_parameters"/>
      </operator>
      <connect from_op="Golf" from_port="output" to_op="Naive Bayes" to_port="training set"/>
      <connect from_op="Golf-Testset" from_port="output" to_op="Apply Model" to_port="unlabelled data"/>
      <connect from_op="Naive Bayes" from_port="model" to_op="Report" to_port="reportable in"/>
      <connect from_op="Report" from_port="reportable out" to_op="Apply Model" to_port="model"/>
      <connect from_op="Apply Model" from_port="labelled data" to_port="result 1"/>
      <portSpacing port="source_input 1" spacing="0"/>
      <portSpacing port="sink_result 1" spacing="90"/>
      <portSpacing port="sink_result 2" spacing="18"/>
    </process>
  </operator>
</process>
person John Heath - RapidMiner China    schedule 23.02.2016