Объединение классов извлечения пространственных объектов в scikit-learn

Я использую sklearn.pipeline.Pipeline для объединения экстракторов признаков и классификатора. Есть ли способ объединить несколько классов выбора функций (например, из sklearn.feature_selection.text) параллельно и объединить их выходные данные?

Мой код сейчас выглядит следующим образом:

pipeline = Pipeline([
    ('vect', CountVectorizer()),
    ('tfidf', TfidfTransformer()),
    ('clf', SGDClassifier())])

Это приводит к следующему:

vect -> tfidf -> clf

Я хочу указать конвейер, который выглядит следующим образом:

vect1 -> tfidf1 \
                 -> clf
vect2 -> tfidf2 /

person Daniel    schedule 04.10.2012    source источник


Ответы (1)


Это было недавно реализовано в главной ветке scikit-learn под именем FeatureUnion:

http://scikit-learn.org/dev/modules/pipeline.html#feature-union < / а>

person ogrisel    schedule 04.10.2012
comment
Ага, я видел это на blog.kaggle.com/2012/09 / 26 / impermium-andreas-blog после того, как я задал вопрос - person Daniel; 04.10.2012
comment
Круто, первый пользователь :) Дайте знать, если вам это пригодится! - person Andreas Mueller; 05.10.2012