Несоответствие размеров полиномиального NB

Я получил ошибку несоответствия размера для кода ниже:

from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(FinalList)
print(vectorizer.get_feature_names())
print(X.shape)
data["sentiment"]=data["sentiment"].map(dict(positive=1, negative=0))
data.head(5)

y= data["sentiment"]
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=2020)
clf = MultinomialNB()
clf.fit(x_train, y_train)
y_head_train = clf.predict(x_train)
y_head_test=clf.predict(x_test)
print(accuracy_score(y_head_train, y_train))
print(accuracy_score(y_head_test, y_test))


Newlist=Tokenization(post_df['text'])
Newlistlist = list(filter(None, Newlist))
vectorizer = TfidfVectorizer(vocabulary=vectorizer.vocabulary_)
NewText = vectorizer.fit_transform(Newlist)
print(vectorizer.get_feature_names())
print(NewText.shape)
y_NewText = clf.predict(NewText)

Проблема, с которой я столкнулся, такая же, как и ниже, как я могу исправить ошибку несоответствия размеров..? Спасибо. scikit-learn ValueError: несоответствие размеров

prediction dimension mismatch

ccc4 22.03.2021 источник

Несоответствие размеров полиномиального NB

Похожие вопросы