Я могу сбросить модели sklearn в gridFS:
import gridfs
fs = gridfs.GridFS(db)
gridFS_file = fs.new_file()
joblib.dump(vectorizer, gridFS_file)
Это работает, и я вижу модель, хранящуюся в моем Mongo.
Но я не могу читать напрямую из GridFS:
from bson.objectid import ObjectId
new_file = fs.get(ObjectId("59df36ebe46a520014e0771d"))
vectorizer2 = joblib.load(new_file)
Это длится вечно и никогда не заканчивается. Однако это работает (и быстро заканчивается):
with open('vec.pkl', 'wb') as f:
f.write(new_file.read())
vectorizer3 = joblib.load("vec.pkl")
Что мне не хватает?