AWS Sagemaker: AttributeError: модуль pandas не имеет атрибута core

Позвольте мне префикс этого, сказав, что я новичок в тензорном потоке и даже новичок в AWS Sagemaker.

У меня есть код tensorflow / keras, который я написал и протестировал на локальном докерированном ноутбуке Jupyter, и он отлично работает. В нем я импортирую файл csv в качестве ввода.

Я использую Sagemaker для запуска экземпляра ноутбука jupyter с помощью conda_tensorflow_p36. Я изменил код pandas.read_csv (), чтобы он указывал на мой входной файл, который теперь размещен в корзине S3.

Итак, я изменил эту строку кода с

import pandas as pd

data = pd.read_csv("/input.csv", encoding="latin1")

к этому

import pandas as pd

data = pd.read_csv("https://s3.amazonaws.com/my-sagemaker-bucket/input.csv", encoding="latin1")

и я получаю эту ошибку

AttributeError: module 'pandas' has no attribute 'core'

Я не уверен, что это проблема с разрешениями. Я читал это, пока я назову свое ведро строкой «sagemaker», у него должен быть доступ к нему.


person kane    schedule 23.10.2018    source источник


Ответы (1)


Взять наши данные из S3, например:

import boto3
import io
import pandas as pd


# Set below parameters
bucket = '<bucket name>'
key = 'data/training/iris.csv'
endpointName = 'decision-trees'

# Pull our data from S3
s3 = boto3.client('s3')
f = s3.get_object(Bucket=bucket, Key=key)

# Make a dataframe
shape = pd.read_csv(io.BytesIO(f['Body'].read()), header=None)
person myhaspldeep    schedule 23.10.2018
comment
Вот и все! Спасибо! - person kane; 24.10.2018