Сценарий:
Я импортировал данные с сервера SQl в HDFS. Данные хранятся в каталоге HDFS в нескольких файлах как:
часть-m-00000
часть-m-00001
часть-m-00002
часть-m-00003
Вопрос:
Мой вопрос заключается в том, что при чтении этих сохраненных данных из каталога HDFS мы должны прочитать весь файл (part-m-00000,01,02,03
) или только part-m-00000
. Потому что, когда я прочитал эти данные, я обнаружил, что данные внутри HDFS немного отсутствуют. Так бывает или я что-то упустил?