Сравнение производительности больших двоичных объектов Azure и таблиц Azure

У меня есть около 300 миллионов текстовых файлов размером от 50 КБ до 100 КБ, которые мне нужно прочитать и разместить на веб-странице.

Примечания:

В таблице Azure мне нужно будет разделить некоторые текстовые файлы, чтобы убедиться, что они не превышают максимальный размер 64 КБ на столбец.

В Azure Blob у меня не было бы проблем с разделением, но мне нужно было бы сохранить ссылку на них в таблице Azure SQL/Azure.

Итак, интро готово! Теперь в моем веб-приложении Azure:

  1. Будет ли быстрее читать текстовый файл из BLOB-объекта Azure или из таблицы Azure?
  2. Сможет ли Azure Table обрабатывать больше запросов?

person Fernando Silva    schedule 14.09.2015    source источник
comment
Я провел небольшое тестирование и, к моему удивлению, чтение файла из BLOB-объекта происходит быстрее, чем из таблицы. Кроме того, я согласен, для поиска я планирую использовать Azure Search.   -  person Fernando Silva    schedule 14.09.2015


Ответы (2)


Я согласен с Андреем М. Лучшим решением является хранилище BLOB-объектов с табличным сервисом или даже базой данных sql для хранения ссылок.

Еще одна вещь: если вы планируете искать контент в этом файле, ни служба таблиц, ни BLOB-объекты для этого не подойдут. Если это так, я рекомендую вам настроить виртуальную машину с эластичным поиском / solr и проиндексировать это содержимое.

PS: есть также поиск Azure, для этого вы тоже можете попробовать.

person Thiago Custodio    schedule 14.09.2015
comment
Теперь можно искать в больших двоичных объектах. docs.microsoft.com/en- us/azure/search/ Индексирование документов в хранилище BLOB-объектов Azure с помощью поиска Azure Индексатор BLOB-объектов может извлекать текст из документов следующих форматов: PDF Форматы Microsoft Office: DOCX/DOC, XLSX/XLS, PPTX/PPT, MSG ( сообщения электронной почты Outlook) HTML XML ZIP EML Обычные текстовые файлы JSON (см. раздел Функция предварительного просмотра индексирования больших двоичных объектов JSON) CSV (см. раздел Функция предварительного просмотра индексирования больших двоичных объектов CSV) - person Marco Staffoli; 23.05.2017

Хранилище BLOB-объектов лучше, чем хранилище таблиц, если вы хотите работать с файлами. Я определенно не хотел бы иметь дело с фрагментами файлов в таблице. Если вам нужно сохранить ссылки на ваши большие двоичные объекты, как насчет объединения двух вариантов и использования хранилища таблиц для ссылок? Я думаю, что это было бы лучшим с точки зрения производительности :).

person Andrei    schedule 14.09.2015
comment
Точечные запросы (с ключом раздела и ключом строки) выполняются очень быстро при использовании табличного хранилища. Вам придется провести перф-тестирование самостоятельно, но этот факт делает ответ Андрея еще более верным. - person Emily Gerner; 14.09.2015
comment
Даже работая со строками, blob работает быстрее. Я тестировал. Получить 2 КБ из файла в большом двоичном объекте или из табличного хранилища? Блоб выигрывает 9 из 10 - person Fernando Silva; 16.09.2015