Публикации по теме 'chunking'


Laravel — результат фрагментации
Когда вы имеете дело с тысячей данных, метод chunk() является хорошей практикой, позволяющей вам быстрее получать записи и уменьшать отставание функции в приложении. Сегодня мы покажем вам, как использовать функцию chunk() при извлечении данных. В приведенном ниже примере показано, что если у вас есть тысячи записей о пользователях, как получить список параметров с помощью chunk() . Пример:

Вопросы по теме 'chunking'

Разделение / потоковая передача WCF - сделайте его прозрачным для клиента
При разработке службы WCF я столкнулся с проблемой передачи больших данных в качестве параметров метода (> 4 Мб необработанного размера, не считая накладных расходов на передачу / сообщение). Решением этой проблемы является использование фрагментов...
930 просмотров
schedule 21.08.2022

NLTK Разделение на фрагменты и обход дерева результатов
Я использую NLTK RegexpParser для извлечения групп существительных и групп глаголов из помеченных токенов. Как мне пройтись по полученному дереву, чтобы найти только фрагменты, которые являются NP или V группами? from nltk.chunk import...
6799 просмотров
schedule 09.01.2023

Twisted Python: максимальный размер пакета? Промывочная розетка?
Я реализую клиент-серверное решение на основе Twisted для серверной части и, например. и телефон Android для клиентской стороны. Поскольку эмулятор Andoird не принимает TCP-пакеты больше 1500 байт (или меньше?), мне нужно иметь возможность разбивать...
2308 просмотров
schedule 04.12.2022

org.annolab.tt4j — Поиск учебника по чанкингу
Я пытаюсь понять, как использовать TreeTagger http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/ завернутый tt4j http://recart.github.io/tt4j/ фрагментировать некоторый текст. Я не могу найти учебник. Спасибо за помощь
605 просмотров
schedule 18.07.2022

Как реализовать ленивый перечислитель фрагментов потока?
Я пытаюсь разбить поток байтов на куски увеличивающегося размера. Исходный поток содержит неизвестное количество байтов и дорого читается. На выходе перечислителя должны быть массивы байтов увеличивающегося размера, начиная с 8 КБ до 1 МБ. Это...
1310 просмотров
schedule 02.09.2023

Разделение текста на фрагменты по 5 строк, а затем работа над каждым
Я пытаюсь написать программу, которая возьмет текстовый файл, организованный в 5 блоков строк, и разрежет весь текст на эти блоки для отдельной работы. На данный момент я пытаюсь использовать: text = open(filename).readlines() chunk5 =...
144 просмотров
schedule 24.02.2024

Всегда ли в Clojure ленивые последовательности разбиваются на части?
У меня создалось впечатление, что ленивые последовательности всегда разбиваются на части. => (take 1 (map #(do (print \.) %) (range))) (................................0) Как и ожидалось, печатаются 32 точки, потому что ленивый seq,...
2520 просмотров

лень не работает должным образом
(defn seq-trial [] (map #(do (println "hello " %) (inc %)) (range 10))) (take 3 (seq-trial)) Приведенный выше фрагмент кода при оценке распечатывает следующее: (привет 0 привет 1 привет 2 привет 3 привет 4 привет 5 привет 6 привет 7...
115 просмотров

Как эффективно прочитать фрагмент байтов заданного диапазона из большого зашифрованного файла в java?
У меня есть большой зашифрованный файл (10 ГБ+) на сервере. Мне нужно передать расшифрованный файл клиенту небольшими порциями. Когда клиент делает запрос на кусок байтов (скажем, от 18 до 45), я должен получить произвольный доступ к файлу,...
1117 просмотров

Извлечение отношений с помощью фрагментации с использованием NLTK
Я пытаюсь понять, как использовать каскадный блокировщик NLTK в соответствии с главой 7 книги NLTK . К сожалению, я сталкиваюсь с несколькими проблемами при выполнении нетривиальных мер фрагментации. Начнем с этой фразы: "adventure movies...
2019 просмотров

Fineuploader Chunking - может загрузить несколько, но потом не получается
Я использую FineUploader для многих версий, и мне ОЧЕНЬ нравится то, что вы, ребята, сделали. Это касается v5.3.0 с использованием оболочки jquery. Проект, над которым я сейчас работаю, должен разбивать файлы на части (некоторые из них имеют...
973 просмотров

Чтение больших файлов и загрузка фрагментов с помощью Dropbox Api в С#
У меня есть большие резервные копии sql, и я хочу сохранить их в Dropbox, но я просто хочу отправить копию в Dropbox и переместить файл на внешний жесткий диск из-за места на жестком диске моего сервера. Я пытаюсь использовать загрузку фрагментов...
1654 просмотров
schedule 22.06.2023

Загрузка файлов в Fine-Uploader, невозможно объединить/объединить фрагменты после успешной загрузки
Итак, я пытался заставить загрузку Chunked работать для проекта, над которым я работал, я довольно новичок в вещах, на самом деле для всех интенсивных целей вы можете считать меня полным нубом, который учит себя, я используя шаблон ручной загрузки с...
1409 просмотров

Ошибка значения NP-chunker (Python nltk)
Я создаю конвейер NLP на основе книги Python NLTK (глава 7). Первый сегмент кодов корректно выполняет предварительную обработку данных, но я не могу запустить его вывод через свой NP-чанкер: import nltk, re, pprint #Import Data data = 'This is...
794 просмотров
schedule 08.01.2024

Нарезка файла в JavaScript приводит к пустому двоичному объекту
Я реализую загрузчик фрагментированных файлов на основе браузера. Чтобы открыть файл, я использую <input type="file" id="fileSelector" /> и этот фрагмент кода (упрощенный): $('#fileSelector').on('change', function () { _file =...
713 просмотров
schedule 19.07.2022

Заполнение недопустимо и не может быть удалено, исключение и длина данных для расшифровки недействительны. Рейндал
Мое требование, как показано ниже. Шаг 1) Я хочу записать данные размером 101 МБ в локальную файловую систему, зашифровав их фрагментами по 10-10 МБ. Шаг 2) Во время расшифровки я хочу получить 10-10 МБ данных из файла и хочу расшифровать и...
565 просмотров
schedule 13.04.2022

Разделение предложений со словом «но» с помощью RegEx
Я пытаюсь разбить предложения на куски, используя RegEx в слове «но» (или любых других координирующих словах союза). Это не работает... sentence = nltk.pos_tag(word_tokenize("There are no large collections present but there is spinal canal...
781 просмотров
schedule 20.12.2023

Как разделить ввод сценария оболочки по времени, а не по размеру?
В сценарии bash я использую шаблон «много производителей — один потребитель». Производители — это фоновые процессы, записывающие строки в fifo (через GNU Parallel). Потребитель читает все строки из fifo, затем сортирует, фильтрует и выводит...
293 просмотров
schedule 04.07.2022

ошибка памяти при чтении csv большого размера в pandas
Память моего ноутбука составляет 8 гигабайт, и я пытался прочитать и обработать большой CSV-файл, и у меня возникли проблемы с памятью. Я нашел решение, которое использует chunksize для обработки файла по частям, но, по-видимому, когда uisng...
262 просмотров
schedule 19.07.2022

Неожиданное поведение при фрагментировании нескольких файлов netcdf в xarray / dask
Я работаю с набором из 468 файлов netcdf общим размером до 12 ГБ. Каждый файл имеет только один глобальный снимок геофизической переменной, т.е. для каждого файла форма данных (1, 1801, 3600) соответствует размерам ('time', 'latitude',...
265 просмотров
schedule 05.09.2023