Вопросы по теме 'fasta'

Как мне объединить два файла FASTA (один файл с разрывом строки) в Perl?
У меня есть два следующих файла Fasta: файл1.fasta >0 GAATAGATGTTTCAAATGTACCAATTTCTTTCGATT >1 GTTAAGTTATATCAAACTAAATATACATACTATAAA >2 GGGGCTGTGGATAAAGATAATTCCGGGTTCGAATAC файл2.qual >0 40 40 40 40 40 40 40 40 40 40 40 40 40...
2834 просмотров
schedule 18.04.2023

Преобразование FASTQ в FASTA с помощью SED/AWK
У меня есть данные, которые всегда входят в блок из четырех в следующем формате (называемом FASTQ): @SRR018006.2016 GA2:6:1:20:650 length=36 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN +SRR018006.2016 GA2:6:1:20:650 length=36...
21769 просмотров
schedule 03.07.2023

Поиск мотива в файле FASTA и возврат строки заголовка для каждой последовательности, содержащей мотив
Ниже приведен код, который у меня есть для поиска файла FASTA, введенного в командной строке, для мотива, предоставленного пользователем. Когда я запускаю его и ввожу мотив, который, как я знаю, находится в файле, он возвращает «Мотив не найден». Я...
2136 просмотров
schedule 09.07.2022

разбор файла fasta с помощью генератора (python)
Я пытаюсь разобрать большой файл fasta и сталкиваюсь с ошибками нехватки памяти. Мы приветствуем некоторые предложения по улучшению обработки данных. В настоящее время программа правильно распечатывает имена, однако частично через файл я получаю...
11766 просмотров
schedule 11.05.2022

Как читать из нескольких файлов FASTA с помощью R?
У меня следующая проблема: у меня есть 10 разных файлов FASTA с тысячами последовательностей внутри каждого файла. Я хотел бы прочитать из каждого файла fasta всю последовательность, а затем (с вставкой) создать один большой файл со всеми...
7242 просмотров
schedule 25.02.2023

цикл извлечения последовательности perl
У меня есть существующая однострочная программа Perl (из лаборатории Эдвардса), которая прекрасно работает для чтения текстового файла (с именем ids.file ), который содержит один столбец идентификаторов, и выполняет поиск во втором специально...
301 просмотров
schedule 03.06.2024

Интерпретация отрывка из руководства
Я пытаюсь запустить некоторое программное обеспечение для биоинформатики (TE Displayer), но оно просто не работает. Я думаю, что проблема может заключаться в том, как программное обеспечение распознает заголовки FASTA. Из документации это сказано....
57 просмотров
schedule 01.07.2023

Biopython SeqIO для Pandas Dataframe
У меня есть файл FASTA, который можно легко проанализировать с помощью SeqIO.parse . Меня интересует извлечение идентификаторов и длин последовательностей. Я использовал эти строки, чтобы сделать это, но я чувствую, что это слишком тяжело (две...
7407 просмотров
schedule 10.05.2024

Чтение FASTA в фрейм данных и извлечение подпоследовательностей из файла FASTA
У меня есть небольшой fasta файл последовательностей ДНК, который выглядит так: >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236 CTAACCTCTCCCAGTGTGGAACCTCTATCTCATGAGAAAGCTGGGATGAG...
35276 просмотров
schedule 10.03.2022

Разделить элемент списка в python по пользовательскому индексу
У меня есть список под названием: Фёрстсеквенсетосплит и он содержит один элемент, который представляет собой последовательность ДНК, скажем: 'АТТТАГКТА' Я могу легко вернуть длину этого элемента, чтобы пользователь знал, что он имеет...
218 просмотров
schedule 28.07.2022

Неопределенные подпрограммы и основная ошибка в Perl
Я пытаюсь извлечь последовательность ДНК из этого файла FASTA до указанной длины оснований в строке, скажем, 40. > sample dna (This is a typical fasta header.) agatggcggcgctgaggggtcttgggggctctaggccggccacctactgg...
16529 просмотров
schedule 15.11.2022

Как извлечь короткую последовательность, используя окно с определенным размером шага?
Приведенный ниже код извлекает короткую последовательность в каждой последовательности с размером окна 4. Как сдвинуть окно на размер шага 2 и извлечь 4 пары оснований? Пример кода from Bio import SeqIO with open("testA_out.fasta","w") as f:...
703 просмотров
schedule 11.04.2023

Подмножество данных последовательности в файле fasta на основе идентификаторов, хранящихся в перечисленных фреймах данных
Я пытаюсь разбить один файл FASTA (содержащий несколько последовательностей) на несколько меньших на основе идентификаторов, которые я храню в списке фреймов данных (и У меня есть FASTA под названием fastafile вот так: fastafile <-...
549 просмотров
schedule 18.01.2024

Как получить последовательности FASTA в соответствии с информацией о координатах с помощью Python?
Я хотел бы получить последовательности в соответствии с файлом кровати B.bed, которые содержат информацию о координатах последовательностей, сопоставив координаты с файлом fasta, который является A.fasta, и получить соответствующие последовательности...
1696 просмотров

Изменить текстовый файл на основе имени файла, повторить для всех файлов в папке
У меня есть папка с несколькими файлами с именами: something_1001.txt; что-то_1002.txt; что-то_1003.txt; и т.д. Внутри файлов есть какой-то текст. Конечно, каждый файл имеет разный текст, но структура всегда одна и та же: некоторые строки...
345 просмотров
schedule 01.11.2022

Найдите нуклеотидную подпоследовательность в последовательностях fasta
Мне нужно написать функцию с вводом файла FASTA, содержащего последовательности ДНК с неоднозначными символами (IUPAC) . Учитывая имя файла FASTA и однозначную строку ДНК, я хочу записать идентификаторы последовательностей (заголовки '>' ), из...
478 просмотров
schedule 13.05.2023

поиск последовательностей в формате FASTA
Я пытаюсь найти несколько определенных последовательностей в последовательности ДНК в формате FASTA, а затем распечатать их. Для простоты я сделал короткую последовательность строк, чтобы показать свою проблему. import re seq = "QPPLSK"...
534 просмотров
schedule 03.11.2022

удалить пустые файлы в подпрограмме в Perl
Я хочу добавить код в следующий скрипт, чтобы удалить эти пустые выходные файлы. Сценарий преобразует один файл fastq или все файлы fastq в папке в формат fasta, все выходные файлы fasta сохраняют одно и то же имя файла fastq; скрипт предоставляет...
69 просмотров
schedule 10.07.2023

Назначить переменную, если индекс списка выходит за пределы ошибки Python
Как передать строку в переменную, если обнаружена ошибка индекса? Рассмотрим код: for l1, l2 in zip(open('file1.list'), open ('file2.list')): a=fasta1[int(l1)] b=fasta2[int(l2)] alignments = pairwise2.align.globalxx(a,b) top_aln =...
741 просмотров

Как извлечь и обрезать последовательность fasta с помощью biopython
Привет всем, я новичок в python, который пытается выполнить небольшую задачу, используя biopython. У меня есть два файла: один содержит список идентификаторов и связанный с ним номер. например. идентификатор.txt tr_F6LMO6_F6LMO6_9LE 25...
747 просмотров
schedule 16.12.2023