Вопросы по теме 'fasta'
Как мне объединить два файла FASTA (один файл с разрывом строки) в Perl?
У меня есть два следующих файла Fasta:
файл1.fasta
>0
GAATAGATGTTTCAAATGTACCAATTTCTTTCGATT
>1
GTTAAGTTATATCAAACTAAATATACATACTATAAA
>2
GGGGCTGTGGATAAAGATAATTCCGGGTTCGAATAC
файл2.qual
>0
40 40 40 40 40 40 40 40 40 40 40 40 40...
2834 просмотров
schedule
18.04.2023
Преобразование FASTQ в FASTA с помощью SED/AWK
У меня есть данные, которые всегда входят в блок из четырех в следующем формате (называемом FASTQ):
@SRR018006.2016 GA2:6:1:20:650 length=36
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN
+SRR018006.2016 GA2:6:1:20:650 length=36...
21769 просмотров
schedule
03.07.2023
Поиск мотива в файле FASTA и возврат строки заголовка для каждой последовательности, содержащей мотив
Ниже приведен код, который у меня есть для поиска файла FASTA, введенного в командной строке, для мотива, предоставленного пользователем. Когда я запускаю его и ввожу мотив, который, как я знаю, находится в файле, он возвращает «Мотив не найден». Я...
2136 просмотров
schedule
09.07.2022
разбор файла fasta с помощью генератора (python)
Я пытаюсь разобрать большой файл fasta и сталкиваюсь с ошибками нехватки памяти. Мы приветствуем некоторые предложения по улучшению обработки данных. В настоящее время программа правильно распечатывает имена, однако частично через файл я получаю...
11766 просмотров
schedule
11.05.2022
Как читать из нескольких файлов FASTA с помощью R?
У меня следующая проблема: у меня есть 10 разных файлов FASTA с тысячами последовательностей внутри каждого файла. Я хотел бы прочитать из каждого файла fasta всю последовательность, а затем (с вставкой) создать один большой файл со всеми...
7242 просмотров
schedule
25.02.2023
цикл извлечения последовательности perl
У меня есть существующая однострочная программа Perl (из лаборатории Эдвардса), которая прекрасно работает для чтения текстового файла (с именем ids.file ), который содержит один столбец идентификаторов, и выполняет поиск во втором специально...
301 просмотров
schedule
03.06.2024
Интерпретация отрывка из руководства
Я пытаюсь запустить некоторое программное обеспечение для биоинформатики (TE Displayer), но оно просто не работает. Я думаю, что проблема может заключаться в том, как программное обеспечение распознает заголовки FASTA. Из документации это сказано....
57 просмотров
schedule
01.07.2023
Biopython SeqIO для Pandas Dataframe
У меня есть файл FASTA, который можно легко проанализировать с помощью SeqIO.parse .
Меня интересует извлечение идентификаторов и длин последовательностей. Я использовал эти строки, чтобы сделать это, но я чувствую, что это слишком тяжело (две...
7407 просмотров
schedule
10.05.2024
Чтение FASTA в фрейм данных и извлечение подпоследовательностей из файла FASTA
У меня есть небольшой fasta файл последовательностей ДНК, который выглядит так:
>NM_000016 700 200 234
ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC
>NM_000775 700 124 236
CTAACCTCTCCCAGTGTGGAACCTCTATCTCATGAGAAAGCTGGGATGAG...
35276 просмотров
schedule
10.03.2022
Разделить элемент списка в python по пользовательскому индексу
У меня есть список под названием:
Фёрстсеквенсетосплит
и он содержит один элемент, который представляет собой последовательность ДНК, скажем:
'АТТТАГКТА'
Я могу легко вернуть длину этого элемента, чтобы пользователь знал, что он имеет...
218 просмотров
schedule
28.07.2022
Неопределенные подпрограммы и основная ошибка в Perl
Я пытаюсь извлечь последовательность ДНК из этого файла FASTA до указанной длины оснований в строке, скажем, 40.
> sample dna (This is a typical fasta header.)
agatggcggcgctgaggggtcttgggggctctaggccggccacctactgg...
16529 просмотров
schedule
15.11.2022
Как извлечь короткую последовательность, используя окно с определенным размером шага?
Приведенный ниже код извлекает короткую последовательность в каждой последовательности с размером окна 4. Как сдвинуть окно на размер шага 2 и извлечь 4 пары оснований?
Пример кода
from Bio import SeqIO
with open("testA_out.fasta","w") as f:...
703 просмотров
schedule
11.04.2023
Подмножество данных последовательности в файле fasta на основе идентификаторов, хранящихся в перечисленных фреймах данных
Я пытаюсь разбить один файл FASTA (содержащий несколько последовательностей) на несколько меньших на основе идентификаторов, которые я храню в списке фреймов данных (и
У меня есть FASTA под названием fastafile вот так:
fastafile <-...
549 просмотров
schedule
18.01.2024
Как получить последовательности FASTA в соответствии с информацией о координатах с помощью Python?
Я хотел бы получить последовательности в соответствии с файлом кровати B.bed, которые содержат информацию о координатах последовательностей, сопоставив координаты с файлом fasta, который является A.fasta, и получить соответствующие последовательности...
1696 просмотров
schedule
09.01.2024
Изменить текстовый файл на основе имени файла, повторить для всех файлов в папке
У меня есть папка с несколькими файлами с именами: something_1001.txt; что-то_1002.txt; что-то_1003.txt; и т.д. Внутри файлов есть какой-то текст. Конечно, каждый файл имеет разный текст, но структура всегда одна и та же: некоторые строки...
345 просмотров
schedule
01.11.2022
Найдите нуклеотидную подпоследовательность в последовательностях fasta
Мне нужно написать функцию с вводом файла FASTA, содержащего последовательности ДНК с неоднозначными символами (IUPAC) . Учитывая имя файла FASTA и однозначную строку ДНК, я хочу записать идентификаторы последовательностей (заголовки '>' ), из...
478 просмотров
schedule
13.05.2023
поиск последовательностей в формате FASTA
Я пытаюсь найти несколько определенных последовательностей в последовательности ДНК в формате FASTA, а затем распечатать их. Для простоты я сделал короткую последовательность строк, чтобы показать свою проблему.
import re
seq = "QPPLSK"...
534 просмотров
schedule
03.11.2022
удалить пустые файлы в подпрограмме в Perl
Я хочу добавить код в следующий скрипт, чтобы удалить эти пустые выходные файлы.
Сценарий преобразует один файл fastq или все файлы fastq в папке в формат fasta, все выходные файлы fasta сохраняют одно и то же имя файла fastq; скрипт предоставляет...
69 просмотров
schedule
10.07.2023
Назначить переменную, если индекс списка выходит за пределы ошибки Python
Как передать строку в переменную, если обнаружена ошибка индекса? Рассмотрим код:
for l1, l2 in zip(open('file1.list'), open ('file2.list')):
a=fasta1[int(l1)]
b=fasta2[int(l2)]
alignments = pairwise2.align.globalxx(a,b)
top_aln =...
741 просмотров
schedule
23.07.2023
Как извлечь и обрезать последовательность fasta с помощью biopython
Привет всем, я новичок в python, который пытается выполнить небольшую задачу, используя biopython. У меня есть два файла: один содержит список идентификаторов и связанный с ним номер. например.
идентификатор.txt
tr_F6LMO6_F6LMO6_9LE 25...
747 просмотров
schedule
16.12.2023