Мои попытки построить DAG или граф правил из конвейера RNA-seq с использованием snakemake приводят к сообщению об ошибке от graphviz. 'Ошибка:: синтаксическая ошибка в строке 1 рядом с' Файл '.
Ошибку можно исправить, закомментировав две команды печати без видимых синтаксических ошибок. Я пробовал преобразовать скрипты из UTF-8 в Ascii в Notepad ++. Похоже, что у Graphviz есть проблемы с этими двумя конкретными операторами печати, потому что в сценариях конвейера есть другие операторы печати. Несмотря на то, что ошибку легко исправить, она все равно раздражает, потому что я хотел бы, чтобы коллеги могли без проблем строить эти диаграммы для своих публикаций, а операторы печати информируют их о том, что происходит в рабочем процессе. Мой конвейер состоит из файла змеи и нескольких файлов правил, а также файла конфигурации. Если строка, вызывающая нарушение, закомментирована в файле Snakefile, то graphviz столкнется с проблемой с другой строкой в сценарии правила.
#######Snakefile
!/usr/bin/env Python
import os
import glob
import re
from os.path import join
import argparse
from collections import defaultdict
import fastq2json
from itertools import chain, combinations
import shutil
from shutil import copyfile
#Testing for sequence file extension
directory = "."
MainDir = os.path.abspath(directory) + "/"
## build the dictionary with full path for each for sequence files
fastq=glob.glob(MainDir+'*/*'+'R[12]'+'**fastq.gz')
if len(fastq) > 0 :
print('Sequence file extensions have fastq')
os.system('scripts/Move.sh')
fastq2json.fastq_json(MainDir)
else :
print('File extensions are good')
######Rule File
if not config["GroupdFile"]:
os.system('Rscript scripts/Table.R')
print('No GroupdFile provided')
змейка --forceall --rulegraph | dot -Tpdf> dag.pdf должен привести к выводу pdf, показывающему рабочий процесс snakemake, но если две строки не закомментированы, это приведет к ошибке:: синтаксическая ошибка в строке 1 рядом с