Ho una vasta collezione di file di traccia di sequenza che sono in formato di file SCF (file binari che oltre alla stringa di basi di DNA contengono anche l'elettroferogramma del campione e informazioni sulla qualità della base chiamate).
Ho una pipeline BioPython esistente che accetta file in formato AB1 (pdf), quindi devo convertire i miei file SCF in file AB1.
Ho trovato una domanda su Biostars che chiede l'opposto: conversione da SCF a AB1.
La risposta accettata era usare convert_trace
dal pacchetto Staden.
./convert_trace -out_format scf < trace.ab1 > trace.scf
Quindi ho provato il opposto:
./convert_trace -out_format abi < trace.scf > trace.ab1
Questo ha effettivamente prodotto un file con * .ab1
estensione, ma dopo averlo importato nella mia pipeline BioPython, ho ricevuto l'errore
Il file dovrebbe iniziare ABIF, non '\ xaeZ TR '
Quindi a quanto pare, convert_trace
ha convertito i miei file in formato ZTR, anche se ho specificato -out_format abi
.
Una lettura più attenta del manuale afferma che [convert_exe] può scrivere nei formati CTF, EXP, PLN, SCF e ZTR.
(quindi in effetti niente ABI), ma confonde io perché ABI
è ancora un formato di output valido.
Quindi, la mia domanda è: come converto i file SCF in file ABI?