Domanda:
Come posso convertire i file di traccia SCF in file ABI?
BioGeek
2017-06-13 16:51:33 UTC
view on stackexchange narkive permalink

Ho una vasta collezione di file di traccia di sequenza che sono in formato di file SCF (file binari che oltre alla stringa di basi di DNA contengono anche l'elettroferogramma del campione e informazioni sulla qualità della base chiamate).

Ho una pipeline BioPython esistente che accetta file in formato AB1 (pdf), quindi devo convertire i miei file SCF in file AB1.

Ho trovato una domanda su Biostars che chiede l'opposto: conversione da SCF a AB1.

La risposta accettata era usare convert_trace dal pacchetto Staden.

  ./convert_trace -out_format scf < trace.ab1 > trace.scf  

Quindi ho provato il opposto:

  ./convert_trace -out_format abi < trace.scf > trace.ab1  

Questo ha effettivamente prodotto un file con * .ab1 estensione, ma dopo averlo importato nella mia pipeline BioPython, ho ricevuto l'errore

  Il file dovrebbe iniziare ABIF, non '\ xaeZ TR ' 

Quindi a quanto pare, convert_trace ha convertito i miei file in formato ZTR, anche se ho specificato -out_format abi .

Una lettura più attenta del manuale afferma che [convert_exe] può scrivere nei formati CTF, EXP, PLN, SCF e ZTR. (quindi in effetti niente ABI), ma confonde io perché ABI è ancora un formato di output valido.

Quindi, la mia domanda è: come converto i file SCF in file ABI?

Due risposte:
BaCh
2017-06-13 19:06:16 UTC
view on stackexchange narkive permalink

Apparentemente convert_trace non esegue un buon controllo dei parametri e imposta silenziosamente ZTR come predefinito se non riconosce un formato di output valido.

Non ne conosco liberamente convertitori da riga di comando disponibili in quella specifica direzione. Anche al culmine del sequenziamento di Sanger (fine anni '90, inizio anni 2000), le condutture di solito cercavano di ridurre la complessità e l'ingombro convertendo AB1 in qualsiasi altra cosa, spesso SCF (ZTR è arrivato troppo tardi e non ha mai ottenuto una trazione sufficiente).

Detto questo, ho tirato fuori un SCF che avevo del 1997, l'ho caricato in Geneious e l'ho riesportato come .ab1. Sono rimasto un po 'stupito nel vedere che ha funzionato. Quindi Geneious (o pacchetti simili di altre società) potrebbe essere la soluzione migliore per una cosa rapida e una tantum.

A seconda delle tue esigenze, potresti pensare ad altri modi: o espandere BioPython per leggere SCF, o forse per espandere lo Staden io_lib per poter scrivere .ab1 (James mantiene ancora quel pacchetto ed è estremamente utile).

Buona fortuna.

Ho scaricato Geneious e ho richiesto una licenza di prova. Sono effettivamente in grado di importare file SCF, ma non vedo "ab1" come formato di esportazione? Quindi, immagino che dovrò scegliere una delle tue altre due opzioni ...
Ho controllato di nuovo e la mia versione di Geneious (10.1.3) offre sicuramente un "cromatogramma ABI (* .ab1)" come tipo nella finestra di dialogo "File-> Esporta documento selezionato ...". Il tuo SCF è stato selezionato?
Ultralisk
2018-10-02 23:01:33 UTC
view on stackexchange narkive permalink

DNA Baser Assembler convertirà ABI in SCF (e altri formati). Basta fare doppio clic sul file ABI che si desidera convertire, quindi andare nel menu "Campioni" e scegliere "Salva campioni correnti come ...". Inoltre, può tagliare automaticamente le estremità di bassa qualità.

enter image description here C'è un altro strumento in quel pacchetto che convertirà tutti i file ABI in batch: Chromatogram Explorer. Esiste una versione Lite gratuita, ma la conversione in SCF potrebbe funzionare solo per i primi 100 file (se non ricordo male).

Relativo al commento pubblicato da BioGeek sulla licenza Genious: DNA Baser L'assemblatore non richiede una chiave di licenza. Funzionerà subito.

L'OP chiedeva SCF-> ABI Penso che la tua risposta sia solo SCF-> ABI. Questi strumenti funzionano in entrambe le direzioni?


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...