Sto cercando di creare database locali per il pacchetto ncbi-blast + (versione 2.60). Lo sto facendo per 4 geni del recettore delle cellule T. 3 dei 4 (TRAV, TRAJ, TRBV) hanno funzionato bene, ma ho problemi con TRBJ. Dico questo perché dovrebbero avere lo stesso formato e se uno funziona il resto funziona.
Prendono il formato seguente:
>K02545 | TRBJ1-1 * 01 | Homo sapiens | F | J-REGION | 749..796 | 48 nt | 3 | | | | 15 AA | 15 + 0 = 15 | | | NTEAFFGQGTRLTVV
Ho usato il seguente comando (come ho detto, andava bene per il resto, stranamente):
makeblastdb -in TRBJ_AA.fa -parse_seqids -dbtype prot
e ricevo il seguente messaggio di errore:
Errore opzioni BLAST: TRBJ_AA.fa non corrisponde al tipo di formato di input, input predefinito il tipoèFASTA
Un problema che ho verificato è che la lunghezza delle sequenze è troppo breve, ma credo che 11 sia la lunghezza minima richiesta (per gli input, non so se è la stessa per i database), ma qualcuno sarebbe in grado di confermare che questo mi sembra il candidato più probabile?
Sono felice di utilizzare qualche altra metrica, ma speravo di mantenere BLAST per coerenza per il momento.
Grazie.
edit: So che è troppo tardi, ma per riferimento sono su Ubuntu 16.04.2 LTS x86_64 per tutti i passaggi.