Sto lavorando con oltre un milione di letture (lunghe) e allineandole a un genoma di grandi dimensioni. Sto valutando di eseguire i miei lavori di allineamento in parallelo, distribuendoli orizzontalmente su centinaia di nodi piuttosto che provare a eseguire un singolo lavoro con dozzine di core.
Vorrei unire i file BAM ordinati insieme per ulteriori analisi a valle . Qual è il modo più efficiente per farlo mantenendo un'intestazione di file valida e sfruttando il fatto che i file bam di input sono già ordinati?