Stiamo valutando di cambiare il nostro formato di archiviazione da BAM a CRAM. Lavoriamo con campioni di cancro umano, che possono avere varianti a prevalenza molto bassa (cioè non frequenza diploide).
Se usiamo CRAM lossy per risparmiare più spazio, quanto cambieranno le varianti chiamate da quei file CRAM? Quale strategia di compressione ha il minor impatto?
Ci sono altri impatti sugli strumenti a valle che non stiamo prendendo in considerazione?