Tanto para audio como para video, el principal reto consiste en almacenar los datos, pues aun si se convierte el sonido en números, se requiere un esquema lo suficientemente rápido como para no perder información. Por ejemplo, para grabar una canción en sonido estéreo (dos canales) con una frecuencia de muestreo de 44.1 kHz y un tamaño de palabra de 16 bits, el software y el hardware de grabación deben ser capaces de operar 1 411 200 bits por segundo.
Una de las principales ventajas de la grabación digital sobre la analógica es que se pueden corregir errores en la secuencia de audio. Por ejemplo, si se modifica uno de los números en la secuencia, por un error físico en el medio de almacenamiento, el software de reproducción puede detectar que lo que leyó debía ser un 1 y corregirlo. En las grabaciones analógicas, los errores se hacen más graves con el tiempo. Existen muchas técnicas para corrección de errores que no se abordarán aquí por razones de espacio.
Concepto
El tamaño de palabra es el número de bits utilizado para representar una onda de audio única. El tamaño de palabra afecta directamente la distorsión. En la actualidad se utiliza como límite práctico un tamaño de palabra de 24 bits, ya que su relación señal-a-ruido excede el de la mayoría de los circuitos analógicos, que son utilizados en (al menos) dos puntos en el proceso de grabación y reproducción del sonido.