Cada vez que oigo la frase “los datos son el nuevo petróleo” me chirría el cerebro porque observo justo lo contrario: mientras el crudo se agota los datos se multiplican cuanto más se usan y se comparten, el petróleo se quema y desaparece pero los datos se copian y permanecen, los países guardan barriles en cavernas de sal y las empresas almacenan bits en nubes elásticas. Esa asimetría no es un juego retórico sino el núcleo de cómo debería orientarse la inversión en inteligencia artificial y economía digital en los próximos años. Cuando uno mira con calma las características económicas de ambos activos descubre que coinciden en muy pocas cosas y que la analogía sirve más para titulares atractivos que para diseñar políticas públicas o estrategias empresariales serias.
El primer contraste es de escasez. El petróleo es un recurso no renovable que tarda millones de años en formarse y cuya oferta no puede regenerarse a corto plazo por eso se clasifica entre las fuentes no renovables junto al gas y el carbón. Los datos en cambio no se “consumen” al usarlos y se pueden generar sin límite a costes marginales muy bajos gracias a sensores, software, transacciones o interacciones digitales lo que lleva a una disponibilidad creciente año tras año.
Otro error de la metáfora es sugerir homogeneidad. El crudo se comercializa con clasificaciones globales como Brent o WTI que facilitan su comparación y hacen del petróleo un activo relativamente fungible con especificaciones de densidad y azufre conocidas que el mercado entiende bien. Los datos no son intercambiables de esa manera porque su calidad, contexto y sesgos importan más que el volumen y el refrán “somos lo que comemos” se aplica con saña a cualquier proyecto de IA que no cuide su limpieza. Por eso dos terabytes pueden valer oro o cero según su procedencia y pureza.
También cambia por completo la propiedad. El petróleo es propiedad de Estados por criterios territoriales y estos ceden su explotación a empresas públicas o privadas a través de concesiones y contratos. En el terreno de los datos la propiedad como tal, rara vez existe en el sentido civil clásico especialmente en Europa donde el GDPR otorgó derechos de acceso portabilidad o rectificación pero no un derecho real de dominio sobre los bits y donde el nuevo Data Act refuerza el acceso y el reparto bajo términos justos sin convertir los datos en “cosas” apropiables. Es un enfoque que privilegia el control y el uso frente a la apropiación absoluta.
La fijación del precio es otra diferencia clave. El mercado petrolero convive con cárteles y alianzas como OPEP+ que ajustan cuotas para influir en la oferta y por tanto en el precio mientras los Estados participan con reservas estratégicas que amortiguan choques. Nada similar existe en datos donde no hay un cártel mundial que cierre o abra el grifo y donde la fricción real está en estándares de interoperabilidad, derechos de acceso y reglas de transferencia transfronteriza.
Cuando el petróleo cambia de manos, cambia el propietario y el vendedor ya no lo tiene. Con los datos ocurre lo contrario: vender o licenciar no extingue la copia original porque la información es replicable casi a coste cero y usable por múltiples actores al mismo tiempo sin agotarse, lo que en economía llamamos no rivalidad. Este rasgo altera por completo la competencia: un mismo dataset puede generar valor para varios agentes simultáneamente y la ventaja competitiva no reside en ocultarlo sino en procesarlo mejor y combinarlo con otros flujos.
Conviene subrayar el uso. Cada barril que se quema reduce el stock disponible y deja tras de sí emisiones y residuos; por eso existen estrategias de transición y sustitución. Los datos al usarlos no se agotan aunque pueden generar externalidades negativas si se usan sin rigor privacidad o calidad. De hecho muchos tropiezos en IA nacen de entrenar con datos incompletos, sesgados o incorrectos, algo que empresas y reguladores están empezando a exigir que se mitigue con auditorías, trazabilidad y mejores prácticas de anotación y validación. Hay informes y artículos técnicos recientes que cuantifican fallos de proyectos por mala calidad de datos recordándonos que la cantidad sin calidad no sirve.
Los países acumulan petróleo en reservas estratégicas con normas detalladas sobre días de protección y volúmenes mínimos para emergencias. En datos el equivalente no es acopiar sino abrir flujos bajo reglas que garanticen seguridad, privacidad y competencia sana y eso es lo que intentan los nuevos marcos europeos al exigir condiciones justas de uso compartido entre fabricantes de dispositivos, prestatarios de servicios y terceros. El énfasis se desplaza de “guardar” a “acceder” y de “acumular” a “activar” de forma responsable.
Otra diferencia ignorada es la del intermediario. En petróleo el número de traders y referencias es elevado pero visible y sometido a un andamiaje robusto de mediciones. En el ecosistema de datos han proliferado los brokers opacos que agregan y venden información sin que el ciudadano sepa cómo se perfila su identidad, algo que la FTC documentó hace años pidiendo transparencia y controles adicionales.
Entonces ¿qué comparten realmente petróleo y datos? Solo dos cosas de fondo: ambos requieren infraestructura de extracción, transporte y refinado antes de producir valor y ambos concentran poder cuando se controlan en grandes volúmenes, sea por una alianza de productores o por plataformas con grandes efectos de red. Todo lo demás diverge: la naturaleza física frente a lo digital, el agotamiento frente a la replicación, el dominio territorial frente a los derechos de acceso y uso, la fijación coordinada de oferta frente a la interoperabilidad como política pública. Por eso cuando alguien me dice “los datos son el nuevo petróleo” respondo que la comparación confunde más de lo que aclara y que si queremos una economía digital próspera debemos pensar en datos como un insumo que gana valor cuando circula bien gobernado no como un barril que guardamos bajo llave.
es por la cantidad mala de pasta que mueven los dos
Por ahí, sí que se parecen, sí.
Creo que has dado en la diana.