La prueba algorítmica como nuevo desafío del derecho probatorio - Todo sobre el Derecho Probatorio tu fuente para información jurídica sobre pruebas legales.

Comparte esta entrada:

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp Telegram

Raymond Orta Martinez, Editor

Propuesta de nueva Regla Federal 707 sobre evidencia generada por inteligencia artificial: hacia un nuevo estándar de admisibilidad probatoria en la era algorítmica

La propuesta de una nueva Federal Rule of Evidence 707, actualmente discutida en el sistema federal estadounidense, constituye uno de los desarrollos más importantes del derecho probatorio contemporáneo. Su finalidad es cerrar una brecha normativa evidente: cuando una parte pretende introducir en juicio un resultado generado por una máquina, software o sistema de inteligencia artificial, sin presentar un perito que explique y defienda ese resultado, las reglas tradicionales no siempre ofrecen un mecanismo suficientemente claro para controlar su fiabilidad.

La propuesta no busca prohibir la evidencia generada por inteligencia artificial. Tampoco pretende desplazar la prueba pericial humana. Su objetivo es distinto: impedir que las partes eludan los controles de fiabilidad de la Regla 702 mediante la simple presentación directa de un resultado algorítmico.

En términos prácticos, la Regla 707 trasladaría al output de sistemas automatizados el mismo tipo de escrutinio que hoy se exige a la prueba pericial: suficiencia de datos, confiabilidad del método, aplicación adecuada al caso concreto y control judicial previo de admisibilidad.

La prueba algorítmica como nuevo desafío del derecho probatorio

El derecho probatorio ha sido históricamente construido sobre una premisa relativamente estable: la prueba es producida, explicada o introducida por sujetos humanos. El testigo declara; el perito opina; el documento se autentica; el instrumento científico arroja una medición susceptible de ser explicada por quien conoce su funcionamiento.

La inteligencia artificial altera ese esquema. Hoy pueden presentarse ante tribunales resultados producidos por sistemas automatizados que clasifican rostros, estiman daños económicos, analizan patrones financieros, predicen riesgos, interpretan datos médicos, detectan fraude, comparan voces, evalúan imágenes, reconstruyen eventos o generan inferencias a partir de grandes volúmenes de información.

El problema no reside únicamente en que esos sistemas sean tecnológicos. Los tribunales llevan décadas admitiendo resultados producidos por instrumentos técnicos. El problema es que muchos sistemas contemporáneos de IA no se limitan a medir; infieren, clasifican, predicen o concluyen. En otras palabras, realizan una función funcionalmente semejante a la de un perito, pero sin rostro, sin juramento, sin contrainterrogatorio y, en ocasiones, sin plena explicabilidad.

La propuesta de Regla 707 surge precisamente para enfrentar ese problema.

Estado actual de la propuesta

La Regla 707 no debe tratarse como una norma vigente. Es una propuesta de reforma a las Federal Rules of Evidence. El Comité Asesor de Reglas de Evidencia ha recomendado su discusión y publicación para comentarios públicos, en el contexto de la creciente utilización de inteligencia artificial y evidencia generada por máquinas en litigios. La propuesta fue revisada por el Comité de Reglas de Práctica y Procedimiento en junio de 2025, y el Comité Asesor ha continuado evaluando ajustes a su texto y a sus notas explicativas.

El texto de trabajo más relevante establece, en esencia, que cuando se ofrezca evidencia generada por máquinas sin testimonio pericial, y dicha evidencia sería objeto de la Regla 702 si hubiera sido presentada por un testigo humano, el tribunal solo podrá admitirla si satisface los requisitos de la Regla 702. La propuesta excluye los resultados de instrumentos científicos simples.

Esta distinción es fundamental: la Regla 707 no se dirige a todo uso de tecnología en juicio. No pretende regular cada hoja de cálculo, cada termómetro digital o cada dato rutinario generado por un instrumento elemental. Su verdadero objetivo es el resultado automatizado que opera como una conclusión experta sin experto.

Texto esencial de la propuesta

La formulación propuesta por el Comité puede resumirse así:

Cuando se ofrezca evidencia generada por máquinas sin un testigo experto, y esa evidencia estaría sujeta a la Regla 702 si fuera testificada por una persona, el tribunal podrá admitirla únicamente si satisface los requisitos de la Regla 702. La regla no aplicaría al output de instrumentos científicos simples.

Esta redacción contiene cuatro elementos jurídicamente relevantes:

Debe tratarse de evidencia generada por máquina.
Debe ofrecerse sin testimonio pericial.
Su contenido debe ser equivalente a algo que, si lo dijera una persona, requeriría aplicación de la Regla 702.
La admisión dependerá de cumplir los estándares de fiabilidad de la Regla 702.

La propuesta, por tanto, no crea un régimen autónomo completamente nuevo. Lo que hace es proyectar sobre la evidencia algorítmica los controles ya conocidos de la prueba pericial.

La brecha normativa que intenta cerrar la Regla 707

La Regla 702 exige que el testimonio experto se funde en datos suficientes, métodos confiables y una aplicación fiable al caso concreto. Sin embargo, cuando el resultado lo produce directamente una máquina y se presenta mediante un testigo lego —por ejemplo, un operador que solo ingresó datos y obtuvo una impresión— surge una dificultad: formalmente no hay “testimonio experto”, aunque sustancialmente sí se está ofreciendo una conclusión técnica.

El Comité identificó expresamente esta preocupación: si el output de software se presenta sin acompañamiento de un experto, la Regla 702 no resulta obviamente aplicable porque ningún experto está declarando. Pero tampoco puede permitirse que una parte evada los requisitos de confiabilidad de la Regla 702 simplemente ofreciendo el resultado de la máquina directamente.

Esta es la razón de ser de la Regla 707: impedir el “lavado probatorio” de inferencias técnicas bajo apariencia de dato objetivo.

Diferencia entre autenticidad y fiabilidad

Uno de los aportes más relevantes de la propuesta es la distinción entre autenticidad y fiabilidad.

La autenticidad responde a la pregunta: ¿esto es lo que la parte dice que es?

La fiabilidad responde a otra pregunta: ¿el proceso que produjo este resultado es suficientemente confiable para que el tribunal lo admita como prueba?

La Regla 901(b)(9) ya contempla la autenticación de evidencia producida por procesos o sistemas, exigiendo prueba suficiente de que el sistema produce un resultado preciso. Pero el Comité ha señalado que, en materia de evidencia generada por máquinas con función equivalente a la pericial, el problema central no es solo autenticación, sino fiabilidad sustantiva. De hecho, el reporte del Comité indica que la exigencia de la Regla 901(b)(9) quedaría absorbida por los requisitos de fiabilidad de las Reglas 702 y 707 cuando estas apliquen. Satisfacer autenticidad no bastaría para admisibilidad.

Esto es crucial. Una pieza de evidencia puede ser auténtica y, aun así, metodológicamente inaceptable. Un informe generado por IA puede haber sido efectivamente producido por el sistema invocado, pero el resultado puede ser sesgado, incompleto, opaco, no validado o inaplicable al caso concreto.

Relación con la Regla 702

La Regla 707 remite directamente a la Regla 702. En consecuencia, el proponente de la evidencia generada por máquina deberá demostrar, en sustancia, que:

El resultado ayudará al juzgador a comprender la prueba o determinar un hecho relevante.
El resultado se basa en hechos o datos suficientes.
El resultado deriva de principios y métodos confiables.
El sistema aplicó esos principios y métodos de manera confiable a los hechos del caso.

La propuesta traslada así el análisis de confiabilidad pericial al campo de los sistemas automatizados.

Esta remisión tiene sentido técnico y dogmático. Cuando un sistema de IA produce una inferencia técnica, el riesgo probatorio es similar al de un perito: el juzgador puede otorgar peso indebido a una conclusión revestida de autoridad científica. Pero el riesgo puede ser mayor, porque la máquina no puede ser contrainterrogada como un testigo humano.

El Comité ha reconocido esta diferencia: un experto humano puede ser sometido a contrainterrogatorio, mientras que puede ser más difícil atacar el peso de una conclusión generada por máquina; por ello se ha considerado la posibilidad de instrucciones limitativas al jurado, advirtiendo que la evidencia generada por máquina puede contener error y que no debe presumirse confiable ni desconfiable solo por haber sido producida por una máquina.

Qué tipo de evidencia quedaría comprendida

La Regla 707 se orienta a resultados automatizados que cumplen una función inferencial, predictiva o técnica. Entre los ejemplos posibles podrían incluirse:

sistemas de IA que calculan daños económicos;
herramientas de predicción de riesgo;
software de reconocimiento facial;
programas de comparación biométrica;
sistemas de análisis de voz;
algoritmos de detección de fraude;
software de interpretación de mezclas de ADN;
herramientas de análisis forense digital;
sistemas de diagnóstico médico automatizado;
modelos de clasificación de imágenes;
programas que reconstruyen eventos a partir de datos complejos.

No todo output de computadora quedaría comprendido. La propuesta excluye instrumentos científicos simples y ha discutido ejemplos como termómetros, balanzas electrónicas o instrumentos de uso cotidiano que no generan las mismas preocupaciones de inferencia técnica compleja.

La dificultad estará en la frontera. Un termómetro digital no plantea el mismo problema que un sistema de IA que determina probabilidad de autoría en un audio. Una hoja de cálculo ordinaria no equivale a un modelo predictivo entrenado con datos históricos sesgados. Un sistema de medición simple no es comparable a un algoritmo propietario que clasifica conductas, personas o eventos.

Factores de análisis bajo la Regla 707

El Comité ha señalado que el análisis bajo la Regla 707 puede implicar, entre otros factores, evaluar si los datos de entrada son suficientes, si los datos de entrenamiento son representativos, si el proceso fue validado en condiciones suficientemente similares al caso y si la aplicación del sistema al caso concreto es confiable.

En términos prácticos, un tribunal debería examinar al menos los siguientes elementos:

Calidad de los datos de entrada

La fiabilidad del resultado depende de los datos utilizados. Si los datos son incompletos, erróneos, sesgados o no representativos, el output queda comprometido.

En evidencia algorítmica, el viejo principio informático sigue vigente: garbage in, garbage out. Un sistema sofisticado no corrige necesariamente datos defectuosos.

Representatividad del entrenamiento

En sistemas de aprendizaje automático, el entrenamiento determina el rango de funcionamiento real. Si el modelo fue entrenado con datos no representativos de la población o del fenómeno discutido en juicio, el resultado puede producir errores sistemáticos.

Esto es especialmente sensible en reconocimiento facial, riesgo penal, evaluación crediticia, patrones médicos, análisis de lenguaje, detección de fraude y herramientas predictivas.

Validación externa

No basta afirmar que el sistema “funciona”. Debe demostrarse validación empírica. El tribunal debería exigir estudios de desempeño, pruebas independientes, validación en condiciones similares, tasas de error y límites conocidos del método.

Explicabilidad

La opacidad de ciertos modelos plantea un problema probatorio mayor. Si nadie puede explicar cómo el sistema llegó a la conclusión, la contradicción procesal se debilita.

El Comité ha reconocido que algunos procesos de machine learning pueden desarrollarse de modo que nadie pueda explicar plenamente cómo la máquina alcanzó el resultado, lo que plantea problemas específicos para su admisibilidad y valoración.

Tasa de error

La tasa de error es esencial para valorar confiabilidad. Un resultado algorítmico sin margen de error conocido es una conclusión sin brújula científica.

Sesgo

Los sistemas de IA pueden incorporar sesgos provenientes de datos históricos, decisiones de diseño, variables proxy o selección defectuosa de muestras. El Comité ha señalado que, sin testimonio experto, puede ser muy difícil demostrar que los datos utilizados no están sesgados y que son suficientes para la tarea realizada.

Uso conforme al propósito previsto

El uso de un sistema fuera de su contexto de diseño —lo que se ha descrito como function creep— puede comprometer la confiabilidad del resultado. El Comité identificó expresamente el uso para fines no previstos como una de las preocupaciones asociadas a la evidencia generada por máquinas.

El problema del “testigo operador”

Uno de los escenarios más delicados es el del testigo que simplemente opera el sistema.

Ejemplo: un técnico ingresa datos en un programa, imprime el resultado y lo lleva al tribunal. Ese técnico puede autenticar que usó el sistema, pero quizá no puede explicar su diseño, validación, datos de entrenamiento, tasa de error o sesgos.

La propuesta aborda este problema. El Comité ha indicado que la regla aplica también cuando el resultado se presenta mediante testimonio lego de una persona que operó el programa pero no posee conocimientos sobre su confiabilidad.

La consecuencia práctica es clara: la parte que pretenda introducir evidencia algorítmica no debería descansar exclusivamente en el operador. Necesitará, salvo casos simples, un perito capaz de sustentar la fiabilidad del sistema.

La Regla 707 no sustituye al perito: lo hace más necesario

Un error de lectura sería pensar que la Regla 707 habilita la presentación de evidencia generada por IA sin perito. En realidad, la propuesta hace lo contrario: eleva la dificultad de admitirla sin acompañamiento experto.

El Comité ha sido explícito al señalar que la regla no pretende incentivar que las partes opten por evidencia generada por máquinas en lugar de testigos expertos. Su finalidad es ofrecer protecciones de fiabilidad cuando una parte decide presentar evidencia generada por máquina en sustitución de un experto. También se anticipa que esos estándares serán difíciles, y a veces imposibles, de cumplir sin testimonio experto.

En otras palabras: la Regla 707 no es una vía rápida para introducir IA; es un filtro.

Riesgos probatorios que justifican la Regla 707

Autoridad indebida de la máquina

Los jurados y jueces pueden atribuir a los sistemas automatizados una autoridad excesiva. La apariencia matemática o tecnológica puede generar una falsa percepción de neutralidad.

Opacidad algorítmica

Muchos modelos no son plenamente interpretables. Si el tribunal no comprende el proceso, difícilmente puede evaluar su fiabilidad.

Sesgo estructural

La IA puede reproducir patrones discriminatorios o errores históricos presentes en los datos de entrenamiento.

Falta de contrainterrogatorio efectivo

No se puede interrogar a una máquina. Puede interrogarse al desarrollador, al operador o al perito, pero no al sistema mismo.

Dificultades de descubrimiento probatorio

Los sistemas propietarios pueden estar protegidos por secreto comercial. Esto limita el acceso de la contraparte a código fuente, datos de entrenamiento, documentación interna o pruebas de validación.

Automatización de inferencias complejas

El mayor riesgo no está en medir, sino en concluir. Cuando la máquina atribuye, clasifica, predice o diagnostica, se aproxima funcionalmente al terreno pericial.

Implicaciones para litigantes

La Regla 707 cambiaría de manera sustancial la preparación de casos con evidencia algorítmica.

Para quien ofrece la prueba

La parte proponente deberá preparar:

descripción técnica del sistema;
finalidad original del modelo;
datos de entrada utilizados;
datos de entrenamiento relevantes;
documentación de validación;
tasa de error;
controles de sesgo;
límites de uso;
evidencia de aplicación confiable al caso;
testimonio experto de soporte.
Para quien impugna

La parte contraria debería concentrar sus objeciones en:

insuficiencia de datos;
falta de representatividad;
ausencia de validación externa;
opacidad del modelo;
sesgo conocido o probable;
uso fuera del propósito previsto;
imposibilidad de reproducción;
ausencia de acceso adversarial suficiente;
falta de perito competente.
XIII. Implicaciones para jueces

La Regla 707 reafirma el papel del juez como gatekeeper. El juez no debe limitarse a verificar que el sistema existe o que el resultado fue producido por ese sistema. Debe examinar si el output es suficientemente fiable para ingresar al proceso.

Ello exige mayor alfabetización tecnológica judicial. Los tribunales deberán comprender conceptos como:

machine learning;
datos de entrenamiento;
sesgo algorítmico;
overfitting;
validación externa;
explainability;
tasa de falsos positivos y falsos negativos;
reproducibilidad;
robustez;
auditabilidad.

El derecho probatorio se aproxima así a una etapa en la que el juez deberá evaluar no solo testigos, documentos y peritos, sino también arquitecturas tecnológicas.

XIV. Implicaciones para peritos

La propuesta incrementa la relevancia del perito tecnológico. El perito no solo deberá explicar el resultado, sino también:

cómo funciona el sistema;
qué datos usó;
qué límites tiene;
qué errores puede producir;
si fue validado;
si resulta aplicable al caso;
si existen sesgos conocidos;
si el output puede ser reproducido;
si el sistema ha sido sometido a revisión independiente.

En consecuencia, los peritos deberán abandonar explicaciones genéricas sobre “precisión” o “eficiencia” y ofrecer análisis metodológicos verificables.

Implicaciones para informática forense y evidencia digital

La Regla 707 incide directamente en informática forense.

Muchas herramientas forenses ya no se limitan a extraer datos. Algunas clasifican archivos, detectan patrones, reconocen rostros, priorizan comunicaciones, infieren relaciones o reconstruyen secuencias. Cuando el resultado de esas herramientas se ofrece como conclusión probatoria, el control de fiabilidad será indispensable.

Esto implica que el informe forense deberá documentar:

herramienta utilizada;
versión del software;
configuración aplicada;
hash de insumos;
preservación del original;
bitácora de operaciones;
reproducibilidad del resultado;
límites conocidos de la herramienta;
validación de la metodología;
intervención humana en el análisis.
XVI. Incidencia en prueba documental y documental digital

En el campo de la documentoscopia y la prueba documental digital, la Regla 707 puede proyectarse sobre sistemas de:

detección automatizada de firmas falsas;
comparación algorítmica de manuscritos;
análisis de metadatos;
clasificación de documentos;
detección de alteraciones en PDF;
análisis de imágenes;
reconocimiento óptico de caracteres con inferencias;
identificación de patrones de manipulación.

La advertencia es clara: cuando el sistema no se limita a extraer información, sino que produce una conclusión técnica, deberá pasar por un control similar al de la prueba pericial.

Regla 707 y deepfakes: relación indirecta

La Regla 707 no debe confundirse con una regla específica sobre deepfakes.

Los deepfakes plantean principalmente un problema de autenticidad: si el audio, imagen o video es real o manipulado. La Regla 707 se centra en otra categoría: evidencia generada por máquinas que funciona como una conclusión técnica.

No obstante, ambos fenómenos se conectan. Para detectar deepfakes, las partes podrían usar sistemas automatizados de análisis. Si el resultado de ese sistema se ofrece como prueba sin perito, podría entrar en el campo de la Regla 707.

Así, el deepfake puede ser objeto de autenticación, mientras que el detector algorítmico de deepfakes puede ser objeto de análisis de fiabilidad bajo la Regla 707.

XVIII. Objeciones previsibles a la propuesta

Riesgo de sobrerregulación

Algunos podrían sostener que las reglas actuales ya permiten controlar la evidencia tecnológica mediante Reglas 702, 901 y 403. Sin embargo, la brecha aparece cuando no hay perito y se ofrece directamente el resultado de la máquina.

Indefinición del concepto “machine-generated evidence”

La expresión puede generar dudas. ¿Incluye todo software? ¿Solo IA? ¿Incluye sistemas estadísticos? El Comité ha discutido precisamente si conviene limitar la regla a machine learning o mantener una fórmula más amplia. Finalmente, se ha mostrado preocupación por limitarla demasiado, porque sistemas complejos no necesariamente encajan en una definición estrecha de machine learning.

Problemas con la excepción de instrumentos simples

La exclusión de “simple scientific instruments” será una zona de litigio. ¿Qué es simple? ¿Un alcoholímetro? ¿Un radar? ¿Un software de análisis de ADN? ¿Un sistema de scoring financiero? La frontera deberá ser desarrollada jurisprudencialmente.

Costo procesal

La exigencia de validación puede aumentar costos. Pero el costo de admitir evidencia no fiable puede ser mucho mayor: decisiones erróneas, condenas injustas, indemnizaciones mal calculadas o fraudes procesales.

Secreto comercial

Los desarrolladores pueden resistirse a revelar funcionamiento, datos o validaciones. Los tribunales deberán equilibrar secreto comercial con derecho de contradicción y debido proceso.

Impacto en arbitraje y litigios internacionales

Aunque la Regla 707 pertenece al sistema federal estadounidense, su influencia puede extenderse al arbitraje internacional y a litigios transnacionales.

En arbitraje comercial, las partes emplean cada vez más herramientas de IA para análisis documental, cuantificación de daños, detección de fraude, modelación financiera y evaluación de evidencia técnica. Si bien los tribunales arbitrales no están sujetos directamente a las Federal Rules of Evidence salvo pacto o referencia, la Regla 707 puede convertirse en estándar persuasivo.

En la práctica arbitral, podría incorporarse en órdenes procesales mediante cláusulas como:

obligación de revelar uso de IA en generación de evidencia;
obligación de identificar herramienta, versión y parámetros;
derecho de la contraparte a revisar metodología;
obligación de presentar perito cuando el output tenga carácter inferencial;
exclusión de resultados no auditables;
preservación de prompts, inputs, logs y outputs.

Para arbitrajes con sede en jurisdicciones anglosajonas o con ejecución probable en Estados Unidos, la Regla 707 puede adquirir importancia estratégica.

Propuesta de protocolo práctico para abogados

Ante evidencia generada por IA, el abogado debería aplicar un protocolo mínimo:

Identificar si el resultado es meramente operativo o inferencial.
Determinar si, de haber sido emitido por una persona, requeriría testimonio experto.
Verificar datos de entrada, fuente y cadena de custodia.
Exigir documentación técnica del sistema.
Determinar si existe validación independiente.
Revisar sesgos, tasas de error y límites de uso.
Asegurar reproducibilidad.
Preparar testimonio experto.
Anticipar objeciones bajo Reglas 702, 707, 901 y 403.
Evitar presentar outputs algorítmicos como si fueran hechos incontrovertibles.
XXI. Propuesta de checklist de admisibilidad

Para evaluar admisibilidad de evidencia algorítmica, el tribunal o las partes podrían formular las siguientes preguntas:

¿Qué sistema produjo el resultado?
¿Cuál es su finalidad original?
¿Quién lo desarrolló?
¿Qué versión fue utilizada?
¿Qué datos recibió?
¿Cómo se preservaron los datos de entrada?
¿El sistema fue validado?
¿En qué población o contexto?
¿Cuál es su tasa de error?
¿Existen estudios independientes?
¿Se conocen sesgos?
¿Puede reproducirse el resultado?
¿Puede explicarse el razonamiento del sistema?
¿La contraparte tuvo acceso suficiente para impugnarlo?
¿El resultado fue revisado por un experto humano?
¿El uso en el caso coincide con el uso previsto?
¿La evidencia ayuda realmente al juzgador?
¿Su valor probatorio supera el riesgo de confusión o perjuicio?

Valoración crítica

La Regla 707 es una respuesta razonable, aunque no definitiva. Su virtud principal está en impedir que la inteligencia artificial ingrese al expediente como si fuera una verdad técnica autoevidente. Su debilidad principal está en la dificultad de definir sus fronteras.

La regla acierta al ubicar el problema en la fiabilidad, no solo en la autenticidad. También acierta al conectar la evidencia algorítmica con la lógica de la prueba pericial. Si una máquina realiza una función equivalente a la de un experto, debe soportar un escrutinio equivalente.

Pero el desafío será operativo. Los tribunales deberán decidir cuándo el output es suficientemente complejo para activar la Regla 707. También deberán manejar tensiones entre transparencia y secreto comercial, y entre eficiencia procesal y derecho de contradicción.

Conclusión

La propuesta de Regla Federal 707 representa un giro decisivo en el derecho probatorio moderno. No se limita a regular una tecnología específica; redefine el modo en que los tribunales deben aproximarse a las conclusiones producidas por sistemas automatizados.

Su mensaje central es claro: la máquina no puede ser un atajo para eludir la fiabilidad pericial.

La inteligencia artificial puede ser útil, poderosa y eficiente. Pero en juicio no basta con que un sistema produzca un resultado. Debe demostrarse que ese resultado fue generado mediante datos suficientes, métodos confiables y aplicación válida al caso concreto.

El futuro del derecho probatorio dependerá cada vez más de esta distinción: no todo lo técnicamente sofisticado es jurídicamente admisible; no todo lo algorítmico es científicamente fiable; no todo output merece ser tratado como prueba.

La Regla 707, si finalmente se adopta, marcará un hito: el ingreso formal de la inteligencia artificial al régimen de admisibilidad probatoria, no como privilegio tecnológico, sino como objeto de control judicial estricto.

Para litigantes, peritos y jueces, el mensaje operativo es inequívoco: la evidencia generada por IA debe ser verificable, explicable, validada y contradictoria. De lo contrario, no debería superar el umbral de admisibilidad.

Comparte esta entrada:

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp Telegram