Seleccionar página
Presentación Técnica: Proyecto PIDA-AI

Proyecto PIDA-AI

Informe Técnico de Arquitectura y Avances

Versión 1.0 (Post-Depuración)

1. Descripción General del Proyecto

Estrategia

Implementar un asistente jurídico de IA para optimizar el análisis de consultas complejas sobre Derechos Humanos, proveyendo respuestas precisas y fundamentadas en evidencia verificable.

Funcionalidad

El sistema opera sobre una arquitectura serverless, integrando una base de conocimiento interna (RAG) con fuentes web externas (PSE) para un análisis contextual completo.

Estado Actual

La fase de desarrollo y depuración técnica ha finalizado. El sistema es estable, funcional y está preparado para iniciar las Pruebas de Aceptación de Usuario (UAT).

2. Arquitectura General del Sistema

PIDA-AI se basa en una arquitectura serverless y modular en Google Cloud, garantizando escalabilidad y seguridad.

🖥️

Frontend

(Interfaz de Usuario)

↔️

⚙️

Backend Central

(Cloud Run)

⤵️

🧠

Motor de Inteligencia Artificial (Vertex AI)

Orquesta el análisis y la generación de respuestas

⤴️

📚

Sistema de Conocimiento

(RAG + PSE)

↔️

💾

Base de Datos

(Firestore)

3. Componentes Tecnológicos (1/2)

  • Aplicación Backend (Cloud Run): El núcleo en Python/Flask se ejecuta en un entorno serverless que escala automáticamente, garantizando alta disponibilidad y resiliencia.
  • Motor de IA (Vertex AI):
    • Modelo Principal (Gemini): Delegado para el razonamiento complejo, análisis de contexto y redacción de respuestas jurídicas.
    • Modelo de Reescritura: Instancia especializada que dota de "memoria" al sistema, transformando las preguntas de seguimiento en consultas de búsqueda optimizadas.

3. Componentes Tecnológicos (2/2)

  • Sistema de Conocimiento Híbrido:
    • RAG (Vertex AI Search): Indexa la biblioteca interna para una recuperación de información precisa y verificable.
    • PSE (Google): Complementa con datos web externos, proveyendo contexto de actualidad y enlaces públicos.
  • Persistencia y Acceso Seguro:
    • Firestore: Base de datos NoSQL para el historial de conversaciones y el mapeo de documentos.
    • Cloud Storage & Signed URLs: Almacena la biblioteca de forma privada, con acceso gestionado por URLs firmadas de corta duración.

4. Flujo de Procesamiento de una Consulta

1

Recepción

El backend recibe la pregunta del usuario y el ID de sesión.

2

Contextualización

El modelo de reescritura optimiza la pregunta usando el historial.

3

Búsqueda Dual

Se ejecuta una búsqueda en paralelo en la base RAG interna y en la web (PSE).

6

Entrega

La respuesta final se transmite al frontend, incluyendo texto y botones interactivos.

5

Generación

El modelo principal redacta la respuesta final basándose en el prompt y los datos.

4

Consolidación

Se construye un prompt final con la pregunta, el contexto de RAG y el de PSE.

5. Configuración de Seguridad y Permisos

  • Identidad Dedicada: Cloud Run opera con una cuenta de servicio específica (`rag-backend@...`) para aplicar el principio de mínimo privilegio y auditoría granular.
  • Gestión de Roles (IAM): La cuenta de servicio posee roles específicos y necesarios, incluyendo `Service Account Token Creator` para la generación de URLs firmadas.
  • Claves de API Restringidas: Las claves para funciones de frontend están limitadas por referente HTTP, garantizando su uso exclusivo desde el dominio web autorizado.

6. Estado Actual y Próximos Pasos

✅ Estado Actual

Depuración técnica finalizada. El sistema es estable, integrado y todos sus componentes están operativos.

➡️ Próximo Paso: Pruebas UAT

Someter el sistema a pruebas de campo con el equipo de la institución. Las **Pruebas de Aceptación de Usuario (UAT)** se centrarán en evaluar la calidad de las respuestas, la experiencia de usuario y la utilidad general de la herramienta con casos de uso reales.

Gracias