forgetfulenthusiast

Entradas

Mostrando las entradas de mayo, 2026

The Colorado AI Act Compliance Cliff: What Agent-Builders Need to Do Before June 30

mayo 07, 2026

June 30, 2026. Put it on your calendar. Circle it. The Colorado AI Act (SB 205) takes effect in 55 days. Not next year. Not "whenever the EU gets around to enforcing." Fifty-five days from today. If you read our EU AI Act / Colorado field guide (Article 014), you know the basics: risk classification, consequential decisions, developer and deployer obligations. Maybe you thought "I have time." You don't. This is the compliance wake-up call. What specifically needs to be done before June 30, what the law actually requires in practice, and where most agent-builders are dangerously unprepared. The Date Nobody's Watching Everyone's watching the EU AI Act. Its limited-risk transparency obligations start in August 2026, high-risk compliance lands in August 2027. The EU AI Act is the biggest, most ambitious AI regulation in the world. It gets the headlines. The Colorado AI Act is smaller. One state, narrower scope, consumer-protection framing rather than co...

What We Learned About Agents in H1 2026, and What H2 Still Needs to Answer

mayo 07, 2026

In January 2025, the question was "can agents do this?" By mid-2026, that question is settled. Agents are in production at major banks, health systems, and law firms. They reconcile trades, process prior authorizations, review contracts, and generate test suites. They are not hypothetical. The question now is harder: "should agents do this, and under what conditions?" Six months of production evidence across dozens of industries has produced a clearer picture than anything the hype cycle offered. Some of what H1 proved is encouraging. Some of it is sobering. And several questions the industry thought it had answered are very much still open. What H1 Proved: Agents Are Real The finding of H1 2026 that matters most is also the most boring: agents work reliably in structured, supervised, scoped workflows, and they fail predictably everywhere else. Healthcare back-office deployments are the strongest signal. Prior authorization agents are processing straightforward...

Your Agent Is Running — But What Is It Actually Doing?

mayo 07, 2026

The agent processed 14,000 requests yesterday. Your dashboards show healthy CPU, normal memory, steady API latency. Everything looks green. But did any of those requests loop on the same tool call for 47 iterations before timing out? Did the agent hallucinate a function parameter and silently recover? Did it access the production database when it should have only read from the replica? Your dashboards don't know. They were built for a different world — one where software is deterministic, single-request, and stateless. Agents are none of those things. Why your existing dashboards tell you nothing Traditional monitoring assumes a simple contract: request comes in, response goes out, you measure duration, error rate, and throughput. That works for a web server. It fails for an agent that calls three tools, reasons about their outputs, decides it needs more data, calls two more tools, then produces a result that might be right or might be confidently wrong. The unit of observabil...

Resistencia organizacional: por qué los pilotos de agentes se estancan

mayo 06, 2026

Tiempo estimado de lectura: 7 min Esta es una historia que he escuchado de tres personas diferentes en tres empresas distintas en el último mes. Trabajan en organizaciones con presupuestos de agentes aprobados, herramientas seleccionadas, casos de uso identificados. La presentación ejecutiva fue firmada. El trabajo de ingeniería del piloto está hecho. El agente funciona. Demostrablemente, mediblemente funciona. Y no está en producción. No es «todavía no está en producción». No es «en producción con despliegue limitado». El agente está sentado en un entorno de staging, pasando pruebas, esperando una decisión de despliegue que nadie está tomando. El equipo que lo construyó se ha movido a otros proyectos. La línea de presupuesto sigue ahí. La tecnología funciona. La máquina está lista. Nadie la enciende. Este artículo trata sobre la brecha entre «la tecnología funciona» y «la tecnología está desplegada». No es un artículo de tecnología. Es un artículo de cultura. Y el patrón es lo s...

Cómo se ven realmente los mejores productos de agentes

mayo 06, 2026

Tiempo estimado de lectura: 6 min Hace unos meses, Publigent publicó un catálogo de patrones de UX para agentes: ambiental, salida estructurada, integrado e impulsado por notificaciones. La respuesta fue reveladora. La gente asentía con los nombres de los patrones, pero lo que realmente preguntaban era diferente. Querían ver cómo se ve cada patrón en un producto real. Las decisiones de diseño específicas. Los casos límite. Los momentos donde el patrón funcionaba o se desmoronaba. Este es ese artículo. Sin nombres de patrones como encabezados. Sin frameworks abstractos. Solo cuatro productos, estudiados de cerca, cada uno representando un enfoque distinto a la pregunta de la interfaz de agente. Caso de estudio 1: El agente que trabaja mientras haces otra cosa Copilot es el producto que cualquiera que construya UX de agentes debería estudiar primero, no porque sea el más sofisticado, sino porque resolvió el problema de la interfaz antes que nadie. La decisión central de diseño ...

El ecosistema de agentes open-source a mediados de 2026: lo real, lo experimental y lo que falta

mayo 06, 2026

Tiempo estimado de lectura: 8 min Hace seis meses, el panorama de agentes open-source era fácil de mapear. Tenías LangChain y CrewAI en la cima, AutoGen de Microsoft, y un puñado de frameworks más pequeños rellenando los huecos. Elegías uno, lo aprendías, lanzabas un agente. Simple. Ese mapa ya no sirve. El ecosistema no solo ha crecido. Se ha fracturado. Lo que antes era una sola categoría («frameworks de agentes») ahora son al menos seis: motores de orquestación, sistemas de memoria, servidores de herramientas, frameworks de evaluación, infraestructura de ejecución y plataformas visuales de flujo de trabajo. Cada una tiene sus propios líderes, curvas de adopción y preguntas abiertas. El número total de repositorios relacionados con agentes en GitHub ha superado los 11.000, más del doble que hace un año. Quiero ofrecerte una imagen clara de dónde estamos en mayo de 2026. ¿Qué proyectos están funcionando en producción a escala? ¿Cuáles son prometedores pero aún no están listos?...

¿Quién es su agente realmente? La crisis de identidad que nadie resuelve

mayo 06, 2026

¿Quién es su agente realmente? La crisis de identidad que nadie resuelve Tiempo estimado de lectura: 7 min Su agente acaba de enviar un correo desde su cuenta. Revisó su calendario, leyó su bandeja de entrada, reservó una reunión. Más tarde ese mismo día ejecutó una transacción de $50,000 contra su base de datos de producción. Ambas acciones usaron el mismo token OAuth, la misma credencial digital, porque sus herramientas autenticaron al agente de la misma manera que autenticarían una aplicación web. El agente es usted, hasta donde el sistema sabe. Todo usted. El usted del calendario, el usted del correo, el usted de los pagos, el usted de la base de datos de producción. Este es el problema de identidad que nadie que construya sistemas de agentes ha resuelto. Y es la razón por la que los agentes con poder real (del tipo que mueve dinero, modifica registros o asume compromisos) permanecen bloqueados detrás de puertas de aprobación humana que anulan todo el sentido de tener agentes en pr...

¿Cuánto cuesta realmente ejecutar agentes en producción? El TCO del que nadie habla

mayo 06, 2026

¿Cuánto cuesta realmente ejecutar agentes en producción? El TCO del que nadie habla Tiempo estimado de lectura: 6 min Su equipo acaba de desplegar un agente. La factura de la nube dice que gastó $0.02 por tarea en inferencia del modelo. Todos chocan las manos. Luego termina el primer mes y alguien pregunta cuánto costó realmente ejecutar ese agente, y nadie tiene una buena respuesta. La inferencia del modelo es el 10-20% del verdadero costo total de propiedad. El resto es todo lo que lo rodea: la infraestructura que no presupuestó, los humanos revisando resultados que no planeó necesitar, el mantenimiento que no anticipó y los costos ocultos que nunca aparecen en una factura de nube. Más allá del precio por token El costo visible es simple. Un agente llama a un modelo, usted paga por token. A los precios actuales (aproximadamente $0.15-$3 por millón de tokens de entrada para modelos frontera, $0.60-$15 para salida) una tarea simple podría costar una fracción de centavo. Pero los sistem...