Skip to content

Latest commit

 

History

History
373 lines (279 loc) · 15.9 KB

File metadata and controls

373 lines (279 loc) · 15.9 KB

🌐 Módulo 2: Fundamentos de MCP con AI Toolkit

Duración Dificultad Requisitos

📋 Objetivos de Aprendizaje

Al finalizar este módulo, podrás:

  • ✅ Comprender la arquitectura y beneficios del Model Context Protocol (MCP)
  • ✅ Explorar el ecosistema de servidores MCP de Microsoft
  • ✅ Integrar servidores MCP con AI Toolkit Agent Builder
  • ✅ Construir un agente funcional de automatización de navegador usando Playwright MCP
  • ✅ Configurar y probar herramientas MCP dentro de tus agentes
  • ✅ Exportar y desplegar agentes potenciados con MCP para uso en producción

🎯 Continuando desde el Módulo 1

En el Módulo 1, dominamos los conceptos básicos de AI Toolkit y creamos nuestro primer Agente en Python. Ahora vamos a potenciar tus agentes conectándolos con herramientas y servicios externos a través del revolucionario Model Context Protocol (MCP).

Piensa en esto como pasar de una calculadora básica a una computadora completa: tus agentes de IA ganarán la capacidad de:

  • 🌐 Navegar e interactuar con sitios web
  • 📁 Acceder y manipular archivos
  • 🔧 Integrarse con sistemas empresariales
  • 📊 Procesar datos en tiempo real desde APIs

🧠 Entendiendo el Model Context Protocol (MCP)

🔍 ¿Qué es MCP?

Model Context Protocol (MCP) es el "USB-C para aplicaciones de IA": un estándar abierto revolucionario que conecta Modelos de Lenguaje Grandes (LLMs) con herramientas externas, fuentes de datos y servicios. Así como USB-C eliminó el caos de cables al ofrecer un conector universal, MCP elimina la complejidad de integración en IA con un protocolo estandarizado.

🎯 El Problema que Resuelve MCP

Antes de MCP:

  • 🔧 Integraciones personalizadas para cada herramienta
  • 🔄 Dependencia de proveedores con soluciones propietarias
  • 🔒 Vulnerabilidades de seguridad por conexiones improvisadas
  • ⏱️ Meses de desarrollo para integraciones básicas

Con MCP:

  • ⚡ Integración de herramientas plug-and-play
  • 🔄 Arquitectura independiente de proveedores
  • 🛡️ Mejores prácticas de seguridad integradas
  • 🚀 Minutos para agregar nuevas capacidades

🏗️ Profundizando en la Arquitectura MCP

MCP sigue una arquitectura cliente-servidor que crea un ecosistema seguro y escalable:

graph TB
    A[AI Application/Agent] --> B[MCP Client]
    B --> C[MCP Server 1: Files]
    B --> D[MCP Server 2: Web APIs]
    B --> E[MCP Server 3: Database]
    B --> F[MCP Server N: Custom Tools]
    
    C --> G[Local File System]
    D --> H[External APIs]
    E --> I[Database Systems]
    F --> J[Enterprise Systems]
Loading

🔧 Componentes Clave:

Componente Función Ejemplos
MCP Hosts Aplicaciones que consumen servicios MCP Claude Desktop, VS Code, AI Toolkit
MCP Clients Manejadores del protocolo (1:1 con servidores) Integrados en las aplicaciones host
MCP Servers Exponen capacidades vía protocolo estándar Playwright, Files, Azure, GitHub
Capa de Transporte Métodos de comunicación stdio, HTTP, WebSockets

🏢 Ecosistema de Servidores MCP de Microsoft

Microsoft lidera el ecosistema MCP con una suite completa de servidores empresariales que cubren necesidades reales de negocio.

🌟 Servidores MCP Destacados de Microsoft

1. ☁️ Azure MCP Server

🔗 Repositorio: azure/azure-mcp
🎯 Propósito: Gestión integral de recursos Azure con integración de IA

✨ Características Clave:

  • Provisión declarativa de infraestructura
  • Monitoreo de recursos en tiempo real
  • Recomendaciones para optimización de costos
  • Verificación de cumplimiento de seguridad

🚀 Casos de Uso:

  • Infraestructura como código con asistencia IA
  • Escalado automático de recursos
  • Optimización de costos en la nube
  • Automatización de flujos DevOps

2. 📊 Microsoft Dataverse MCP

📚 Documentación: Microsoft Dataverse Integration
🎯 Propósito: Interfaz en lenguaje natural para datos empresariales

✨ Características Clave:

  • Consultas a bases de datos en lenguaje natural
  • Comprensión del contexto empresarial
  • Plantillas personalizadas de prompts
  • Gobernanza de datos empresariales

🚀 Casos de Uso:

  • Reportes de inteligencia de negocio
  • Análisis de datos de clientes
  • Insights del pipeline de ventas
  • Consultas de datos para cumplimiento

3. 🌐 Playwright MCP Server

🔗 Repositorio: microsoft/playwright-mcp
🎯 Propósito: Automatización de navegador y capacidades de interacción web

✨ Características Clave:

  • Automatización multiplataforma (Chrome, Firefox, Safari)
  • Detección inteligente de elementos
  • Generación de capturas y PDFs
  • Monitoreo de tráfico de red

🚀 Casos de Uso:

  • Flujos de pruebas automatizadas
  • Web scraping y extracción de datos
  • Monitoreo de UI/UX
  • Automatización de análisis competitivo

4. 📁 Files MCP Server

🔗 Repositorio: microsoft/files-mcp-server
🎯 Propósito: Operaciones inteligentes sobre sistemas de archivos

✨ Características Clave:

  • Gestión declarativa de archivos
  • Sincronización de contenido
  • Integración con control de versiones
  • Extracción de metadatos

🚀 Casos de Uso:

  • Gestión documental
  • Organización de repositorios de código
  • Flujos de publicación de contenido
  • Manejo de archivos en pipelines de datos

5. 📝 MarkItDown MCP Server

🔗 Repositorio: microsoft/markitdown
🎯 Propósito: Procesamiento y manipulación avanzada de Markdown

✨ Características Clave:

  • Análisis enriquecido de Markdown
  • Conversión de formatos (MD ↔ HTML ↔ PDF)
  • Análisis de estructura de contenido
  • Procesamiento de plantillas

🚀 Casos de Uso:

  • Flujos de trabajo de documentación técnica
  • Sistemas de gestión de contenido
  • Generación de reportes
  • Automatización de bases de conocimiento

6. 📈 Clarity MCP Server

📦 Paquete: @microsoft/clarity-mcp-server
🎯 Propósito: Analítica web y análisis del comportamiento de usuarios

✨ Características Clave:

  • Análisis de mapas de calor
  • Grabaciones de sesiones de usuario
  • Métricas de rendimiento
  • Análisis de embudos de conversión

🚀 Casos de Uso:

  • Optimización de sitios web
  • Investigación de experiencia de usuario
  • Análisis de pruebas A/B
  • Dashboards de inteligencia de negocio

🌍 Ecosistema Comunitario

Más allá de los servidores de Microsoft, el ecosistema MCP incluye:

  • 🐙 GitHub MCP: Gestión de repositorios y análisis de código
  • 🗄️ MCPs para Bases de Datos: Integraciones con PostgreSQL, MySQL, MongoDB
  • ☁️ MCPs de Proveedores Cloud: Herramientas para AWS, GCP, Digital Ocean
  • 📧 MCPs de Comunicación: Integraciones con Slack, Teams, Email

🛠️ Laboratorio Práctico: Construyendo un Agente de Automatización de Navegador

🎯 Objetivo del Proyecto: Crear un agente inteligente de automatización de navegador usando el servidor Playwright MCP que pueda navegar sitios web, extraer información y realizar interacciones web complejas.

🚀 Fase 1: Configuración Inicial del Agente

Paso 1: Inicializa tu Agente

  1. Abre AI Toolkit Agent Builder
  2. Crea un Nuevo Agente con la siguiente configuración:
    • Nombre: BrowserAgent
    • Modelo: Selecciona GPT-4o

BrowserAgent

🔧 Fase 2: Flujo de Integración MCP

Paso 3: Añadir Integración de Servidor MCP

  1. Ve a la Sección de Herramientas en Agent Builder
  2. Haz clic en "Add Tool" para abrir el menú de integraciones
  3. Selecciona "MCP Server" de las opciones disponibles

AddMCP

🔍 Entendiendo los Tipos de Herramientas:

  • Herramientas Integradas: Funciones preconfiguradas de AI Toolkit
  • Servidores MCP: Integraciones con servicios externos
  • APIs Personalizadas: Tus propios endpoints de servicio
  • Llamadas a Funciones: Acceso directo a funciones del modelo

Paso 4: Selección del Servidor MCP

  1. Elige la opción "MCP Server" para continuar
    AddMCPServer

  2. Explora el Catálogo MCP para ver las integraciones disponibles
    MCPCatalog

🎮 Fase 3: Configuración de Playwright MCP

Paso 5: Selecciona y Configura Playwright

  1. Haz clic en "Use Featured MCP Servers" para acceder a los servidores verificados por Microsoft
  2. Selecciona "Playwright" de la lista destacada
  3. Acepta el ID MCP por defecto o personalízalo para tu entorno

MCPID

Paso 6: Habilita las Capacidades de Playwright

🔑 Paso Crítico: Selecciona TODOS los métodos disponibles de Playwright para máxima funcionalidad

Tools

🛠️ Herramientas Esenciales de Playwright:

  • Navegación: goto, goBack, goForward, reload
  • Interacción: click, fill, press, hover, drag
  • Extracción: textContent, innerHTML, getAttribute
  • Validación: isVisible, isEnabled, waitForSelector
  • Captura: screenshot, pdf, video
  • Red: setExtraHTTPHeaders, route, waitForResponse

Paso 7: Verifica el Éxito de la Integración

✅ Indicadores de Éxito:

  • Todas las herramientas aparecen en la interfaz de Agent Builder
  • No hay mensajes de error en el panel de integración
  • El estado del servidor Playwright muestra "Connected"

AgentTools

🔧 Solución de Problemas Comunes:

  • Fallo de Conexión: Verifica la conexión a internet y la configuración del firewall
  • Herramientas Faltantes: Asegúrate de haber seleccionado todas las capacidades durante la configuración
  • Errores de Permisos: Confirma que VS Code tiene los permisos necesarios en el sistema

🎯 Fase 4: Ingeniería Avanzada de Prompts

Paso 8: Diseña Prompts Inteligentes para el Sistema

Crea prompts sofisticados que aprovechen todas las capacidades de Playwright:

# Web Automation Expert System Prompt

## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.

## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively

### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors

### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios

### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered

## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of service

Paso 9: Crea Prompts Dinámicos para el Usuario

Diseña prompts que demuestren diversas capacidades:

🌐 Ejemplo de Análisis Web:

Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns  
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes

Include screenshots at key steps and provide actionable insights.

Prompt

🚀 Fase 5: Ejecución y Pruebas

Paso 10: Ejecuta tu Primera Automatización

  1. Haz clic en "Run" para iniciar la secuencia de automatización
  2. Monitorea la Ejecución en Tiempo Real:
    • El navegador Chrome se abre automáticamente
    • El agente navega al sitio web objetivo
    • Se capturan capturas de pantalla en cada paso importante
    • Los resultados del análisis se transmiten en tiempo real

Browser

Paso 11: Analiza Resultados e Insights

Revisa el análisis completo en la interfaz de Agent Builder:

Result

🌟 Fase 6: Capacidades Avanzadas y Despliegue

Paso 12: Exporta y Despliega en Producción

Agent Builder soporta múltiples opciones de despliegue:

Code

🎓 Resumen del Módulo 2 y Próximos Pasos

🏆 Logro Desbloqueado: Maestro en Integración MCP

✅ Habilidades Dominadas:

  • Comprender la arquitectura y beneficios de MCP
  • Navegar el ecosistema de servidores MCP de Microsoft
  • Integrar Playwright MCP con AI Toolkit
  • Construir agentes sofisticados de automatización de navegador
  • Ingeniería avanzada de prompts para automatización web

📚 Recursos Adicionales

🎉 ¡Felicidades! Has dominado con éxito la integración MCP y ahora puedes construir agentes de IA listos para producción con capacidades de herramientas externas.

🔜 Continúa al Siguiente Módulo

¿Listo para llevar tus habilidades MCP al siguiente nivel? Avanza a Módulo 3: Desarrollo Avanzado MCP con AI Toolkit donde aprenderás a:

  • Crear tus propios servidores MCP personalizados
  • Configurar y usar el último SDK MCP para Python
  • Configurar el MCP Inspector para depuración
  • Dominar flujos avanzados de desarrollo de servidores MCP
  • Construye un servidor Weather MCP desde cero

Aviso legal:
Este documento ha sido traducido utilizando el servicio de traducción automática Co-op Translator. Aunque nos esforzamos por la precisión, tenga en cuenta que las traducciones automáticas pueden contener errores o inexactitudes. El documento original en su idioma nativo debe considerarse la fuente autorizada. Para información crítica, se recomienda la traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas derivadas del uso de esta traducción.