🌐 Módulo 2: Fundamentos de MCP con AI Toolkit

📋 Objetivos de Aprendizaje

Al finalizar este módulo, podrás:

✅ Comprender la arquitectura y beneficios del Model Context Protocol (MCP)
✅ Explorar el ecosistema de servidores MCP de Microsoft
✅ Integrar servidores MCP con AI Toolkit Agent Builder
✅ Construir un agente funcional de automatización de navegador usando Playwright MCP
✅ Configurar y probar herramientas MCP dentro de tus agentes
✅ Exportar y desplegar agentes potenciados con MCP para uso en producción

🎯 Continuando desde el Módulo 1

En el Módulo 1, dominamos los conceptos básicos de AI Toolkit y creamos nuestro primer Agente en Python. Ahora vamos a potenciar tus agentes conectándolos con herramientas y servicios externos a través del revolucionario Model Context Protocol (MCP).

Piensa en esto como pasar de una calculadora básica a una computadora completa: tus agentes de IA ganarán la capacidad de:

🌐 Navegar e interactuar con sitios web
📁 Acceder y manipular archivos
🔧 Integrarse con sistemas empresariales
📊 Procesar datos en tiempo real desde APIs

🧠 Entendiendo el Model Context Protocol (MCP)

🔍 ¿Qué es MCP?

Model Context Protocol (MCP) es el "USB-C para aplicaciones de IA": un estándar abierto revolucionario que conecta Modelos de Lenguaje Grandes (LLMs) con herramientas externas, fuentes de datos y servicios. Así como USB-C eliminó el caos de cables al ofrecer un conector universal, MCP elimina la complejidad de integración en IA con un protocolo estandarizado.

🎯 El Problema que Resuelve MCP

Antes de MCP:

🔧 Integraciones personalizadas para cada herramienta
🔄 Dependencia de proveedores con soluciones propietarias
🔒 Vulnerabilidades de seguridad por conexiones improvisadas
⏱️ Meses de desarrollo para integraciones básicas

Con MCP:

⚡ Integración de herramientas plug-and-play
🔄 Arquitectura independiente de proveedores
🛡️ Mejores prácticas de seguridad integradas
🚀 Minutos para agregar nuevas capacidades

🏗️ Profundizando en la Arquitectura MCP

MCP sigue una arquitectura cliente-servidor que crea un ecosistema seguro y escalable:

graph TB
    A[AI Application/Agent] --> B[MCP Client]
    B --> C[MCP Server 1: Files]
    B --> D[MCP Server 2: Web APIs]
    B --> E[MCP Server 3: Database]
    B --> F[MCP Server N: Custom Tools]
    
    C --> G[Local File System]
    D --> H[External APIs]
    E --> I[Database Systems]
    F --> J[Enterprise Systems]

🔧 Componentes Clave:

Componente	Función	Ejemplos
MCP Hosts	Aplicaciones que consumen servicios MCP	Claude Desktop, VS Code, AI Toolkit
MCP Clients	Manejadores del protocolo (1:1 con servidores)	Integrados en las aplicaciones host
MCP Servers	Exponen capacidades vía protocolo estándar	Playwright, Files, Azure, GitHub
Capa de Transporte	Métodos de comunicación	stdio, HTTP, WebSockets

🏢 Ecosistema de Servidores MCP de Microsoft

Microsoft lidera el ecosistema MCP con una suite completa de servidores empresariales que cubren necesidades reales de negocio.

🌟 Servidores MCP Destacados de Microsoft

1. ☁️ Azure MCP Server

🔗 Repositorio: azure/azure-mcp
🎯 Propósito: Gestión integral de recursos Azure con integración de IA

✨ Características Clave:

Provisión declarativa de infraestructura
Monitoreo de recursos en tiempo real
Recomendaciones para optimización de costos
Verificación de cumplimiento de seguridad

🚀 Casos de Uso:

Infraestructura como código con asistencia IA
Escalado automático de recursos
Optimización de costos en la nube
Automatización de flujos DevOps

2. 📊 Microsoft Dataverse MCP

📚 Documentación: Microsoft Dataverse Integration
🎯 Propósito: Interfaz en lenguaje natural para datos empresariales

✨ Características Clave:

Consultas a bases de datos en lenguaje natural
Comprensión del contexto empresarial
Plantillas personalizadas de prompts
Gobernanza de datos empresariales

🚀 Casos de Uso:

Reportes de inteligencia de negocio
Análisis de datos de clientes
Insights del pipeline de ventas
Consultas de datos para cumplimiento

3. 🌐 Playwright MCP Server

🔗 Repositorio: microsoft/playwright-mcp
🎯 Propósito: Automatización de navegador y capacidades de interacción web

✨ Características Clave:

Automatización multiplataforma (Chrome, Firefox, Safari)
Detección inteligente de elementos
Generación de capturas y PDFs
Monitoreo de tráfico de red

🚀 Casos de Uso:

Flujos de pruebas automatizadas
Web scraping y extracción de datos
Monitoreo de UI/UX
Automatización de análisis competitivo

4. 📁 Files MCP Server

🔗 Repositorio: microsoft/files-mcp-server
🎯 Propósito: Operaciones inteligentes sobre sistemas de archivos

✨ Características Clave:

Gestión declarativa de archivos
Sincronización de contenido
Integración con control de versiones
Extracción de metadatos

🚀 Casos de Uso:

Gestión documental
Organización de repositorios de código
Flujos de publicación de contenido
Manejo de archivos en pipelines de datos

5. 📝 MarkItDown MCP Server

🔗 Repositorio: microsoft/markitdown
🎯 Propósito: Procesamiento y manipulación avanzada de Markdown

✨ Características Clave:

Análisis enriquecido de Markdown
Conversión de formatos (MD ↔ HTML ↔ PDF)
Análisis de estructura de contenido
Procesamiento de plantillas

🚀 Casos de Uso:

Flujos de trabajo de documentación técnica
Sistemas de gestión de contenido
Generación de reportes
Automatización de bases de conocimiento

6. 📈 Clarity MCP Server

📦 Paquete: @microsoft/clarity-mcp-server
🎯 Propósito: Analítica web y análisis del comportamiento de usuarios

✨ Características Clave:

Análisis de mapas de calor
Grabaciones de sesiones de usuario
Métricas de rendimiento
Análisis de embudos de conversión

🚀 Casos de Uso:

Optimización de sitios web
Investigación de experiencia de usuario
Análisis de pruebas A/B
Dashboards de inteligencia de negocio

🌍 Ecosistema Comunitario

Más allá de los servidores de Microsoft, el ecosistema MCP incluye:

🐙 GitHub MCP: Gestión de repositorios y análisis de código
🗄️ MCPs para Bases de Datos: Integraciones con PostgreSQL, MySQL, MongoDB
☁️ MCPs de Proveedores Cloud: Herramientas para AWS, GCP, Digital Ocean
📧 MCPs de Comunicación: Integraciones con Slack, Teams, Email

🛠️ Laboratorio Práctico: Construyendo un Agente de Automatización de Navegador

🎯 Objetivo del Proyecto: Crear un agente inteligente de automatización de navegador usando el servidor Playwright MCP que pueda navegar sitios web, extraer información y realizar interacciones web complejas.

🚀 Fase 1: Configuración Inicial del Agente

Paso 1: Inicializa tu Agente

Abre AI Toolkit Agent Builder
Crea un Nuevo Agente con la siguiente configuración:
- Nombre: BrowserAgent
- Modelo: Selecciona GPT-4o

🔧 Fase 2: Flujo de Integración MCP

Paso 3: Añadir Integración de Servidor MCP

Ve a la Sección de Herramientas en Agent Builder
Haz clic en "Add Tool" para abrir el menú de integraciones
Selecciona "MCP Server" de las opciones disponibles

🔍 Entendiendo los Tipos de Herramientas:

Herramientas Integradas: Funciones preconfiguradas de AI Toolkit
Servidores MCP: Integraciones con servicios externos
APIs Personalizadas: Tus propios endpoints de servicio
Llamadas a Funciones: Acceso directo a funciones del modelo

Paso 4: Selección del Servidor MCP

Elige la opción "MCP Server" para continuar
Explora el Catálogo MCP para ver las integraciones disponibles

🎮 Fase 3: Configuración de Playwright MCP

Paso 5: Selecciona y Configura Playwright

Haz clic en "Use Featured MCP Servers" para acceder a los servidores verificados por Microsoft
Selecciona "Playwright" de la lista destacada
Acepta el ID MCP por defecto o personalízalo para tu entorno

Paso 6: Habilita las Capacidades de Playwright

🔑 Paso Crítico: Selecciona TODOS los métodos disponibles de Playwright para máxima funcionalidad

🛠️ Herramientas Esenciales de Playwright:

Navegación: goto, goBack, goForward, reload
Interacción: click, fill, press, hover, drag
Extracción: textContent, innerHTML, getAttribute
Validación: isVisible, isEnabled, waitForSelector
Captura: screenshot, pdf, video
Red: setExtraHTTPHeaders, route, waitForResponse

Paso 7: Verifica el Éxito de la Integración

✅ Indicadores de Éxito:

Todas las herramientas aparecen en la interfaz de Agent Builder
No hay mensajes de error en el panel de integración
El estado del servidor Playwright muestra "Connected"

🔧 Solución de Problemas Comunes:

Fallo de Conexión: Verifica la conexión a internet y la configuración del firewall
Herramientas Faltantes: Asegúrate de haber seleccionado todas las capacidades durante la configuración
Errores de Permisos: Confirma que VS Code tiene los permisos necesarios en el sistema

🎯 Fase 4: Ingeniería Avanzada de Prompts

Paso 8: Diseña Prompts Inteligentes para el Sistema

Crea prompts sofisticados que aprovechen todas las capacidades de Playwright:

# Web Automation Expert System Prompt

## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.

## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively

### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors

### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios

### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered

## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of service

Paso 9: Crea Prompts Dinámicos para el Usuario

Diseña prompts que demuestren diversas capacidades:

🌐 Ejemplo de Análisis Web:

Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns  
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes

Include screenshots at key steps and provide actionable insights.

🚀 Fase 5: Ejecución y Pruebas

Paso 10: Ejecuta tu Primera Automatización

Haz clic en "Run" para iniciar la secuencia de automatización
Monitorea la Ejecución en Tiempo Real:
- El navegador Chrome se abre automáticamente
- El agente navega al sitio web objetivo
- Se capturan capturas de pantalla en cada paso importante
- Los resultados del análisis se transmiten en tiempo real

Paso 11: Analiza Resultados e Insights

Revisa el análisis completo en la interfaz de Agent Builder:

🌟 Fase 6: Capacidades Avanzadas y Despliegue

Paso 12: Exporta y Despliega en Producción

Agent Builder soporta múltiples opciones de despliegue:

🎓 Resumen del Módulo 2 y Próximos Pasos

🏆 Logro Desbloqueado: Maestro en Integración MCP

✅ Habilidades Dominadas:

Comprender la arquitectura y beneficios de MCP
Navegar el ecosistema de servidores MCP de Microsoft
Integrar Playwright MCP con AI Toolkit
Construir agentes sofisticados de automatización de navegador
Ingeniería avanzada de prompts para automatización web

📚 Recursos Adicionales

🔗 Especificación MCP: Documentación Oficial del Protocolo
🛠️ API de Playwright: Referencia Completa de Métodos
🏢 Servidores MCP de Microsoft: Guía de Integración Empresarial
🌍 Ejemplos Comunitarios: Galería de Servidores MCP

🎉 ¡Felicidades! Has dominado con éxito la integración MCP y ahora puedes construir agentes de IA listos para producción con capacidades de herramientas externas.

🔜 Continúa al Siguiente Módulo

¿Listo para llevar tus habilidades MCP al siguiente nivel? Avanza a Módulo 3: Desarrollo Avanzado MCP con AI Toolkit donde aprenderás a:

Crear tus propios servidores MCP personalizados
Configurar y usar el último SDK MCP para Python
Configurar el MCP Inspector para depuración
Dominar flujos avanzados de desarrollo de servidores MCP
Construye un servidor Weather MCP desde cero

Aviso legal:
Este documento ha sido traducido utilizando el servicio de traducción automática Co-op Translator. Aunque nos esforzamos por la precisión, tenga en cuenta que las traducciones automáticas pueden contener errores o inexactitudes. El documento original en su idioma nativo debe considerarse la fuente autorizada. Para información crítica, se recomienda la traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas derivadas del uso de esta traducción.

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

🌐 Módulo 2: Fundamentos de MCP con AI Toolkit

📋 Objetivos de Aprendizaje

🎯 Continuando desde el Módulo 1

🧠 Entendiendo el Model Context Protocol (MCP)

🔍 ¿Qué es MCP?

🎯 El Problema que Resuelve MCP

🏗️ Profundizando en la Arquitectura MCP

🏢 Ecosistema de Servidores MCP de Microsoft

🌟 Servidores MCP Destacados de Microsoft

1. ☁️ Azure MCP Server

2. 📊 Microsoft Dataverse MCP

3. 🌐 Playwright MCP Server

4. 📁 Files MCP Server

5. 📝 MarkItDown MCP Server

6. 📈 Clarity MCP Server

🌍 Ecosistema Comunitario

🛠️ Laboratorio Práctico: Construyendo un Agente de Automatización de Navegador

🚀 Fase 1: Configuración Inicial del Agente

Paso 1: Inicializa tu Agente

🔧 Fase 2: Flujo de Integración MCP

Paso 3: Añadir Integración de Servidor MCP

Paso 4: Selección del Servidor MCP

🎮 Fase 3: Configuración de Playwright MCP

Paso 5: Selecciona y Configura Playwright

Paso 6: Habilita las Capacidades de Playwright

Paso 7: Verifica el Éxito de la Integración

🎯 Fase 4: Ingeniería Avanzada de Prompts

Paso 8: Diseña Prompts Inteligentes para el Sistema

Paso 9: Crea Prompts Dinámicos para el Usuario

🚀 Fase 5: Ejecución y Pruebas

Paso 10: Ejecuta tu Primera Automatización

Paso 11: Analiza Resultados e Insights

🌟 Fase 6: Capacidades Avanzadas y Despliegue

Paso 12: Exporta y Despliega en Producción

🎓 Resumen del Módulo 2 y Próximos Pasos

🏆 Logro Desbloqueado: Maestro en Integración MCP

📚 Recursos Adicionales

🔜 Continúa al Siguiente Módulo