Al finalizar este módulo, podrás:
- ✅ Comprender la arquitectura y beneficios del Model Context Protocol (MCP)
- ✅ Explorar el ecosistema de servidores MCP de Microsoft
- ✅ Integrar servidores MCP con AI Toolkit Agent Builder
- ✅ Construir un agente funcional de automatización de navegador usando Playwright MCP
- ✅ Configurar y probar herramientas MCP dentro de tus agentes
- ✅ Exportar y desplegar agentes potenciados con MCP para uso en producción
En el Módulo 1, dominamos los conceptos básicos de AI Toolkit y creamos nuestro primer Agente en Python. Ahora vamos a potenciar tus agentes conectándolos con herramientas y servicios externos a través del revolucionario Model Context Protocol (MCP).
Piensa en esto como pasar de una calculadora básica a una computadora completa: tus agentes de IA ganarán la capacidad de:
- 🌐 Navegar e interactuar con sitios web
- 📁 Acceder y manipular archivos
- 🔧 Integrarse con sistemas empresariales
- 📊 Procesar datos en tiempo real desde APIs
Model Context Protocol (MCP) es el "USB-C para aplicaciones de IA": un estándar abierto revolucionario que conecta Modelos de Lenguaje Grandes (LLMs) con herramientas externas, fuentes de datos y servicios. Así como USB-C eliminó el caos de cables al ofrecer un conector universal, MCP elimina la complejidad de integración en IA con un protocolo estandarizado.
Antes de MCP:
- 🔧 Integraciones personalizadas para cada herramienta
- 🔄 Dependencia de proveedores con soluciones propietarias
- 🔒 Vulnerabilidades de seguridad por conexiones improvisadas
- ⏱️ Meses de desarrollo para integraciones básicas
Con MCP:
- ⚡ Integración de herramientas plug-and-play
- 🔄 Arquitectura independiente de proveedores
- 🛡️ Mejores prácticas de seguridad integradas
- 🚀 Minutos para agregar nuevas capacidades
MCP sigue una arquitectura cliente-servidor que crea un ecosistema seguro y escalable:
graph TB
A[AI Application/Agent] --> B[MCP Client]
B --> C[MCP Server 1: Files]
B --> D[MCP Server 2: Web APIs]
B --> E[MCP Server 3: Database]
B --> F[MCP Server N: Custom Tools]
C --> G[Local File System]
D --> H[External APIs]
E --> I[Database Systems]
F --> J[Enterprise Systems]
🔧 Componentes Clave:
| Componente | Función | Ejemplos |
|---|---|---|
| MCP Hosts | Aplicaciones que consumen servicios MCP | Claude Desktop, VS Code, AI Toolkit |
| MCP Clients | Manejadores del protocolo (1:1 con servidores) | Integrados en las aplicaciones host |
| MCP Servers | Exponen capacidades vía protocolo estándar | Playwright, Files, Azure, GitHub |
| Capa de Transporte | Métodos de comunicación | stdio, HTTP, WebSockets |
Microsoft lidera el ecosistema MCP con una suite completa de servidores empresariales que cubren necesidades reales de negocio.
🔗 Repositorio: azure/azure-mcp
🎯 Propósito: Gestión integral de recursos Azure con integración de IA
✨ Características Clave:
- Provisión declarativa de infraestructura
- Monitoreo de recursos en tiempo real
- Recomendaciones para optimización de costos
- Verificación de cumplimiento de seguridad
🚀 Casos de Uso:
- Infraestructura como código con asistencia IA
- Escalado automático de recursos
- Optimización de costos en la nube
- Automatización de flujos DevOps
📚 Documentación: Microsoft Dataverse Integration
🎯 Propósito: Interfaz en lenguaje natural para datos empresariales
✨ Características Clave:
- Consultas a bases de datos en lenguaje natural
- Comprensión del contexto empresarial
- Plantillas personalizadas de prompts
- Gobernanza de datos empresariales
🚀 Casos de Uso:
- Reportes de inteligencia de negocio
- Análisis de datos de clientes
- Insights del pipeline de ventas
- Consultas de datos para cumplimiento
🔗 Repositorio: microsoft/playwright-mcp
🎯 Propósito: Automatización de navegador y capacidades de interacción web
✨ Características Clave:
- Automatización multiplataforma (Chrome, Firefox, Safari)
- Detección inteligente de elementos
- Generación de capturas y PDFs
- Monitoreo de tráfico de red
🚀 Casos de Uso:
- Flujos de pruebas automatizadas
- Web scraping y extracción de datos
- Monitoreo de UI/UX
- Automatización de análisis competitivo
🔗 Repositorio: microsoft/files-mcp-server
🎯 Propósito: Operaciones inteligentes sobre sistemas de archivos
✨ Características Clave:
- Gestión declarativa de archivos
- Sincronización de contenido
- Integración con control de versiones
- Extracción de metadatos
🚀 Casos de Uso:
- Gestión documental
- Organización de repositorios de código
- Flujos de publicación de contenido
- Manejo de archivos en pipelines de datos
🔗 Repositorio: microsoft/markitdown
🎯 Propósito: Procesamiento y manipulación avanzada de Markdown
✨ Características Clave:
- Análisis enriquecido de Markdown
- Conversión de formatos (MD ↔ HTML ↔ PDF)
- Análisis de estructura de contenido
- Procesamiento de plantillas
🚀 Casos de Uso:
- Flujos de trabajo de documentación técnica
- Sistemas de gestión de contenido
- Generación de reportes
- Automatización de bases de conocimiento
📦 Paquete: @microsoft/clarity-mcp-server
🎯 Propósito: Analítica web y análisis del comportamiento de usuarios
✨ Características Clave:
- Análisis de mapas de calor
- Grabaciones de sesiones de usuario
- Métricas de rendimiento
- Análisis de embudos de conversión
🚀 Casos de Uso:
- Optimización de sitios web
- Investigación de experiencia de usuario
- Análisis de pruebas A/B
- Dashboards de inteligencia de negocio
Más allá de los servidores de Microsoft, el ecosistema MCP incluye:
- 🐙 GitHub MCP: Gestión de repositorios y análisis de código
- 🗄️ MCPs para Bases de Datos: Integraciones con PostgreSQL, MySQL, MongoDB
- ☁️ MCPs de Proveedores Cloud: Herramientas para AWS, GCP, Digital Ocean
- 📧 MCPs de Comunicación: Integraciones con Slack, Teams, Email
🎯 Objetivo del Proyecto: Crear un agente inteligente de automatización de navegador usando el servidor Playwright MCP que pueda navegar sitios web, extraer información y realizar interacciones web complejas.
- Abre AI Toolkit Agent Builder
- Crea un Nuevo Agente con la siguiente configuración:
- Nombre:
BrowserAgent - Modelo: Selecciona GPT-4o
- Nombre:
- Ve a la Sección de Herramientas en Agent Builder
- Haz clic en "Add Tool" para abrir el menú de integraciones
- Selecciona "MCP Server" de las opciones disponibles
🔍 Entendiendo los Tipos de Herramientas:
- Herramientas Integradas: Funciones preconfiguradas de AI Toolkit
- Servidores MCP: Integraciones con servicios externos
- APIs Personalizadas: Tus propios endpoints de servicio
- Llamadas a Funciones: Acceso directo a funciones del modelo
- Haz clic en "Use Featured MCP Servers" para acceder a los servidores verificados por Microsoft
- Selecciona "Playwright" de la lista destacada
- Acepta el ID MCP por defecto o personalízalo para tu entorno
🔑 Paso Crítico: Selecciona TODOS los métodos disponibles de Playwright para máxima funcionalidad
🛠️ Herramientas Esenciales de Playwright:
- Navegación:
goto,goBack,goForward,reload - Interacción:
click,fill,press,hover,drag - Extracción:
textContent,innerHTML,getAttribute - Validación:
isVisible,isEnabled,waitForSelector - Captura:
screenshot,pdf,video - Red:
setExtraHTTPHeaders,route,waitForResponse
✅ Indicadores de Éxito:
- Todas las herramientas aparecen en la interfaz de Agent Builder
- No hay mensajes de error en el panel de integración
- El estado del servidor Playwright muestra "Connected"
🔧 Solución de Problemas Comunes:
- Fallo de Conexión: Verifica la conexión a internet y la configuración del firewall
- Herramientas Faltantes: Asegúrate de haber seleccionado todas las capacidades durante la configuración
- Errores de Permisos: Confirma que VS Code tiene los permisos necesarios en el sistema
Crea prompts sofisticados que aprovechen todas las capacidades de Playwright:
# Web Automation Expert System Prompt
## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.
## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively
### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors
### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios
### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered
## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of serviceDiseña prompts que demuestren diversas capacidades:
🌐 Ejemplo de Análisis Web:
Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes
Include screenshots at key steps and provide actionable insights.- Haz clic en "Run" para iniciar la secuencia de automatización
- Monitorea la Ejecución en Tiempo Real:
- El navegador Chrome se abre automáticamente
- El agente navega al sitio web objetivo
- Se capturan capturas de pantalla en cada paso importante
- Los resultados del análisis se transmiten en tiempo real
Revisa el análisis completo en la interfaz de Agent Builder:
Agent Builder soporta múltiples opciones de despliegue:
✅ Habilidades Dominadas:
- Comprender la arquitectura y beneficios de MCP
- Navegar el ecosistema de servidores MCP de Microsoft
- Integrar Playwright MCP con AI Toolkit
- Construir agentes sofisticados de automatización de navegador
- Ingeniería avanzada de prompts para automatización web
- 🔗 Especificación MCP: Documentación Oficial del Protocolo
- 🛠️ API de Playwright: Referencia Completa de Métodos
- 🏢 Servidores MCP de Microsoft: Guía de Integración Empresarial
- 🌍 Ejemplos Comunitarios: Galería de Servidores MCP
🎉 ¡Felicidades! Has dominado con éxito la integración MCP y ahora puedes construir agentes de IA listos para producción con capacidades de herramientas externas.
¿Listo para llevar tus habilidades MCP al siguiente nivel? Avanza a Módulo 3: Desarrollo Avanzado MCP con AI Toolkit donde aprenderás a:
- Crear tus propios servidores MCP personalizados
- Configurar y usar el último SDK MCP para Python
- Configurar el MCP Inspector para depuración
- Dominar flujos avanzados de desarrollo de servidores MCP
- Construye un servidor Weather MCP desde cero
Aviso legal:
Este documento ha sido traducido utilizando el servicio de traducción automática Co-op Translator. Aunque nos esforzamos por la precisión, tenga en cuenta que las traducciones automáticas pueden contener errores o inexactitudes. El documento original en su idioma nativo debe considerarse la fuente autorizada. Para información crítica, se recomienda la traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas derivadas del uso de esta traducción.










