Skip to content

Latest commit

 

History

History
370 lines (275 loc) · 21.1 KB

File metadata and controls

370 lines (275 loc) · 21.1 KB

🌐 Модуль 2: Основи MCP з AI Toolkit

Duration Difficulty Prerequisites

📋 Цілі навчання

До кінця цього модуля ви зможете:

  • ✅ Розуміти архітектуру та переваги Model Context Protocol (MCP)
  • ✅ Ознайомитись з екосистемою MCP серверів Microsoft
  • ✅ Інтегрувати MCP сервери з AI Toolkit Agent Builder
  • ✅ Створити функціонального агента для автоматизації браузера за допомогою Playwright MCP
  • ✅ Налаштовувати та тестувати MCP інструменти у ваших агентах
  • ✅ Експортувати та розгортати агентів на базі MCP для використання у виробництві

🎯 Розвиток на основі Модуля 1

У Модулі 1 ми опанували основи AI Toolkit і створили нашого першого Python агента. Тепер ми підсилюємо ваших агентів, підключаючи їх до зовнішніх інструментів і сервісів через революційний Model Context Protocol (MCP).

Уявіть це як оновлення з простого калькулятора до повноцінного комп’ютера — ваші AI агенти отримають можливість:

  • 🌐 Переглядати та взаємодіяти з вебсайтами
  • 📁 Доступатися та керувати файлами
  • 🔧 Інтегруватися з корпоративними системами
  • 📊 Обробляти дані в реальному часі з API

🧠 Розуміння Model Context Protocol (MCP)

🔍 Що таке MCP?

Model Context Protocol (MCP) — це «USB-C для AI-додатків» — революційний відкритий стандарт, який з’єднує великі мовні моделі (LLM) із зовнішніми інструментами, джерелами даних і сервісами. Як USB-C усунув хаос із кабелями, забезпечивши один універсальний роз’єм, так і MCP спрощує інтеграцію AI за допомогою одного стандартизованого протоколу.

🎯 Проблема, яку вирішує MCP

До MCP:

  • 🔧 Індивідуальні інтеграції для кожного інструменту
  • 🔄 Залежність від постачальника через пропрієтарні рішення
  • 🔒 Вразливості безпеки через випадкові з’єднання
  • ⏱️ Місяці розробки для базових інтеграцій

З MCP:

  • ⚡ Підключай і працюй — інтеграція інструментів без складнощів
  • 🔄 Архітектура, незалежна від постачальника
  • 🛡️ Вбудовані найкращі практики безпеки
  • 🚀 Хвилини на додавання нових можливостей

🏗️ Глибокий погляд на архітектуру MCP

MCP базується на клієнт-серверній архітектурі, що створює безпечну та масштабовану екосистему:

graph TB
    A[AI Application/Agent] --> B[MCP Client]
    B --> C[MCP Server 1: Files]
    B --> D[MCP Server 2: Web APIs]
    B --> E[MCP Server 3: Database]
    B --> F[MCP Server N: Custom Tools]
    
    C --> G[Local File System]
    D --> H[External APIs]
    E --> I[Database Systems]
    F --> J[Enterprise Systems]
Loading

🔧 Основні компоненти:

Компонент Роль Приклади
MCP Hosts Додатки, що використовують MCP сервіси Claude Desktop, VS Code, AI Toolkit
MCP Clients Обробники протоколу (1:1 із серверами) Вбудовані у хост-додатки
MCP Servers Надають можливості через стандартний протокол Playwright, Files, Azure, GitHub
Транспортний рівень Методи комунікації stdio, HTTP, WebSockets

🏢 Екосистема MCP серверів Microsoft

Microsoft очолює екосистему MCP, пропонуючи комплексний набір серверів корпоративного рівня, які вирішують реальні бізнес-завдання.

🌟 Основні MCP сервери Microsoft

1. ☁️ Azure MCP Server

🔗 Репозиторій: azure/azure-mcp 🎯 Призначення: Комплексне управління ресурсами Azure з AI інтеграцією

✨ Ключові можливості:

  • Декларативне розгортання інфраструктури
  • Моніторинг ресурсів у реальному часі
  • Рекомендації з оптимізації витрат
  • Перевірка відповідності безпеки

🚀 Варіанти використання:

  • Infrastructure-as-Code з AI підтримкою
  • Автоматичне масштабування ресурсів
  • Оптимізація витрат у хмарі
  • Автоматизація DevOps процесів

2. 📊 Microsoft Dataverse MCP

📚 Документація: Microsoft Dataverse Integration 🎯 Призначення: Інтерфейс природною мовою для бізнес-даних

✨ Ключові можливості:

  • Запити до бази даних природною мовою
  • Розуміння бізнес-контексту
  • Користувацькі шаблони запитів
  • Управління корпоративними даними

🚀 Варіанти використання:

  • Звіти бізнес-аналітики
  • Аналіз даних клієнтів
  • Інсайти для продажів
  • Запити для відповідності нормативам

3. 🌐 Playwright MCP Server

🔗 Репозиторій: microsoft/playwright-mcp 🎯 Призначення: Автоматизація браузера та взаємодія з вебом

✨ Ключові можливості:

  • Кросбраузерна автоматизація (Chrome, Firefox, Safari)
  • Інтелектуальне виявлення елементів
  • Генерація скріншотів і PDF
  • Моніторинг мережевого трафіку

🚀 Варіанти використання:

  • Автоматизоване тестування
  • Веб-скрапінг та вилучення даних
  • Моніторинг UI/UX
  • Автоматизація конкурентного аналізу

4. 📁 Files MCP Server

🔗 Репозиторій: microsoft/files-mcp-server 🎯 Призначення: Інтелектуальні операції з файловою системою

✨ Ключові можливості:

  • Декларативне керування файлами
  • Синхронізація вмісту
  • Інтеграція з системами контролю версій
  • Витяг метаданих

🚀 Варіанти використання:

  • Управління документацією
  • Організація репозиторіїв коду
  • Робочі процеси публікації контенту
  • Обробка файлів у дата-пайплайнах

5. 📝 MarkItDown MCP Server

🔗 Репозиторій: microsoft/markitdown 🎯 Призначення: Розширена обробка та маніпуляції Markdown

✨ Ключові можливості:

  • Потужний парсинг Markdown
  • Конвертація форматів (MD ↔ HTML ↔ PDF)
  • Аналіз структури контенту
  • Обробка шаблонів

🚀 Варіанти використання:

  • Робочі процеси технічної документації
  • Системи управління контентом
  • Генерація звітів
  • Автоматизація баз знань

6. 📈 Clarity MCP Server

📦 Пакет: @microsoft/clarity-mcp-server 🎯 Призначення: Веб-аналітика та інсайти про поведінку користувачів

✨ Ключові можливості:

  • Аналіз теплових карт
  • Записи сесій користувачів
  • Метрики продуктивності
  • Аналіз конверсійних воронок

🚀 Варіанти використання:

  • Оптимізація вебсайтів
  • Дослідження користувацького досвіду
  • Аналіз A/B тестів
  • Панелі бізнес-аналітики

🌍 Екосистема спільноти

Окрім серверів Microsoft, екосистема MCP включає:

  • 🐙 GitHub MCP: Управління репозиторіями та аналіз коду
  • 🗄️ MCP для баз даних: Інтеграції з PostgreSQL, MySQL, MongoDB
  • ☁️ MCP для хмарних провайдерів: Інструменти AWS, GCP, Digital Ocean
  • 📧 MCP для комунікацій: Інтеграції зі Slack, Teams, Email

🛠️ Практична лабораторія: Створення агента для автоматизації браузера

🎯 Мета проекту: Створити інтелектуального агента для автоматизації браузера з використанням Playwright MCP server, який зможе переходити на сайти, витягувати інформацію та виконувати складні веб-взаємодії.

🚀 Фаза 1: Налаштування основ агента

Крок 1: Ініціалізація агента

  1. Відкрийте AI Toolkit Agent Builder
  2. Створіть нового агента з такими налаштуваннями:
    • Ім’я: BrowserAgent
    • Модель: Оберіть GPT-4o

BrowserAgent

🔧 Фаза 2: Робочий процес інтеграції MCP

Крок 3: Додайте інтеграцію MCP Server

  1. Перейдіть до розділу Tools в Agent Builder
  2. Натисніть "Add Tool", щоб відкрити меню інтеграцій
  3. Виберіть "MCP Server" зі списку доступних опцій

AddMCP

🔍 Розуміння типів інструментів:

  • Вбудовані інструменти: Попередньо налаштовані функції AI Toolkit
  • MCP Servers: Інтеграції зовнішніх сервісів
  • Custom APIs: Ваші власні кінцеві точки сервісів
  • Function Calling: Прямий виклик функцій моделі

Крок 4: Вибір MCP Server

  1. Оберіть опцію "MCP Server" для продовження AddMCPServer

  2. Перегляньте каталог MCP для ознайомлення з доступними інтеграціями MCPCatalog

🎮 Фаза 3: Налаштування Playwright MCP

Крок 5: Вибір і налаштування Playwright

  1. Натисніть "Use Featured MCP Servers", щоб отримати доступ до перевірених серверів Microsoft
  2. Оберіть "Playwright" зі списку
  3. Прийміть стандартний MCP ID або налаштуйте під своє середовище

MCPID

Крок 6: Активуйте можливості Playwright

🔑 Важливий крок: Виберіть ВСІ доступні методи Playwright для максимальної функціональності

Tools

🛠️ Основні інструменти Playwright:

  • Навігація: goto, goBack, goForward, reload
  • Взаємодія: click, fill, press, hover, drag
  • Витяг: textContent, innerHTML, getAttribute
  • Перевірка: isVisible, isEnabled, waitForSelector
  • Захоплення: screenshot, pdf, video
  • Мережа: setExtraHTTPHeaders, route, waitForResponse

Крок 7: Перевірка успішності інтеграції

✅ Ознаки успіху:

  • Всі інструменти відображаються в інтерфейсі Agent Builder
  • Відсутність повідомлень про помилки в панелі інтеграції
  • Статус сервера Playwright показує "Connected"

AgentTools

🔧 Вирішення поширених проблем:

  • Не вдається підключитись: Перевірте інтернет-з’єднання та налаштування брандмауера
  • Відсутні інструменти: Переконайтесь, що всі можливості були вибрані під час налаштування
  • Помилки дозволів: Перевірте, чи має VS Code необхідні системні дозволи

🎯 Фаза 4: Розширене створення підказок

Крок 8: Створення інтелектуальних системних підказок

Розробіть складні підказки, що використовують повний потенціал Playwright:

# Web Automation Expert System Prompt

## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.

## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively

### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors

### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios

### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered

## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of service

Крок 9: Створення динамічних користувацьких підказок

Розробіть підказки, які демонструють різні можливості:

🌐 Приклад веб-аналізу:

Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns  
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes

Include screenshots at key steps and provide actionable insights.

Prompt

🚀 Фаза 5: Виконання та тестування

Крок 10: Запуск першої автоматизації

  1. Натисніть "Run", щоб запустити послідовність автоматизації
  2. Слідкуйте за виконанням у реальному часі:
    • Автоматично запускається браузер Chrome
    • Агент переходить на цільовий сайт
    • Кожен ключовий крок фіксується скріншотами
    • Результати аналізу надходять у реальному часі

Browser

Крок 11: Аналіз результатів та інсайтів

Огляньте детальний аналіз у інтерфейсі Agent Builder:

Result

🌟 Фаза 6: Розширені можливості та розгортання

Крок 12: Експорт і розгортання у виробництві

Agent Builder підтримує кілька варіантів розгортання:

Code

🎓 Підсумок Модуля 2 та подальші кроки

🏆 Досягнення: Майстер інтеграції MCP

✅ Опановані навички:

  • Розуміння архітектури та переваг MCP
  • Орієнтування в екосистемі MCP серверів Microsoft
  • Інтеграція Playwright MCP з AI Toolkit
  • Створення складних агентів для автоматизації браузера
  • Розширене створення підказок для веб-автоматизації

📚 Додаткові ресурси

🎉 Вітаємо! Ви успішно опанували інтеграцію MCP і тепер можете створювати AI агентів, готових до виробничого використання з підтримкою зовнішніх інструментів!

🔜 Продовжуйте до наступного модуля

Готові підняти свої навички MCP на новий рівень? Перейдіть до **[Модуль 3: Розширена розробка MCP з AI Toolkit](

  • Створення Weather MCP Server з нуля

Відмова від відповідальності:
Цей документ було перекладено за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ рідною мовою слід вважати авторитетним джерелом. Для критично важливої інформації рекомендується звертатися до професійного людського перекладу. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникли внаслідок використання цього перекладу.