快速手搓一个MCP服务指南（六）：FastMCP 中间件：构建可扩展的 MCP 服务器架构

在现代分布式系统中，中间件作为处理跨领域关注点的核心组件，已成为构建可扩展、可维护应用的关键技术。FastMCP 从 2.9.0 版本引入的中间件系统，为 MCP（Model Context Protocol）服务器提供了强大的扩展机制。本文将深入解析 MCP 中间件的设计理念、核心功能与实践应用，帮助开发者构建更健壮、更灵活的 MCP 服务。

喜欢吃豆

1151人浏览 · 2025-06-30 16:03:30

喜欢吃豆 · 2025-06-30 16:03:30 发布

中间件基础：跨领域功能的瑞士军刀

MCP 中间件是 FastMCP 特有的扩展机制，允许开发者在不修改核心逻辑的前提下，为服务器添加认证、日志、速率限制等跨领域功能。与传统 Web 中间件不同，MCP 中间件专门针对 MCP 协议设计，能够拦截工具调用、资源读取、提示获取等各类 MCP 操作。

核心设计理念

MCP 中间件采用管道-过滤器模式，请求进入服务器后会依次经过每个中间件的处理，形成一条处理链：

拦截与修改：中间件可在请求处理前（前置处理）和响应返回前（后置处理）拦截数据
责任链模式：每个中间件决定是否继续传递请求或终止处理
关注点分离：将认证、监控等非业务逻辑与核心功能解耦

典型应用场景

中间件在 MCP 服务器中解决了一系列常见需求：

安全控制：基于令牌的认证授权、IP 白名单过滤
可观测性：请求日志记录、性能指标采集
流量管理：基于客户端的速率限制、突发流量控制
数据转换：请求参数校验、响应结果格式化
错误处理：统一异常转换、自动重试机制

中间件核心机制：从请求到响应的全流程控制

钩子系统：精准定位处理时机

FastMCP 中间件通过钩子函数实现对不同类型操作的精准拦截，钩子按粒度从通用到具体分为多个层级：

class MyMiddleware(Middleware):
    async def on_message(self, context: MiddlewareContext, call_next):
        """处理所有 MCP 消息（请求与通知）"""
        pass
    
    async def on_request(self, context: MiddlewareContext, call_next):
        """处理需要响应的请求"""
        pass
    
    async def on_call_tool(self, context: MiddlewareContext, call_next):
        """处理工具调用操作"""
        pass
    
    async def on_read_resource(self, context: MiddlewareContext, call_next):
        """处理资源读取操作"""
        pass

钩子执行顺序

当客户端调用工具时，中间件会按以下顺序触发多个钩子：

on_message（所有消息通用）
on_request（请求类型专用）
on_call_tool（工具调用专用）

这种层级设计允许开发者根据需求选择合适粒度的钩子：

on_message 用于全局日志记录
on_request 用于认证授权
操作专用钩子（如 on_call_tool）用于工具特定的监控

上下文对象：中间件的信息枢纽

每个钩子接收一个 MiddlewareContext 对象，包含请求的关键信息：

{
    "method": "tools/call",       # MCP 方法名
    "source": "client",           # 请求来源
    "type": "request",            # 消息类型
    "message": {"name": "my_tool"}, # MCP 消息数据
    "timestamp": 1689001234.567,  # 接收时间戳
    "fastmcp_context": FastMCPContext  # FastMCP 上下文
}

通过上下文对象，中间件可以：

访问请求元数据
获取 FastMCP 服务器实例
在处理链中传递自定义数据

组件访问：操作与元数据的桥梁

中间件处理分为两类操作，采用不同的组件访问模式：

列表操作（如列出工具）

async def on_list_tools(self, context: MiddlewareContext, call_next):
    result = await call_next(context)
    # 直接访问工具对象及其元数据
    filtered_tools = {
        name: tool for name, tool in result.tools.items()
        if "public" in tool.tags
    }
    return ListToolsResult(tools=filtered_tools)

执行操作（如调用工具）

async def on_call_tool(self, context: MiddlewareContext, call_next):
    # 通过 FastMCP 上下文获取工具元数据
    tool = await context.fastmcp_context.fastmcp.get_tool(context.message.name)
    if "private" in tool.tags:
        raise ToolError("禁止访问私有工具")
    return await call_next(context)

中间件实践：从基础实现到高级应用

创建自定义中间件

构建中间件只需继承 Middleware 基类并覆盖相关钩子：

from fastmcp.server.middleware import Middleware, MiddlewareContext

class RequestLoggerMiddleware(Middleware):
    """记录所有 MCP 请求的中间件"""
    
    async def on_message(self, context: MiddlewareContext, call_next):
        print(f"[START] {context.method} from {context.source}")
        start_time = time.perf_counter()
        
        try:
            result = await call_next(context)
            duration = (time.perf_counter() - start_time) * 1000
            print(f"[END] {context.method} completed in {duration:.2f}ms")
            return result
        except Exception as e:
            duration = (time.perf_counter() - start_time) * 1000
            print(f"[ERROR] {context.method} failed in {duration:.2f}ms: {str(e)}")
            raise

添加中间件到服务器

中间件按添加顺序形成处理链，先添加的中间件先执行前置处理，后执行后置处理：

from fastmcp import FastMCP

mcp = FastMCP("MyServer")
# 认证中间件先执行
mcp.add_middleware(AuthenticationMiddleware())
# 日志中间件后执行
mcp.add_middleware(RequestLoggerMiddleware())

服务器组合中的中间件

当使用服务器组合（mount 或 import_server）时，中间件执行遵循以下规则：

父服务器中间件处理所有请求
子服务器中间件仅处理自身请求
保持各服务器内部中间件顺序

# 父服务器（全局认证）
parent = FastMCP("Parent")
parent.add_middleware(AuthenticationMiddleware())

# 子服务器（本地日志）
child = FastMCP("Child")
child.add_middleware(LoggingMiddleware())

# 挂载子服务器
parent.mount(child, prefix="child")

# 调用 child_tool 时，会先经过父的认证中间件，再经过子的日志中间件

内置中间件：FastMCP 提供的开箱即用解决方案

计时中间件：性能监控的基础

from fastmcp.server.middleware.timing import TimingMiddleware, DetailedTimingMiddleware

# 基础计时（所有请求）
mcp.add_middleware(TimingMiddleware())

# 详细计时（按操作类型）
mcp.add_middleware(DetailedTimingMiddleware())

日志中间件：请求追踪的利器

from fastmcp.server.middleware.logging import LoggingMiddleware, StructuredLoggingMiddleware

# 可读日志（包含负载）
mcp.add_middleware(LoggingMiddleware(include_payloads=True))

# 结构化 JSON 日志（适合日志聚合）
mcp.add_middleware(StructuredLoggingMiddleware())

速率限制中间件：流量控制的保障

from fastmcp.server.middleware.rate_limiting import RateLimitingMiddleware, SlidingWindowRateLimitingMiddleware

# 令牌桶算法（允许突发流量）
mcp.add_middleware(RateLimitingMiddleware(
    max_requests_per_second=10.0,
    burst_capacity=20
))

# 滑动窗口算法（精确时间控制）
mcp.add_middleware(SlidingWindowRateLimitingMiddleware(
    max_requests=100,
    window_minutes=1
))

错误处理中间件：稳定性的守护者

from fastmcp.server.middleware.error_handling import ErrorHandlingMiddleware, RetryMiddleware

# 统一错误处理与日志
mcp.add_middleware(ErrorHandlingMiddleware(
    include_traceback=True,
    transform_errors=True
))

# 自动重试机制
mcp.add_middleware(RetryMiddleware(
    max_retries=3,
    retry_exceptions=(ConnectionError, TimeoutError)
))

最佳实践：构建健壮的中间件架构

中间件顺序策略

合理的中间件顺序对系统行为至关重要：

错误处理优先：ErrorHandlingMiddleware 应放在最前面
安全控制次之：认证、授权中间件紧随其后
流量管理：速率限制中间件在安全之后
性能监控：计时中间件在业务处理前
日志记录：日志中间件放在最后执行后置处理

mcp = FastMCP("ProductionServer")
mcp.add_middleware(ErrorHandlingMiddleware())      # 错误处理优先
mcp.add_middleware(AuthenticationMiddleware())   # 认证
mcp.add_middleware(RateLimitingMiddleware())     # 速率限制
mcp.add_middleware(TimingMiddleware())           # 计时
mcp.add_middleware(LoggingMiddleware())          # 日志记录

性能优化建议

避免阻塞操作：中间件应使用 async/await 处理异步操作
负载过滤：对大负载请求可设置 max_payload_length
条件执行：通过 context.method 判断是否需要处理特定操作
缓存中间结果：对重复计算的结果进行缓存

开发调试技巧

中间件隔离：开发时逐个添加中间件，确保功能独立
日志分级：使用不同日志级别区分正常操作与异常
测试钩子：针对不同钩子编写单元测试
性能 profiling：使用 DetailedTimingMiddleware 定位瓶颈

高级应用：中间件的无限可能

自定义认证中间件

以下是一个结合 JWT 认证与权限检查的完整中间件示例：

import jwt
from fastmcp.server.middleware import Middleware, MiddlewareContext
from fastmcp.exceptions import ToolError

class JWTAuthenticationMiddleware(Middleware):
    def __init__(self, public_key):
        self.public_key = public_key
    
    async def on_request(self, context: MiddlewareContext, call_next):
        # 从请求头获取令牌
        auth_header = context.message.get("headers", {}).get("Authorization")
        if not auth_header or not auth_header.startswith("Bearer "):
            raise ToolError("未提供有效的认证令牌")
        
        token = auth_header.split(" ")[1]
        try:
            # 验证 JWT 令牌
            payload = jwt.decode(
                token, 
                self.public_key, 
                algorithms=["RS256"],
                audience="mcp-server"
            )
            # 将用户信息存入上下文
            context.fastmcp_context.user = payload
        except jwt.ExpiredSignatureError:
            raise ToolError("认证令牌已过期")
        except jwt.InvalidTokenError:
            raise ToolError("无效的认证令牌")
        
        # 检查工具访问权限
        tool_name = context.message.get("name")
        required_scope = f"tools:call:{tool_name}"
        if "scopes" not in payload or required_scope not in payload["scopes"]:
            raise ToolError("权限不足，无法调用此工具")
        
        return await call_next(context)

数据转换中间件

在微服务架构中，不同服务可能使用不同的数据格式，中间件可实现透明转换：

from fastmcp.server.middleware import Middleware, MiddlewareContext

class DataFormatMiddleware(Middleware):
    async def on_call_tool(self, context: MiddlewareContext, call_next):
        # 请求转换：JSON 到 XML
        if context.message.get("format") == "xml":
            context.message["params"] = self.json_to_xml(context.message["params"])
        
        result = await call_next(context)
        
        # 响应转换：XML 到 JSON
        if context.message.get("format") == "xml":
            result = self.xml_to_json(result)
        
        return result
    
    def json_to_xml(self, json_data):
        # JSON 转 XML 实现
        pass
    
    def xml_to_json(self, xml_data):
        # XML 转 JSON 实现
        pass

总结：中间件赋能 MCP 服务器的未来

FastMCP 中间件系统为开发者提供了强大的扩展能力，通过钩子机制与管道模型，实现了跨领域功能的无缝集成。从基础的日志记录到复杂的认证授权，中间件使 MCP 服务器能够在不修改核心逻辑的前提下，灵活应对各种业务需求。

随着 FastMCP 的持续演进，中间件将成为构建可观测、可扩展、安全可靠的 MCP 应用的核心组件。掌握中间件的设计与实践，将帮助开发者在构建 AI 驱动的工具调用系统时，更加高效地应对复杂的非功能需求，专注于核心业务价值的创造。

通过本文介绍的概念、示例与最佳实践，希望能帮助你在 FastMCP 开发中充分发挥中间件的潜力，构建出更加健壮、灵活的 MCP 服务器架构。

技术共进，成长同行——讯飞AI开发者社区

更多推荐

什么是 MCPo？

它通过标准化 RESTful API 接口，让复杂的工具变得易于使用，并支持与大语言模型（LLM）代理和应用程序的无缝交互。MCPo 的核心在于其代理功能，它能够动态发现 MCP 工具并生成 REST API 端点，同时提供人性化的 OpenAPI 文档。随着人工智能工具需求的增长，MCPo 有望成为连接 AI 工具与标准化接口的重要桥梁，为开发者提供更高效、更安全的解决方案。图像内容支持：现在可

讯飞AI开发者社区

深圳的GEO优化源头推荐

讯飞AI开发者社区

告别指令，迎接AI同事！Kimi“OK Computer”模式震撼登场

想象一下，你不再是人工智能的“指挥官”，而是拥有了一个能自主思考、规划，甚至亲自“动手”完成复杂任务的“数字同事”。这听起来像是科幻电影的桥段，但月之暗面（Moonshot AI）的Kimi，正用它全新推出的Agent模式“OK Computer”，将这一愿景带入现实。想象一下，你不再是人工智能的“指挥官”，而是拥有了一个能自主思考、规划，甚至亲自“动手”完成复杂任务的“数字同事”。