
mcp-server-fetch-python

2025.02.17
0
Python网页内容提取内容转换媒体处理浏览器自动化内容生成
mcp-server-fetch-python 是一个用于获取和转换网页内容的 MCP 服务器。它提供了一系列工具,可以从网页中提取内容,包括支持 JavaScript 渲染的内容和媒体文件。该服务器特别适合需要从网页中提取结构化数据或进行内容转换的场景。
View on GitHub
Overview
基本能力
产品定位
mcp-server-fetch-python 是一个专注于网页内容获取和转换的工具,旨在帮助用户从各种网页和媒体文件中提取和转换内容。
核心功能
- get-raw-text: 直接从 URL 提取原始文本内容,无需浏览器渲染。适用于结构化数据格式或需要快速直接访问的场景。
- get-rendered-html: 使用无头浏览器获取完全渲染的 HTML 内容。适用于现代 Web 应用程序和需要 JavaScript 渲染的单页应用。
- get-markdown: 将网页内容转换为格式良好的 Markdown。保留结构元素的同时提供干净、可读的文本输出。
- get-markdown-from-media: 从媒体文件(图像、视频)中执行 AI 驱动的内容提取。需要设置有效的 OPENAI_API_KEY 环境变量。
适用场景
- 从网页中提取结构化数据
- 获取需要 JavaScript 渲染的网页内容
- 将网页内容转换为 Markdown 格式
- 从图像和视频中提取文本内容
工具列表
- get-raw-text: 直接从 URL 提取原始文本内容。
- get-rendered-html: 获取完全渲染的 HTML 内容。
- get-markdown: 将网页内容转换为 Markdown。
- get-markdown-from-media: 从媒体文件中提取内容。
常见问题解答
- Q: 为什么
get-markdown-from-media
工具不起作用? A: 需要设置有效的 OPENAI_API_KEY 环境变量。 - Q: 遇到字符编码问题怎么办? A: 可以设置 PYTHONIOENCODING 环境变量为 "utf-8"。
使用教程
使用依赖
需要安装以下依赖:
- Python 环境
- UV 工具
- Git(用于本地安装)
安装教程
通过 Claude Desktop 使用
- 编辑 Claude Desktop 配置文件:
- MacOS:
~/Library/Application\ Support/Claude/claude_desktop_config.json
- Windows:
%APPDATA%/Claude/claude_desktop_config.json
- 添加以下配置:
"mcpServers": {
"mcp-server-fetch-python": {
"command": "uvx",
"args": [
"mcp-server-fetch-python"
]
}
}
本地安装
- 克隆仓库:
git clone https://github.com/tatn/mcp-server-fetch-python.git
cd mcp-server-fetch-python
- 构建项目:
uv sync
uv build
- 添加配置到 Claude Desktop 配置文件:
"mcpServers": {
"mcp-server-fetch-python": {
"command": "uv",
"args": [
"--directory",
"path\\to\\mcp-server-fetch-python",
"run",
"mcp-server-fetch-python"
]
}
}
调试方式
可以使用 MCP Inspector 进行调试:
npx @modelcontextprotocol/inspector uvx mcp-server-fetch-python
或
npx @modelcontextprotocol/inspector uv --directory path\\to\\mcp-server-fetch-python run mcp-server-fetch-python