PubChem-MCP-Server

liueic/PubChem-MCP-Server

3.2

If you are the rightful owner of PubChem-MCP-Server and would like to certify it and/or have it hosted online, please leave a comment on the right or send an email to dayong@mcphub.com.

The PubChem Chemical Safety MCP Server is a Model Context Protocol-based server designed to automatically retrieve chemical safety information such as toxicology, GHS safety classification, and chemical properties from compound names or CIDs.

Tools
3
Resources
0
Prompts
0

PubChem Chemical Safety MCP Server

一个基于 Model Context Protocol (MCP) 的化学安全信息服务器,用于从化合物名称或 CID 自动获取毒理、GHS 安全分类、化学性质等信息。

功能特性

  • 获取化合物基础属性信息(分子式、分子量、IUPAC名称等)
  • 获取 GHS 安全分类信息(信号词、象形图、危害声明)
  • 获取毒性实验数据(LD50、LC50等)
  • 支持批量查询和缓存机制
  • 基于 MCP 协议,可与 Claude Desktop 等 AI 客户端集成
  • 支持代理访问,解决网络连接问题

技术栈

  • 协议: Model Context Protocol (MCP)
  • 语言: Python 3.10+
  • 依赖管理: uv
  • 数据源: PubChem REST API
  • 缓存: 本地文件缓存
  • HTTP客户端: aiohttp (支持代理和重试机制)

安装与运行

1. 安装依赖

uv sync

2. 运行 MCP 服务器

uv run python -m pubchem_mcp.mcp_server

3. 测试服务器

uv run verify_mcp.py

MCP 工具

服务器提供以下 3 个 MCP 工具:

1. get_compound_info

获取化合物基础信息

  • 参数: name (化合物名称)
  • 返回: CID、分子式、分子量、IUPAC名称、SMILES等
  • 示例: get_compound_info("aspirin")get_compound_info("阿司匹林")

2. get_safety_info

获取 GHS 安全分类信息

  • 参数: cid (PubChem化合物ID)
  • 返回: 信号词、GHS象形图、危害声明、预防措施等
  • 示例: get_safety_info(2244) (阿司匹林的CID)

3. get_toxicity_data

获取毒性实验数据

  • 参数: cid (PubChem化合物ID)
  • 返回: 急性毒性、生态毒性、致癌性、生殖毒性等详细数据
  • 示例: get_toxicity_data(2244) (阿司匹林的CID)

使用示例

Python 客户端示例

import asyncio
from mcp.client.stdio import stdio_client
from mcp import ClientSession, StdioServerParameters

async def main():
    server_params = StdioServerParameters(
        command='uv',
        args=['--directory', '/path/to/project', 'run', 'python', '-m', 'pubchem_mcp.mcp_server']
    )
    
    async with stdio_client(server_params) as (stdio, write):
        async with ClientSession(stdio, write) as session:
            await session.initialize()
            
            # 获取化合物信息
            result = await session.call_tool('get_compound_info', {
                'name': 'aspirin'
            })
            print(result.content[0].text)

asyncio.run(main())

Claude Desktop 中使用

在 Claude Desktop 中可以直接使用自然语言查询:

请查询阿司匹林的安全信息
获取咖啡因的毒性数据

调试工具

使用 MCP Inspector 进行调试:

npx -y @modelcontextprotocol/inspector uv run python -m pubchem_mcp.mcp_server

项目结构

pubchem_mcp/
├── mcp_server.py          # MCP 服务器主文件
├── services/
│   ├── pubchem_client.py  # PubChem API 客户端(支持代理和重试)
│   ├── cache_service.py   # 缓存服务
│   └── pubchem_service.py # PubChem 服务层
├── models/
│   └── schemas.py         # 数据模型定义
└── api/
    └── routes.py          # API 路由(可选)

tests/                     # 测试文件
manage_cache.py            # 缓存管理工具
verify_mcp.py             # MCP 验证工具
claude_desktop_config.json # Claude Desktop 配置示例

配置选项

  • CACHE_DIR: 缓存目录路径(默认 .cache
  • PUBCHEM_RATE_LIMIT: API 请求限制(默认 5 req/s)
  • https_proxy: HTTPS 代理设置
  • http_proxy: HTTP 代理设置

缓存管理

服务器使用本地文件缓存来提高性能:

  • 缓存位置: .cache/ 目录
  • 缓存策略:
    • 化合物信息缓存2小时
    • 安全信息和毒性数据缓存1小时
    • 过期文件自动删除
  • 缓存管理: 运行 uv run manage_cache.py 查看缓存统计

网络配置

代理设置

项目支持通过环境变量设置代理:

export https_proxy=http://127.0.0.1:10808
export http_proxy=http://127.0.0.1:10808

重试机制

  • 自动重试503错误(服务器繁忙)
  • 递增等待时间避免过于频繁的请求
  • 最多重试3次

请求头优化

  • 使用完整的浏览器User-Agent
  • 添加必要的HTTP请求头(Accept、Referer等)
  • 支持gzip压缩

测试化合物

以下化合物已测试可用:

  • aspirin (阿司匹林) - CID: 2244
  • caffeine (咖啡因) - CID: 2519
  • water (水) - CID: 962
  • ethanol (乙醇) - CID: 702
  • benzene (苯) - CID: 241

故障排除

常见问题

  1. 503 错误: 服务器繁忙,会自动重试
  2. 网络连接失败: 检查代理设置是否正确
  3. 化合物未找到: 尝试使用英文名称或化学式

日志查看

服务器会输出详细的日志信息,包括:

  • 请求状态
  • 重试信息
  • 错误详情

开发

运行测试

uv run pytest tests/

代码格式化

uv run black .
uv run isort .

类型检查

uv run mypy pubchem_mcp/

许可证

MIT License

贡献

欢迎提交 Issue 和 Pull Request!