mcp-server

dra2sun7/mcp-server

3.1

If you are the rightful owner of mcp-server and would like to certify it and/or have it hosted online, please leave a comment on the right or send an email to dayong@mcphub.com.

MCP Server is a RESTful API server that implements the Model Context Protocol to provide dynamic choice-based responses.

🧠 MCP Server

Model Context Protocol 기반 문서 처리 파이프라인
SEC EDGAR Filing 다운로드부터 Markdown 변환까지


📌 개요

이 프로젝트는 MCP (Model Context Protocol) 기반의 문서 처리 파이프라인을 구현합니다.
SEC EDGAR에서 회사 Filing을 다운로드하고, HTML을 PDF로 변환한 후, 최종적으로 Markdown으로 변환하는 완전한 워크플로우를 제공합니다.


🚀 주요 기능

📊 download_sec_filing

  • SEC EDGAR API를 통한 회사 Filing 자동 다운로드
  • 8-K, 10-Q, 10-K, DEF 14A 지원
  • CIK 기반 회사 검색 및 최신 Filing 선택

📄 html_to_pdf

  • HTML 파일을 PDF로 변환
  • Playwright를 활용한 실제 브라우저 렌더링
  • 배치 처리 지원

📝 read_me_markdown

  • PDF를 Markdown으로 변환
  • Docling 프레임워크 활용
  • 문서 구조 보존

📂 프로젝트 구조

mcp-server/
├── download_sec_filing/     # SEC Filing 다운로드 도구
│   ├── main.py
│   ├── requirements.txt
│   ├── tests/
│   └── README.md
├── html_to_pdf/            # HTML to PDF 변환 도구
│   ├── main.py
│   ├── requirements.txt
│   ├── tests/
│   └── README.md
├── read_me_markdown/       # PDF to Markdown 변환 도구
│   ├── main.py
│   ├── requirements.txt
│   ├── tests/
│   └── README.md
├── requirements.txt        # 메인 프로젝트 의존성
└── README.md              # 이 파일

🔄 워크플로우

1. download_sec_filing → HTML 파일 다운로드
2. html_to_pdf → HTML을 PDF로 변환  
3. read_me_markdown → PDF를 Markdown으로 변환

🛠️ 설치 및 설정

1. 기본 의존성 설치

pip install -r requirements.txt

2. Playwright 브라우저 설치 (html_to_pdf용)

pip install playwright
playwright install

3. 각 도구별 의존성 설치

# download_sec_filing
cd download_sec_filing
pip install -r requirements.txt

# html_to_pdf  
cd ../html_to_pdf
pip install -r requirements.txt

# read_me_markdown
cd ../read_me_markdown
pip install -r requirements.txt

🚀 사용 예시

1. SEC Filing 다운로드

cd download_sec_filing
python main.py

2. HTML을 PDF로 변환

cd html_to_pdf
python main.py

3. PDF를 Markdown으로 변환

cd read_me_markdown
python main.py

🧪 테스트

각 도구별로 테스트를 실행할 수 있습니다:

# download_sec_filing 테스트
cd download_sec_filing
pytest tests/

# html_to_pdf 테스트
cd ../html_to_pdf
pytest tests/

# read_me_markdown 테스트
cd ../read_me_markdown
pytest tests/

📚 참고 자료


본 프로젝트는 MCP 기반 문서 처리 파이프라인의 완전한 구현체입니다.