# 基础依赖
python>=3.8

# PDF处理
pdfplumber>=0.10.0
PyMuPDF>=1.23.0
pdf2image>=1.16.0

# OCR
pytesseract>=0.3.10
Pillow>=10.0.0

# NLP和文本处理
spacy>=3.7.0
keybert>=0.8.3

# 向量数据库
pymilvus>=2.3.0
chromadb>=0.4.0
pinecone-client>=2.2.0

# 嵌入模型
langchain>=0.1.0
langchain-openai>=0.0.5
sentence-transformers>=2.2.0

# 知识图谱
networkx>=3.1.0

# 数据科学
numpy>=1.24.0
pandas>=2.0.0
scikit-learn>=1.3.0

# 其他
python-dotenv>=1.0.0
tqdm>=4.65.0
