主要更新: 1. 添加DeepSeek LLM集成(llm_integration.py) 2. 添加Pandera数据验证(data_validation.py) 3. 添加数据泄露风险检查(data_leakage_check.py) 4. 添加LightGBM模型支持 5. 修复infer.py中的欺诈概率计算逻辑错误 6. 更新pyproject.toml添加新依赖 7. 更新.env.example添加LLM配置 8. 添加欺诈检测测试脚本(test_fraud_detection.py) 9. 更新agent_app.py集成LLM功能 10. 更新train.py添加LightGBM模型 11. 更新data.py集成Pandera验证
- 删除未使用的flask依赖 - 为所有依赖指定版本号以确保一致性 - 依赖版本: - numpy>=1.24.0 - polars>=0.19.0 - scikit-learn>=1.3.0 - imbalanced-learn>=0.11.0 - matplotlib>=3.7.0 - seaborn>=0.12.0 - joblib>=1.3.0 - pydantic>=2.0.0 - streamlit>=1.28.0
- 添加项目基础结构,包括数据模型、训练、推理和Agent模块 - 实现数据处理、特征工程和模型训练功能 - 添加测试用例和文档说明 - 配置项目依赖和环境变量