From da57a3b7bd60e24d6c089d12496f4106fb2b4d06 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E6=97=A0=E6=95=8C=E9=9C=B8=E7=8E=8B=E9=BE=99?= <2940543268@qq.com> Date: Thu, 15 Jan 2026 22:04:18 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E6=9B=B4=E6=96=B0README=E6=96=87?= =?UTF-8?q?=E6=A1=A3=E5=86=85=E5=AE=B9?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 添加批量分析测试数据说明和系统特色章节,包括UI界面风格描述 --- README.md | 15 +++++++++++++-- 1 file changed, 13 insertions(+), 2 deletions(-) diff --git a/README.md b/README.md index efdea63..a54080b 100644 --- a/README.md +++ b/README.md @@ -61,8 +61,12 @@ uv run streamlit run src/streamlit_app.py | 样本量 | 5,572 条 | | 特征数 | 1 个(短信文本) | +### 1.3 批量分析测试数据 -### 1.3 数据切分与防泄漏 +项目中提供了 [email_data.csv](file:///d:/sms-castle-walls/email_data.csv) 文件,该数据集包含多条中英文测试短信。该数据集可以用于系统的**批量文件分析处理**功能,验证系统对批量文件的自动化分析能力。 + + +### 1.4 数据切分与防泄漏 数据按 8:2 比例分割为训练集和测试集,确保模型在独立的测试集上进行评估。在数据预处理和特征工程阶段,所有操作仅在训练集上进行,避免信息泄漏到测试集。使用 TF-IDF 进行文本向量化时,同样严格遵循先训练后应用的原则。 @@ -190,7 +194,14 @@ Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. Text FA to 8 ``` -## 4️⃣ 开发心得 +## 4️⃣ 系统特色 + +### 4.1 UI 界面风格 + +本系统的 Web 界面采用了独特的**欧洲中世纪风格**(Medieval Style)。通过精心设计的 CSS 样式,界面融合了深色古堡背景、金色边框以及复古的衬线字体,旨在为用户提供一种“在城堡中审阅密信”的沉浸式操作体验。 + + +## 5️⃣ 开发心得 ### 4.1 主要困难与解决方案