# 示例数据说明 本文档说明如何使用示例数据来测试标注平台的功能。 ## 快速开始 ### 1. 确保服务器正在运行 **后端服务器:** ```bash cd backend python -m uvicorn main:app --reload --host 0.0.0.0 --port 8000 ``` **前端服务器:** ```bash cd web yarn nx serve lq_label ``` ### 2. 初始化示例数据 ```bash cd backend python init_sample_data.py ``` 这将创建 3 个示例项目和 6 个示例任务。 ## 示例项目说明 ### 1. 情感分析标注项目 **项目描述:** 对用户评论进行情感分类(正面/负面/中性) **标注配置:** - 单选分类 - 三个类别:正面、负面、中性 **示例任务:** 1. **文本分类任务-1** - 文本:这家餐厅的服务态度非常好,菜品也很美味,环境优雅,强烈推荐! - 预期标注:正面 2. **文本分类任务-2** - 文本:产品质量太差了,用了不到一周就坏了,客服态度也很恶劣,非常失望。 - 预期标注:负面 3. **文本分类任务-3** - 文本:这款手机性能一般,价格适中,适合日常使用。 - 预期标注:中性 ### 2. 命名实体识别项目 **项目描述:** 识别文本中的人名、地名、机构名和时间等实体 **标注配置:** - 文本高亮标注 - 四个实体类型:人名、地名、机构名、时间 **示例任务:** 1. **命名实体识别任务-1** - 文本:2024年1月15日,张三在北京大学参加了人工智能研讨会。 - 预期标注: - 时间:2024年1月15日 - 人名:张三 - 机构名:北京大学 2. **命名实体识别任务-2** - 文本:李明是清华大学的教授,他在上海交通大学获得了博士学位。 - 预期标注: - 人名:李明 - 机构名:清华大学、上海交通大学 ### 3. 文本高亮标注项目 **项目描述:** 标记文本中的重要信息、关键词和问题 **标注配置:** - 文本高亮标注 - 三个标签类型:重要信息、关键词、问题 **示例任务:** 1. **文本高亮任务-1** - 文本:机器学习是人工智能的一个重要分支,它使计算机能够从数据中学习并做出决策。深度学习是机器学习的一个子领域,使用神经网络来模拟人脑的工作方式。 - 预期标注: - 关键词:机器学习、人工智能、深度学习、神经网络 - 重要信息:从数据中学习并做出决策 ## 测试流程 ### 1. 查看项目列表 访问 http://localhost:4200/projects,你应该能看到 3 个示例项目。 ### 2. 查看项目详情 点击任意项目,查看项目信息和关联的任务列表。 ### 3. 开始标注 1. 在任务列表中点击"开始标注"按钮 2. 使用 LabelStudio 编辑器进行标注 3. 完成标注后点击"保存"按钮 4. 标注结果将被保存到数据库 ### 4. 验证标注结果 可以通过以下方式验证标注结果: **查看数据库:** ```bash cd backend python -c "import sqlite3; conn = sqlite3.connect('annotation_platform.db'); cursor = conn.cursor(); cursor.execute('SELECT * FROM annotations'); print(cursor.fetchall()); conn.close()" ``` **通过 API 查询:** ```bash curl http://localhost:8000/api/annotations ``` ## LabelStudio 配置说明 ### 文本分类配置 ```xml
``` ### 命名实体识别配置 ```xml
``` ### 文本高亮配置 ```xml
``` ## 清理示例数据 如果需要清理示例数据,可以删除数据库文件: ```bash cd backend rm annotation_platform.db ``` 然后重启后端服务器,数据库将被重新初始化为空。 ## 常见问题 ### Q: 运行脚本时提示连接错误 A: 请确保后端服务器正在运行在 http://localhost:8000 ### Q: 标注编辑器无法加载 A: 请检查: 1. 前端服务器是否正在运行 2. 浏览器控制台是否有错误信息 3. 项目配置是否正确(XML 格式) ### Q: 保存标注时提示错误 A: 请检查: 1. 是否完成了标注(标注结果不能为空) 2. 后端 API 是否正常工作 3. 浏览器控制台的错误信息 ## 更多信息 - LabelStudio 配置文档:https://labelstud.io/tags/ - 项目 GitHub:https://github.com/HumanSignal/label-studio