成都理工大学大模型及智能体聚合门户资料汇总
一、 直接使用的基础模型
(1)文本生成类模型
l Qwen-max场景介绍:推理能力强,速度较慢,适合复杂场景,如专业学术论文的摘要总结、公式推导、内容审校、专业报告撰写等。
l Qwen-plus场景介绍:推理能力中上,速度中上,适合大多数场景。
l Qwen-flash场景介绍:适合对速度要求高的问答场景,如意图识别、query改写、实时对话等。
(2) 向量 Emdedding /排序Rerank模型
l 向量模型场景介绍:qwen2.5-vl-embedding ,适用于视频分类、图像分类、图文检索等,将海量教学资料、科研文献、制度文件实现语义化检索,师生用自然语言提问即可快速找到相关内容,突破关键词匹配限制。
l 排序模型场景介绍:qwen3-rerank、gte-rerank-v2 ,支持对多语言文本召回的文档二次精准排序,重排模型根据研究主题精准排序,将最相关文献置顶,实现精准文献筛选和智能问答优化。
(3)图像生成、编辑模型
l 图片生成场景介绍:Qwen-image ,可用于教学课件配图丰富课件视觉效果;将实验数据、统计结果转化为图表、3D模型、流程图等可视化图像,增强论文和报告的表现力和可读性;学生社团快速生成招生宣传、学术讲座、校园活动等各类海报;为建筑学院、艺术学院生成建筑效果图、室内设计方案、艺术创作素材,辅助专业教学和设计实践训练;创建虚拟教师形象、卡通吉祥物、课程IP形象,应用于在线课程、教育游戏,增强教学互动性和趣味性。
l 详细介绍:
l 图片编辑场景介绍:Qwen-image-edit ,如报名、考试、毕业等标准化要求证件照批量处理;实验图像增强优化显微镜、望远镜等科研设备拍摄的模糊图像;档案资料修复修复老旧照片、历史档案中的破损、褪色、污渍;多媒体素材编辑为新闻宣传、公众号推送、视频制作提供高质量视觉素材支持;艺术作品二创辅助艺术设计类专业的创意教学和毕业设计创作。
l 详细介绍:
l OCR识别模型场景介绍:适合识别并结构化提取图表、票据中的各类信息,可应用于财税发票、手写书稿等的识别。
l 详细介绍:
l 图片翻译模型场景介绍:适合对各类图片进行还原翻译,如外国语学院的各类语言学习翻译辅助;快速翻译外文期刊论文、会议报告、学术专著,及时掌握国际前沿研究动态和成果;学术会议支持,国际会议演讲、问答互动、会议资料,促进中外学者深度交流和合作研究开展;翻译合作协议、交流项目材料、访问学者邀请函等文件,推动校际交流项目落地。
l 详细介绍:
l 多语言翻译模型场景介绍:实现文本、图片、网页等场景下的多语言翻译,快速翻译英文教材、外文文献、国际课程讲义中英互译,推动教学资源双向流通和共享;留学生教学支持,帮助国际学生理解课程内容,降低语言障碍,提升学习效果;在线课程国际化,将优质在线课程推向国际平台,扩大学校教育影响力和品牌认知。
l 详细介绍:
(4)视频生成模型Wan2.5、Wan2.6
l 场景介绍:微课视频制作,教师输入教学脚本自动生成知识点讲解视频;重现历史事件、文化场景、古代建筑风貌等动态过程,为历史、考古、文化遗产类课程提供沉浸式教学素材支持;生成医疗诊断、法律庭审、商业谈判等专业场景视频,为临床医学、法学、管理学等提供案例教学和角色扮演训练;将抽象概念、数学公式、物理原理转化为动态演示动画,帮助学生直观理解复杂知识,提升课堂教学效果;快速制作校园风光、专业介绍、学生访谈等招生宣传视频;生成校园环境漫游、建筑介绍、设施展示等全景视频,为新生入学、校友回访、线上开放日提供沉浸式体验服务。
l 详细介绍:
(5)深度研究模型
场景介绍:适合围绕学术或特定主题,进行深度搜索+内容分析+报告撰写。
(6)深度搜索
场景介绍:可结合互联网搜引擎,实现信息和数据实时搜索和问答。
(7)视频理解类模型
l 视频理解场景介绍:适合对视频进行理解,并进行推理描述,例如可将教学视频、实验视频进行识别理解并构建视频检索库。
详细介绍:
l 图片理解场景介绍:适合对图片进行理解,并进行推理描述,例如可用于特定物品、场景、人物的识别。
详细介绍:
二、 智能体场景应用
(1) 场景1: PPT自动生成AI助手
场景介绍 :实现课程设计、PPT 大纲生成、课件制作的完整闭环,支持教师导出 PPT 初稿、上传素材自主创作,搭配在线编辑、多格式下载及多风格模板,精准赋能人文社科教学,帮助教师摆脱重复工作、提升教学效率,进一步彰显学术引领价值。
(2) 场景2: 视频深度理解助手
场景介绍 :视频理解借助视频处理、视频理解、大语言模型的串联能力,支持视频描述、结构解析、标签分类、视频问答、内容挖掘、视频检索、分析场景等诸多应用。教师和学生可基于agent自带的模板快速调试,按需自定义视频分析流程,例如将讲座录像自动提炼为带时间戳的知识图谱,或将实验视频智能标注关键操作步骤,全面赋能混合式教学、学术研究与自主学习。
(3) 场景3: 公文写作神器
场景介绍 :支持对文稿、图片、视频内容做审核,借助“内容质量 + 事实准确 + 安全合规”三位一体能力,精准覆盖从草稿到发布的全链路内容治理需求。可以助力师生在毕业论文、基金申报等日常场景格式规范性检查、学术成果的事实准确性核验、教学课件的专业术语使用等场景使用;进而帮助师生快速定位问题并优化内容,大幅提升学术写作效率与成果质量,让研究者专注于核心创新工作,助力高校科研与教学成果的高质量输出。
(4) 场景4: 多模态智能资源搜索
场景介绍 :一款面向高校教学与科研需求的多模态智能搜索工具,采用多智能体multi-agent架构设计,具有开放、灵活、可扩展的特点。能够无缝对接校园内的多源异构数据库,包括学术文献、教学课件、实验数据表(Excel)、科研图片、讲座音视频、在线课程链接(URL)等资源类型。结合大模型驱动的语义理解、任务拆解与内容整合能力,该工具能够帮助师生快速定位所需资源——例如查找特定课题的文献综述、提取实验报告中的关键图表、或获取某领域专家的公开讲座谈话内容。精准赋能高校师生的学术研究与教学活动,让知识获取更加高效、便捷,助力构建智慧化校园。
(5) 场景5:会议记录AI助手
场景介绍 :自动将教师授课语音转写为文字记录并生成课堂笔记,提取知识要点形成结构化总结,方便学生复习和缺席学生补课学习。同时可以为学术会议、行政会议及科研访谈等学术场景自动整理决议事项、任务分工和时间节点,提高会议效率和执行跟踪管理。
(6)场景6:个人知识库AI助手
场景介绍:结合学校各类公共服务类数据或专业学术类数据,搭建对应的RAG智能体用于精确知识的检索问答。
(6)场景6:数据提取AI助手
场景介绍:将用户上传的文档资料(word、pdf、txt等)进行信息抽取、打标分类、内容审核和内容总结,将零散数据快速提炼成结构化高价值数据。