社会主义核心价值观评估模型项目展示板
文本内容
社会主义核心价值观评估模型
项目简介
大语言模型(Large Language Model, LLM)以其强大的内容生成能力成为推动传统行业与社会结构转型升级的关键驱动力。但由于训练数据的偏差与生成覆盖面的不足,大语言模型在赋能各行各业的同时也潜藏着各类意识形态风险。因此,湖南大学积极响应《生成式人工智能服务管理暂行办法》要求大语言模型必须坚持社会主义核心价值观的规定。依托湖南大学马克思主义学院、法学院、计算机学院,制定社会主义核心价值观相关评测指标体系;制作高质量的社会主义核心价值观评分集;构建具备随机抽取题目、自动评测和出具评估报告等多重能力,能够实现所有大模型社会主义核心价值观自动化评估的模型。该评估模型为支持大模型社会主义核心价值观对齐、防范化解意识形态风险、维护我国新时代意识形态安全提供了高质量的实践方案。
核心攻坚
1、社会主义核心价值观评测指标体系。
由湖南大学红色专家围绕社会主义核心价值观,从人民、国土、政治、军事等维度制定科学有效、系统完备的社会主义核心价值观评测指标体系。并基于该评测指标体系,生成质量高且覆盖面广的①评估正常场景下大模型核心价值观表现能力的被动评测提示集、②刻意引导大模型错误回答的主动评测提示集。
2、社会主义核心价值观评分集。
利用评测提示集和问答采集工具,采集各大模型多样化回答,制作社会主义核心价值观问答数据集。基于此,红色专家对单个问答数据进行合理评分,将问题回答质量评估为高、中、低三个等级,制作高质量、多元化的社会主义核心价值观评分集。
3、社会主义核心价值观评估模型构建。
通过大规模无监督训练,以及社会主义核心价值观评分集的微调训练,构建具备随机抽取题目、能接入不同大模型、自动评测和出具评估报告等多重能力的社会主义核心价值观评估模型。
(下方配有三个流程图:面向大模型的社会主义核心价值观测评模型效果示意、社会主义核心价值观问答评分集制备路线、社会主义核心价值观评估模型构建路线)
整体描述
这是一块关于社会主义核心价值观评估模型的线下项目展示板,分为「项目简介」与「核心攻坚」两大板块:
1. 项目简介:针对大语言模型(LLM)因训练数据偏差等问题存在的意识形态风险,依托高校多学院力量,打造可实现所有大模型社会主义核心价值观自动化评估的模型,为大模型价值观对齐、防范意识形态风险提供方案,还配有模型效果示意图。
2. 核心攻坚:详细阐述三大核心内容:
- 社会主义核心价值观评测指标体系:由高校红色专家从多维度制定指标体系,生成两类评测提示集;
- 社会主义核心价值观评分集:通过采集大模型多样化回答、专家评分,制作高质量评分集;
- 社会主义核心价值观评估模型构建:通过无监督训练与评分集微调,打造具备随机抽题、自动评测、生成报告等能力的评估模型,同时配有评分集制备和模型构建的流程图。
来源说明
这是一张拍摄的线下实体展示板照片,展示板带有湖南大学校徽,推测是湖南大学相关科研团队的科研项目成果展示,用于介绍针对大语言模型的社会主义核心价值观评估模型,可能在高校展厅、学术会议或科研成果展中展出。