“本源悟空”全球首次运行十亿参数级AI大模型微调任务

内容摘要    科技日报合肥4月7日电 (记者吴长锋 洪敬谱)记者7日从安徽省量子计算工程研究中心获悉,本源量子计算科技(合肥)股份有限公司、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在我国超导量子计算机“本源悟空”真机上,实现十亿参数级

联系电话:400-962-3929

    科技日报合肥4月7日电 (记者吴长锋 洪敬谱)记者7日从安徽省量子计算工程研究中心获悉,本源量子计算科技(合肥)股份有限公司、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在我国超导量子计算机“本源悟空”真机上,实现十亿参数级AI大模型微调任务的全球首次运行。

    实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。

    微调是指在通用大模型的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。量子计算凭借其叠加态和纠缠态特性,可同时探索海量参数组合,提升大模型微调的效率。

    本源量子计算科技(合肥)股份有限公司副总裁窦猛汉介绍,团队创新设计了“量子加权张量混合参数微调”,将模型权重转化为量子神经网络与张量网络混合架构,量子神经网络通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。“就好比给经典模型装上了‘量子引擎’,让两者协同发力。”窦猛汉说。

    实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。

    合肥综合性国家科学中心人工智能研究院副研究员陈昭昀说:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”

    “本源悟空”是目前我国先进的可编程、已交付超导量子计算机,已为全球139个国家超2300万人次提供量子算力云服务,完成35万个量子运算任务。

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: