积步千里申请大语言模型强化学习系统、方法及相关设备专利,实现多类异构运行环境的统一调用
发布日期:2025-12-16 13:18 点击次数:76
国家知识产权局信息显示,北京积步千里科技有限公司申请一项名为“一种大语言模型强化学习系统、强化学习方法及相关设备”的专利,公开号CN121072658A,申请日期为2025年8月。专利摘要显示,本申请提供一种大语言模型强化学习系统、强化学习方法及相关设备,系统包括:管理模块,用于对多类别价值函数进行统一管理和调用,具体包括:环境注册单元,用于建立全局注册表,存储环境函数与对应的元信息及与价值函数的映射关系;环境运行单元,用于根据唯一标识信息定位环境函数并实例化运行环境,调用环境函数获取运行结果,并结合大语言模型生成的回答输入至价值函数进行评价,获得奖励结果及结果类别;整合模块,用于基于价值函数的奖励结果与价值模型的奖励结果,生成适配于强化学习过程的奖励信号;训练模块,用于基于奖励信号更新大语言模型的策略参数。本申请实现了多类异构运行环境的统一调用,提升了模型跨任务的泛化能力。
天眼查资料显示,北京积步千里科技有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本30000万美元。通过天眼查大数据分析,北京积步千里科技有限公司拥有行政许可2个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
上一篇:卢浮宫或于22日重新开放
