球王会官网_官方网站

你的位置:球王会官网_官方网站 > 新闻动态 > 积步千里申请大语言模型强化学习系统、方法及相关设备专利,实现多类异构运行环境的统一调用

积步千里申请大语言模型强化学习系统、方法及相关设备专利,实现多类异构运行环境的统一调用

发布日期:2025-12-16 13:18    点击次数:76

国家知识产权局信息显示,北京积步千里科技有限公司申请一项名为“一种大语言模型强化学习系统、强化学习方法及相关设备”的专利,公开号CN121072658A,申请日期为2025年8月。专利摘要显示,本申请提供一种大语言模型强化学习系统、强化学习方法及相关设备,系统包括:管理模块,用于对多类别价值函数进行统一管理和调用,具体包括:环境注册单元,用于建立全局注册表,存储环境函数与对应的元信息及与价值函数的映射关系;环境运行单元,用于根据唯一标识信息定位环境函数并实例化运行环境,调用环境函数获取运行结果,并结合大语言模型生成的回答输入至价值函数进行评价,获得奖励结果及结果类别;整合模块,用于基于价值函数的奖励结果与价值模型的奖励结果,生成适配于强化学习过程的奖励信号;训练模块,用于基于奖励信号更新大语言模型的策略参数。本申请实现了多类异构运行环境的统一调用,提升了模型跨任务的泛化能力。

天眼查资料显示,北京积步千里科技有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本30000万美元。通过天眼查大数据分析,北京积步千里科技有限公司拥有行政许可2个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员



上一篇:卢浮宫或于22日重新开放
下一篇:两区教育局联合调研东风东番禺小学 共绘优质教育新蓝图