
天眼查APP显示,近日,浪潮电子信息产业股份有限公司申请的“训练数据的生成方法和电子设备”专利公布。 摘要显示,本申请公开了一种训练数据的生成方法和电子设备,涉及模型数据训练技术领域,通过训练后解析树模型的精准符号追踪和跨文件引用解析,生成的结构化数据更准确地反映了代码库中符号的使用情况和语义关系,为后续生成的训练数据提供了坚实的基础。关联结构化数据与技术规范文档,生成的知识库包含了代码符号的官方定义和功能描述,这能够极大地增强大模型对底层系统代码的理解能力。全局符号表的构建考虑到了条件编译和多架构支持,这使得生成的训练数据能够覆盖不同的编译配置和架构,增强了模型的泛化能力和实用性。因此,可以解决现有方案难以在复杂场景下生成有效训练数据的问题。
评论