一种基于大语言模型的古诗词到视频的生成方法及装置

123技术园

首页 / 技术内容

2025-02-23 14:40

No.1343231020992045056

技术概要

PDF全文

本技术公开一种基于大语言模型的古诗词到视频的生成方法及装置，涉及视频生成技术领域。方法包括:构建古诗词知识库；根据大语言模型采用Soft Prompt训练方法，得到训练好的故事学习向量；根据待生成古诗词数据、对应的文本知识、训练好的故事学习向量以及大语言模型，得到待生成古诗词数据对应的故事；根据待生成古诗词数据对应的故事、预设的提示词以及大语言模型，得到待生成古诗词数据对应的剧本；根据剧本、图片知识以及图片生成模型，生成待生成古诗词数据对应的故事图片；根据故事图片以及视频生成模型，生成待生成古诗词数据对应的视频。采用本发明，可以解决古诗词视频数据集匮乏的问题，提升了古诗词视频的生成质量。

背景技术

中国传统文化博大精深，古诗词作为其精髓，承载着丰富的历史信息和深厚的文化底蕴。然而，目前关于古诗的研究主要集中在其翻译、生成图像方面，并不能完全展示古诗的意境，而视频具有丰富的模态表示。文生视频指的是输入一段自然语言文本然后将其转换为视频内容。现有的视频生成不能进行古诗词的视频的生成，因为古诗词的语义复杂和缺少必要的数据集。古诗词的翻译任务是指将输入的古诗翻译为其他语言，同时需要翻译后的内容符合古诗的意境。古诗“两个黄鹂鸣翠柳，一行白鹭上青天。窗含西岭千秋雪，门泊东吴万里船。”后的翻译内容：“Two golden orioles sing amid the willows green; A flock ofwhite egrets fly into the blue sky. My window frames the snow-crowned westernmountain scene; My door off says to eastward going ships “Goodbye!”，要求翻译后的内容符合中文含义，且符合意境。Cao等人提出了一个TongGu的大语言模型，专门用于古文中文理解（Classical Chinese Understanding, CCU）任务，研究者构建了一个两阶段指令调整数据集 ACCN-INS，为了减少知识密集型任务中 LLMs 生成的错误信息（hallucinations），研究者提出了一种基于知识增强的 CCU-RAG 方法，这种方法通过检索增强生成技术，显著提高了模型在知识密集型任务中的性能。Chen等人提出了使用检索增强的方法，通过添加历史背景信息，作者介绍，诗歌类型等内容，来增强古诗的翻译，取得了不少的提升。古诗词图片生成主要是输入古诗的内容，然后生成一张符合古诗的图片。Dan等人提出了一个新的任务，如何艺术化地将中国古典诗词可视化生成绘画作品，手动收集了3,648对丰子恺绘画作品的标题-绘画配对和从网络上收集了89,204对传统中国绘画风格的诗词-绘画配对，训练了两种代表性的文本到图像生成模型——AttnGAN和MirrorGAN，实现了将中国古典诗词转化为具有特定艺术风格的绘画作品Jiang提出了一个名为"Poetry2Image"的迭代修正框架，旨在解决从中国古典诗歌生成图像时文本到图像生成模型常见的关键元素丢失或语义混淆问题，通过引入一个外部数据集，让大预言模型检测出生成图片上的元素和古诗语义的区别，迭代的去完成图片的生成。现有的古诗词的任务：古诗词的翻译和图片生成，都不能充分反映古诗的意境；而针对于现有的文生视频模型来说，现有的视频生成模型大多是通过训练得到的端到端的模型，而古诗词视频缺少必要的训练的数据集，不能进行端到端的训练。古诗的语言往往简练而富有层次感，包含大量的意象、隐喻和情感，这些抽象的概念和深层的文化内涵对于现有的模型来说难以完全理解和处理。古诗背后蕴含着丰富的历史和文化背景，生成符合古诗意境的视频需要模型对这些知识有深入的理解。现有模型通常依赖于大规模训练数据，而这些数据可能未能充分涵盖古诗相关的文化知识，导致生成内容缺乏文化真实性，使得生成的古诗词视频质量较低。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

白雪峰裴振武陈科海张民

技术所属：哈尔滨工业大学（深圳）（哈尔滨工业大学深圳科技创新研究院）

相关技术

FPGA实现硬件逻辑实时仿真的方法及装置 FPGA实现硬件逻辑实时仿真的方法及装置
本申请实施例提供一种FPGA实现硬件逻辑实时仿真的方法及装置，方法包括:将待仿真的算法模型封装成可复用的可编程阵列逻辑器件的算法IP核,并在算法IP核中定义算法模型的输入输出端口和参数接口；通过可编程阵列逻辑器件的预设设计工具将顶层设计文件进行综合布局布线，生成对应的可在可编程阵列逻辑器件上直接运行的比特流文件,并将比特流文件下载至目标硬件平台启动运行；本申请能够有效提升仿真效率和准确性。
基于API和数据库的动态标定方法 基于API和数据库的动态标定方法
本发明公开了一种基于API和数据库的动态标定方法，在MPU端设计外部服务接口API，将MCU端的标定参数转化为MPU端外部接口API，让外部系统获取和修改标定参数；在MPU端通过特定的配置服务将外部系统提供的参数转化为数据库中的标定参数；MPU端数据库中标定参数被外部接口API修改后，MCU端对应的标定参数被同时修改。外部系统通过外部上位机或文件提供动态编写和验证功能，实现外部系统对标定参数的修改。本发明的技术方案可以方便地扩展和升级，支持更多的标定参数类型和格式，支持多个数据库和API接口，以及支持更多的外部系统和平台。
一种虚拟机的沙箱引擎更新方法、装置、设备和介质 一种虚拟机的沙箱引擎更新方法、装置、设备和介质
本发明公开了一种虚拟机的沙箱引擎更新方法、装置、设备和介质，由于该方法在虚拟机恢复到快照文件对应的状态后，通过对全局数据指针和检测函数的更新，就可以实现对沙箱引擎的更新，因此无需重新制作快照文件和沙箱环境，对沙箱引擎进行更新时需要制作的更新包较小，更新效率高。
频域响应仿真与测量数据处理方法及装置 频域响应仿真与测量数据处理方法及装置
本申请实施例提供一种频域响应仿真与测量数据处理方法及装置，方法包括:选择与试验测点相对应的位置作为与物理三维模型对应的仿真模型节点的选取位置，在仿真模型中将仿真有限元距离试验测点相对于相邻点间距离低于阈值时，将距离试验测点最近的有限元节点作为与试验测点相匹配的空间点，得到对应的空间分布比对结果；通过预设模态匹配算法对仿真结果数据与现场实测频率响应数据进行模态相关性分析，得到仿真结果数据与现场实测数据的模态匹配关系，根据模态匹配关系得到频域响应比对结果；根据空间分布比对结果和频域响应比对结果修正物理三维模型的仿真参数；本申请提高数据处理和比对的准确性，实现仿真数据与试验测量数据的实时整合和分析。
服务数据节点迁移方法、装置、电子设备及存储介质 服务数据节点迁移方法、装置、电子设备及存储介质
本公开提供了一种服务数据节点迁移方法、装置、电子设备及存储介质，所述方法包括:通过多个接口节点中第一接口节点的第一检测器，获得多个服务数据节点中与第一接口节点绑定的第一服务数据节点运行异常的检测结果；通过第一接口节点的第一检测器，响应于第一服务数据节点运行异常的检测结果，向服务控制节点发送服务迁移请求；通过服务控制节点，响应于服务迁移请求，解除第一接口节点与第一服务数据节点之间的绑定关系，将第一接口节点中的各服务迁移至多个接口节点中的第二接口节点，第二接口节点与多个服务数据节点中的一个具有绑定关系。借此，本申请可在检测接口节点的服务数据节点出现运行异常时，自动触发服务数据节点的迁移处理，确保服务的连续性和可用性。
配送控制方法、装置、服务器、智能柜及机器人 配送控制方法、装置、服务器、智能柜及机器人
本发明实施例公开了一种配送控制方法、装置、服务器、智能柜及机器人。所述方法在获取用于表征目标订单配送需求的配送需求信息后，响应于配送需求信息为机器人配送，向机器人发送取件消息，响应于接收到机器人发送的开门请求，控制智能柜打开目标柜格的第一柜门，以使所述配送物品转移到所述机器人的物品暂存格中。其中，所述目标柜格中存储有与目标订单对应的配送物品。通过所述配送控制方法可以降低配送成本，同时提高配送效率并改善用户体验。
适用于硬件电路的高精度压缩方法、装置及电子设备 适用于硬件电路的高精度压缩方法、装置及电子设备
本发明提供一种适用于硬件电路的高精度压缩方法、装置及电子设备，应用于图像处理技术领域，该方法包括:获取目标图像；将所述目标图像输入卷积神经网络模型；输出所述目标图像对应的图像类别；其中，该卷积神经网络模型是基于不同类别的图像训练得到的、经过压缩的神经网络模型，该卷积神经网络模型的每个卷积层中包括至少一组卷积核参数为卷积核共享参数。
融合多源信息的打击目标智能识别方法和系统 融合多源信息的打击目标智能识别方法和系统
本发明涉及目标智能识别域，具体是融合多源信息的打击目标智能识别方法和系统，该方法通过构建城市区域的实时三维模型获取遮挡区域的分布信息，通过数据融合方法得到打击目标的特征信息，通过空间对比分析预测打击目标进入的遮挡区域；通过动态滤波算法预测所述打击目标在所述遮挡区域的预测移动轨迹；通过所述预测移动轨迹和打击目标的特征信息得到打击目标在遮挡区域的实时位置；获取打击目标离开遮挡区域时的检测数据并通过特征匹配算法得到识别结果，当所述识别结果为无法确认打击目标时，则目标识别系统触发矫正机制。以解决打击目标进入隐蔽区域后，难以进行持续追踪并精确锁定目标，导致打击精度下降或丢失目标的问题。
水利对象关联关系建立方法 水利对象关联关系建立方法
本发明提供水利对象关联关系建立方法，从目标数据源获取建立水利对象关联关系的原始基础数据，所述原始基础数据至少包括:江河湖泊描述数据、水利工程描述数据、水利管理描述数据；对所述建立水利对象关联关系的原始基础数据进行预处理，以生成有效基础数据，所述预处理包括：去重、缺失值填补、错误值修正；通过对所述有效基础数据进行本体编码，以将不同类型的有效基础数据映射到同一标准下并使得关联与同一水利对象的不同类型的原始基础数据之间建立关联关系并生成有效基础数据之间的实体互联图谱；基于预先建立的水利对象拓扑关系，根据有效基础数据之间的实体互联图谱进行实体以及实体间功能关系的迭代，以建立水利对象关联关系。
问题解答方法、装置、介质和电子设备 问题解答方法、装置、介质和电子设备
本公开提供了一种问题解答方法、装置、介质和电子设备，所述方法包括:获取第一客户终端传送的第一解答请求；对所述问题音频进行音频语义分析，从所述问题音频中获得至少两个问题关键词；基于所述至少两个问题关键词对知识集进行匹配搜索，获得第一搜索结果；响应于不存在所述第一搜索结果，至少基于所述问题音频生成第二解答请求；将所述第二解答请求传送至第二客户终端，以便获得响应所述第二解答请求的解答信息，并传送至所述第一客户终端。从而降低了答疑教师的工作量，使复习者提出的问题能够及时解答，提高了答疑效率，也提高了复习者的复习效率。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工