高通量组学数据庞大,数据分析流程复杂,因而在硬件资源有限的课堂教学环境中只能进行多媒体演示,导致课堂与实践严重脱节。 为解决这一难题,本研究利用生成式 AI 大模型协助本地开发的 python 脚本模拟生成涵盖 RNA-Seq、单细胞测序及宏基因组测序等领域的 轻量化组学数据,将数据量压缩至原始数据的 4.1% ~ 9.9%。经标准化分后,生成的轻量化组学数据在 RNA-Seq、单细胞测序及宏基因组测 序标准化分析任务的平均耗时分别缩短至原数据处理时间的 19.4%(73.7 ± 4.0vs 377.5 ± 10.1 分钟)、4.5%(83.1 ± 1.4vs 1866.7± 75.4 分钟)和 10.4%(77.4 ± 1.2 vs 743.4 ± 9.8 分钟);存储资源分别减少至原始数据的 9.2%、5.0%和 4.7%;内存峰值分别降低至原始数据 的 7.7%、18.4%和 22.6%。这些结果表明,生成的轻量化组学数据能够支持在 90 分钟的课堂内完成全流程分析实践。因此,本研究构建了 一个计算资源需求、时间与教学目标之间的动态适配机制,为医学生物信息学课堂教学提供了可扩展且高效的解决方案。