对临床医生而言,临床工作与科研的双重压力日益加剧:既要完成繁重的临床任务,又面临晋升所需的科研产出要求。UK Biobank作为全球领先的大规模生物医学数据库,目的是探求一些特定基因、生活方式和健康状况之间的关系,提高对一些遗传类疾病致病基因的理解,包括癌症、心脏病、糖尿病和一些特定的精神疾病,为临床医生提供了突破时间和资源限制的独特机会。
UK Biobank数据库包含50万名40-69岁参与者的深度数据,收集了遗传、身体和健康数据,包括基因信息和血液样本、生活方式及环境暴露数据,并已对10万参与者进行了全身影像扫描,每人产生超过12,000张影像。这一前所未有的开放获取数据库使大量与健康相关的研究成为可能。
UK Biobank数据库资源规模空前
50万参与者的深度基因型数据与表型数据
全基因组测序数据覆盖所有参与者
15万参与者的全身多模态MRI扫描数据
长期随访数据包括住院、癌症登记、死亡登记等
10万样本的血浆蛋白质组学数据
5万样本的血浆代谢组学数据
一、培训目标:
1,掌握UK Biobank数据库申请全流程,有效规避申请过程中的典型错误。
2,通过临床科研真实案例,帮助学员高效获取并分析UK Biobank与临床实践紧密关联的数据。
3,将临床问题转化为可研究的数据科学问题,搭建从临床思维到研究实践的桥梁。
4,完成一项可直接应用于研究课题的项目方案,实现“学即能用”。
5,理解如何将UK Biobank数据与自有临床数据结合
二、培训时间: 2025年11月21日— 2025年11月24日 远程在线培训
(第一天数据及操作软件调试,共授课三天)
三、主讲专家:
来自清华大学、上海交通大学、中国科学院等高校医学生物信息学学科带头人、擅长各类型医学数据统计分析、生物医学大数据挖掘。发表数十篇专业领域内学术论文及SCI论文,主编或参与编写多部著作。参与多家三甲医院临床生物信息学的研究合作,科研及授课经验很丰富。
四、参加对象:
各省市、自治区从事临床医学、基础医学、生物医学工程等科室主任医师、副主任医师、住院医师等临床科研工作者相关人员;国内各重点大学、科研院所相关研究领域的博士、硕士相关研究生和学者等:
五、课程大纲:
一、UK Biobank基础与临床研究思路 | 1,UK Biobank简介与优势 UK Biobank资源概述:50万参与者、全基因组测序、多维数据 临床医生利用公共数据库发文的成功案例剖析 2,UK Biobank数据结构深度解析 健康相关结构数据:生活方式、环境暴露、个人与家族病史 基因数据:全基因组测序、芯片数据、功能注释 影像数据:全身MRI、心脏脑部成像、DEXA扫描 实验室数据:血液、尿液生物标志物 3,数据申请流程详解与技巧 分步演示数据申请流程 如何撰写高质量的研究计划提高申请成功率 常见申请被拒原因及避免方法 |
二、Research Analysis Platform(RAP)的使用及写作 | 1,生存分析数据的准备 发病时间的确定,生存状态的确定 2,协变量的准备 协变量的提取 协变量的处理(类型的变换、缺失值的处理) 3,构建比例风险模型 训练集和测试集数据生成 模型的训练、验证 结果可视化(三线表、森林图、热图) 敏感性分析的原则 敏感性分析的一般方法 4,组学数据的分析(以蛋白组学为例) 对缺失值进行多重插补 Lasso进行蛋白筛选 利用筛选蛋白进行模型构建(预测模型) 蛋白功能查询与注释 蛋白功能网络的构建 5,论文复现深度解析,案例论文拆解 研究问题的确定 数据选择与分析策略 6,论文写作技巧 方法描述、结果呈现与讨论框架 UKB 数据的伦理申明 UKB 数据的数据使用权限申明 |
三、 UK Biobank研究方法与案例实操 | 1,临床研究设计实战 基于UK Biobank的常见研究设计:队列研究、病例对照研究、全表型关联分析 临床变量选择与定义:ICD编码、自我报告、死亡登记数据 混杂因素识别与控制策略 2,背痛研究案例实操 案例背景:身体活动与背痛风险的关系——一项近期发表在Spine Journal的研究 实加速度计数据处理 + Cox模型构建 剂量反应分析 + 多基因风险评分分层 3,睡眠模式与2型糖尿病发病风险 基于加速度计的睡眠质量评估 时间序列分析与多变量调整 识别最佳睡眠时长与糖尿病预防的关联 |
四、 UK Biobank高级专题与个性化方案制定 | 1,晚发性精神分裂症可改变风险因素研究 案例背景:利用UK Biobank识别晚发性精神分裂症的109个可改变风险因素 分析方法: 暴露范围关联分析(ExWAS)方法 多变量Cox模型构建 人群归因分数计算 领域特异性风险评分 临床意义:展示如何通过改变风险因素预防高达89%的晚发性精神分裂症 2,肥胖新分类与死亡率研究 案例背景:基于新提出的肥胖分类系统分析不同肥胖类别与死亡率 分析方法: 临床肥胖与 preclinical 肥胖定义 死亡率数据关联 多变量调整与竞争风险模型 临床启示:超越BMI的肥胖评估在临床实践中的应用 3,AI与多组学在临床研究中的应用 UK Biobank中AI应用的典型案例 多组学数据整合分析策略 从单基因到通路分析的进阶方法 4,个人研究方案开发与指导 学员提出自己的研究想法 导师一对一指导完善研究设计 制定个人UK Biobank研究时间表与路线图 |
五、R语言临床医学应用实战 | 1,R语言分析肿瘤性疾病示例 TCGA数据下载 TCGA差异分析 功能富集分析 蛋白质互作网络分析 表达分析 生存分析 单因素cox回归分析 多因素cox回归分析 免疫分析 药敏分析 2,R语言分析非肿瘤性疾病示例 GEO数据下载 GEO差异分析 功能富集分析 蛋白质互作网络分析 表达分析 lasso回归分析 logistic回归 预后风险预测 |
六、辅助课程 | 1.学后交流、微信群、QQ群建立。 2.咨询、合作,技术团队深入探讨。 3.专题定制化内训。 |
六、国内外学者已见刊文章:
1,糖尿病和贫血之间的关联:来自NHANES和英国生物库的证据
2,共有490640名英国生物库参与者的全基因组测序
3,每日总体力活动量和强度、步数和癌症事件风险。来自英国生物库的证据
4,UKB-MDRMF:基于英国生物库数据的多疾病风险和多发病率框架。

5,肠易激综合征与全因和特定原因死亡率之间的时间依赖性关联:英国生物库内的一项前瞻性队列研究
6,心房颤动会增加全因性痴呆、阿尔茨海默病和脉管系统疾病的风险:英国生物库373415名参与者的队列研究

联系方式:
联系人: 毛泽璇(老师) 手机(微信同号):13311241619