生物信息学基础
生物医学信息学的概念的掌握
- 生物信息学很大一部分工作体现在生物数据的收集、存储、管理与提供
- 利用多组学数据(基因组,转录组,表观遗传组、蛋白组等)和机器学习、数据挖掘的方法 ,挖掘潜在的生物学、医学的知识和模式,用于解决诊断和治疗。
中心法则是什么
基因突变不可逆转,甲基化可逆转
不同尺度的多组学数据
- 解释:测到的组织的数据当成一个整体就是bulk,不当成一个整体,细胞层面的就是single cell ,如果知道单细胞的信息以及位置,就是空间层面的 spatial
转录组学
单个分子层面的事(识别和疾病相关的mrna的表达)找差异的分子
差异表达分析
T检验一般要求样本基数大,符合正态分布
特征选择的方法(多分类下的特征选择
实际面临的问题
数值过小几乎不表达的特征
样本不平衡的问题(疾病样本多,正常样本少)
不同组织不可直接比较
富集分析(前面的操作已经找到了差异表达的分子,接下来要获得功能)
- p_value 越小,表明越难,越优秀,显著性越小,k值越大,选出来的人越多,学院越优秀
生物网络(重点)
- 概率图模型
网络构建(由特征构建网络)
- 调控网络构建?
构建的三种方式
- 计算距离
- 回归
- lasso
网络关键节点识别(网络拓扑结构)
网络模块识别(社区发现)
- 谱聚类(用了特征向量)为了区分(找特性) 主成分分析(找共性)(特征值特征向量一应的物理意义)
网络链路预测
- 图神经网络(用图的信息学好了表征再对点进行聚类)
- 谱聚类(用图的信息和点的信息)
基因组学
序列比对
动态规划算法(!!!)
点阵法
疾病基因组分析
mutation rate
对下游……的影响
表观组学
甲基化
药物组学
老药新用
融合多组学
阶段性复习
智慧医疗
概念
医学图像
skd
医学文本
- 评价
生物场景的大模型
医学信息学