语言模型在生物研究中的应用
Information
Language models for biological research: a primer
Author:Elana Simon, Kyle Swanson & James Zou
Jounal:Nature Methods
Year:2024
Methods and Backgrounds
Language Model: 语言模型可以学习序列中的复杂模式,例如句子中的单词和蛋白质中的氨基酸。由于这些模型大多是在异构序列集合上训练的,因此它们可以学习灵活的模式,并且可以适应性解决各种特定问题。由于其适应性,因此通常作为支持广泛下游应用程序的基础模型。其训练过程往往包括预训练和微调两个部分,其中对更大的数据集进行预训练(无监督)为模型提供了对数据的基本理解,从而能够在微调期间更有效地学习新目标。
Abstract本文旨在介绍、回顾语言模型(基于Transformer架构)在生物学研究中的作用,其中预训练模型通过三种常见方法被用于研究:1.直接预测;2.embedding分析;3. ...
RNA-seq分析流程
记录一下学习RNA-seq分析的过程,整体流程参考,可能会补充一些其他的资料:
refer .a { color: white; font-size: 8px; text-decoration: none;}
refer a:hover { color: blue;}</style>
RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建
RNA-seq入门实战(一):上游数据下载、格式转化和质控清洗
RNA-seq入门实战(二):上游数据的比对计数——Hisat2+ featureCounts 与 Salmon
RNA-seq入门实战(三):从featureCounts与Salmon输出文件获取counts矩阵
RNA-seq入门实战(四):差异分析前的准备——数据检查
RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma的使用与比较
RNA-seq入门实战(六):GO、KEGG富集分析与enrichplot超全可视化攻略
RNA-seq入门实战(七):GSEA——基因集富集 ...
欢迎光临Eddie的blog
Welcome to Eddie’s blog!本博客基于Hexo+Github搭建,采用butterfly主题样式。由于能力受限,做的很丑hhhh这是我的第一篇博客,也可能没有第二篇如果有第二篇的话,那就有吧hhh希望有机会能在上面分享我的学习记录(仅代表个人的理解,可能希望对大家有帮助,也有可能误导大家笑死)
refer .a {
color: white;
font-size: 8px;
text-decoration: none;
}
refer a:hover {
color: blue;
}
记录一下学习RNA-seq分析的过程,整体流程参考,可能会补充一些其他的资料:
RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建
RNA-seq入门实战(一):上游数据下载、格式转化和质控清洗
RNA-seq入门实战(二):上游数据的比对计数——Hisat2+ featureCounts 与 Salmon
RNA-seq入门实战(三):从featureCounts与Salmon输出文件获取counts ...